데이터 표준화 ①


데이터가 경제적 자산이 되는 빅데이터 시대!

사회의 모든 영역에서 디지털화된 데이터가 생성되고 있습니다.

데이터는 다양한 시각에서의 분석과 예측 작업을 통해 다양한 정보를 제공해줄 수 있는데요,

이러한 데이터기업전략적 의사결정의 핵심요소가 된다는 점에서

신뢰할 수 있는 데이터에 대한 요구가 증대되고 있습니다.

기업에서 데이터를 의사결정의 요소로 활용하기 위해서는 데이터 품질이 높아야하는데요,

데이터 품질을 확보하기 위해서는 데이터 표준화가 필수입니다.




데이터 표준화란?

시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 것을 의미합니다.

간단한 예시로, A기업의 A 시스템에서는 남자와 여자 구분을 '1'과 '2'로 하고 있는데

B 시스템에서는 남자와 여자 구분을 'M'과 'F'로 구분을 하고 있는 상황입니다.


데이터 표준화는 이렇듯 각 시스템에서 동일한 정보를 다르게 표현하고 있는 것을

규칙(표준)을 정하여 전 시스템에 적용하는 것이라고 이해하면 됩니다.


위 예시처럼, 시스템 별로 동일한 정보를 다르게 표현한다면,

  1. 데이터의 중복 조직, 업무, 시스템별 데이터 불일치

  2. 데이터에 대한 의미 파악 지연으로 정보 제공의 적시성 결여

  3. 데이터 통합의 어려움

  4. 정보시스템 변경 및 유지 보수 곤란


등의 문제점이 발생할 수 있습니다.


이러한 문제점들은 데이터 표준화를 통해 해결할 수 있습니다.

  1. 명칭의 통일로 인한 명확한 의사소통의 증대

  2. 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소

  3. 데이터에 대한 접근성을 높임으로써 데이터의 가치 상승

  4. 정보시스템 간 데이터 인터페이스 시 데이터 변환 및 정제 비용 감소



 

데이터 표준화 주요 고려사항

ⓐ데이터 명칭 표준화

데이터 명칭은 대상 개념·정보를 표유하기 위한 고유한 이름으로 데이터의 접근성에

가장 큰 영향을 끼칩니다.

데이터 명칭은 다음의 요구사항에 맞추어 표준화를 하는 것이 필요합니다.


ⓑ데이터 정의 명확화

데이터 정의는 데이터가 의미하는 바를 규정하는 것으로, 사용자가 데이터를 잘 이해할 수

있도록 업무 관점에서 범위와 자격 요건을 명시해야 합니다.

관련 업무를 모르는 사람도 잘 이해할 수 있도록 제3자 입장에서 기술하는 것이 필요합니다.


ⓒ데이터 형식(TYPE) 설정

데이터의 표현 방식을 정의하는 것으로 업무 규칙과 사용 목적에 맞는 정의가 필요합니다.

데이터 타입, 데이터 길이, 소수점 자릿수 등 유사한 데이터 간의 통일성을 고려하여 형식을 지정합니다.

다음은 일반적으로 사용되는 데이터 형식입니다.


ⓓ데이터 규칙 정의

발생가능한 데이터 값을 사전에 정의하여 데이터의 정합성을 향상시키는 것으로

기본값, 허용값, 허용 범위 등을 정의합니다.




 

데이터 표준화 구성요소

전사적인 데이터 표준화를 추진하기 위해 수립해야 할 표준화 구성요소는

데이터 표준, 데이터 관리 조직, 데이터 표준화 절차입니다.


ⓐ데이터 표준

데이터 표준화는 기본적으로 데이터 모델 및 데이터베이스에서 정의할 수 있는

모든 오브젝트를 대상으로 수행하는 것이 이상적이지만,

주로 관리해야 될 필요성이 있는 오브젝트만을 대상으로 수행하는 것이 효율적입니다.

일반적인 데이터 표준관리 대상은 용어, 단어, 도메인, 코드 가 있습니다.


ⓑ데이터 표준관리 조직

전사적으로 수립된 데이터 표준 원칙, 데이터 표준, 데이터 표준 준수 여부 관리 등을 위해서는 데이터 관리자(DA, Data Administrayor)의 역할이 요구됩니다.

데이터 관리자는 하나의 기업 또는 조직 내에서 데이터에 대한 정의, 체계화, 감독 및

보안 업무를 담당하는 관리자를 의미합니다.

이러한 데이터 관리자는 기업 또는 조직 전반에 걸쳐 존재하는 데이터에 대한 관리를

총괄하고 정보 활용에 대한 중앙 집중적인 계획 수립 및 통제를 수행합니다.

데이터 관리자의 역할은 위와 같이 정리할 수 있습니다.

ⓒ데이터 표준화 절차

일반적인 데이터 표준화 절차는 다음과 같습니다.


 


표준 단어/용어/도메인/코드 등 표준 데이터를 정의하는 방법은 다음 글에서 다루도록

하겠습니다.

























42 views1 comment

Recent Posts

See All