디지털 시대, 데이터의 기본은 무엇인가?
상태바
디지털 시대, 데이터의 기본은 무엇인가?
  • 이호재 전무
  • 승인 2019.04.22 04:39
  • 조회수 3836
  • 댓글 0
이 콘텐츠를 공유합니다

아드 폰테스!

‘아드 폰테스(ad fontes)’라는 라틴어가 있다. 기본으로 돌아가라(Back to Basics)라는 말이다. 르네상스 시대 인문주의 학자들이 과거에 찬란했던 로마나 그리스 문화로 돌아가자는 얘기였다. 당시 종교개혁자들도 타락한 기독교를 향해 ‘아드 폰테스’를 외쳤다. 기독교 신앙의 원천인 성경말씀으로 돌아가자는 것이었다.

요즘에도 ‘기본으로 돌아가라’는 말이 유행처럼 사용되고 있다. 위기를 맞았을 때 흔히 하는 얘기가 ‘기본으로 돌아가자’다. 무슨 일이건 기초가 중요하다는 것은 당연한 말이다.

기업 경영이나 주식투자도 마찬가지다. 기업경영도 위기를 만났을 때 기본으로 돌아가자고 한다.워런 버핏과 같은 위대한 주식투자가도 투자할 때 주가의 흐름 자체 보다는 현금흐름, 투자자본에 대한 순이익률 등 회사의 기본적 재무요소를 바탕으로 산출된 ‘기본적 가치(fundamental value)’를 보고 ‘장기투자’를 한다.

 

데이터는 어렵다

디지털 조직이 디지털 시대의 적합한 청사진을 제시하기 위해 현재 데이터 관리체계와 데이터의 품질을 확인하는 순간 좌절을 경험하는 경우가 많이 발생하고 있다. 내∙외부의 다양한 빅데이터를 활용하면서 대규모의 정보계와 분석계를 운영하고 있지만, 분석 결과에 대해서 실제 경영진과 현업부서의 신뢰도와 만족도가 높지 않다.

디지털 시대 이전에도 동일한 문제가 있었다. EIS(Executive Information System, 경영자 정보시스템)를 통해 CEO나 임원들이 전략적 의사결정에 도움이 되고 전체 사업과 그 기능 부서의 활동을 감독하는데 필요한 정보를 제공 받았다. EIS에서 제공되는 데이터는 기업의 모든 데이터를 통합하고 가공하는 여러 과정을 통해 만들어 진다. 여기에 수작업 데이터가 포함되는 경우도 있었다. 이렇게 힘들게 만들어진 데이터가 초기 안정화 이후 시간이 흐르고 비즈니스 환경 변화로 새로운 상품과 서비스가 출시가 되면서 전달 정보의 정확도와 신속성에 문제가 발생하는 경우가 생겼다.

최근 디지털 시대가 도래하면서 많은 기업들이 다양한 분석 기법과 분석 툴의 사용이 보편화 되고 있다. 여기에 인공지능(AI)을 활용한 분석 사례들도 자주 발표되고 있다. 그러나 이러한 화려함 속에 감춰진 현실에서의 고충들이 있다. 데이터를 수집하고 가공하는데 너무나 많은 노력이 들어 가고, 데이터 품질을 확보하기는 점점 더 어려워 지고 있다.

데이터의 근본적인 문제 해결 없이 경영활동과 디지털화를 지원하기 위해 화려한 데이터 활용만 강화하는 것은 사상누각이다. 기업이 지금 ‘아드 폰테스’를 외쳐야 할 순간이다.

 

조직과 정책이 필요하다

데이터는 경쟁력의 차이를 결정하며, 새로운 비즈니스를 만들어낼 수 있는 자원이다. 지금까지 대부분의 기업들은 데이터 관리를 위한 조직을 두지 않았다. 데이터 전담 임원도 없었다. 이런 상태에서는 데이터를 관리하기도 어렵고, 데이터 효과를 발현할 수도 없다. 최근 지주회사 및 은행 중심으로 데이터 전담 임원(CDO, Chief Data Officer)을 두는 경우가 늘어나고 있다. 또는 디지털 전담 임원(CDO, Chief Digital Officer)에게 데이터 관리 및 활용 업무를 맡기기도 한다.


데이터 전담 임원이 결정되면 산하에 데이터 전담 조직을 구성한다. 데이터 전담 조직이 우선적으로 해야 할 업무는 다음과 같다.


1. 그룹 및 전사 차원의 데이터 정책 수립
2. 현행 데이터 수준 파악 및 향후 로드맵 기획
3. 기준 데이터 관리 등 데이터 거버넌스 체계 정립
4. 데이터 관련 법규 및 규제 대응 방안 수립
5. 데이터 분석 등 활용 확산 기획 및 지원
6. 그룹 및 전사 데이터 관리 및 활용 역량 확보 및 향상 총괄
7. 외부 데이터 발굴 및 연계 활용 기획
8. 데이터 축적, 관리, 공유, 활용 등을 위한 클라우드 도입 등 기술 아키텍처 수립


현행 데이터 관리체계 무엇이 문제인가?

데이터 품질관리 시장은 최근 7년간 연평균 7.3%의 성장률을 보이고 있다. 공공 데이터 개방 정책의 확대 추진에 따른 내∙외부 시스템의 통합 및 연계가 빈번해지면서 품질관리의 중요성이 부각되었기 때문이다. 여기에 4차 산업혁명 시대가 오면서 많은 기업과 공공기관들이 빅데이터 분석, 오픈 플랫폼, 클라우드 기술 적용 등으로 데이터 서비스 확산에 따른 지속적 품질관리 수요가 증가되고 있다.

투이톡_데이터_1.jpg
[그림 1] 데이터 품질관리 시장 규모 (출처: 데이터산업 현황조사 결과 보고서, 한국데이터베이스진흥원, 2017)

이처럼 많은 기업들이 지속적으로 IT조직을 중심으로 데이터 표준화와 품질관리에 많은 투자를 하고 있다. 그러나 현업에서 느끼는 다양한 데이터 문제는 계속 발생하고 있다.
 

투이톡_데이터_2.jpg
[그림 2] 데이터 관리 현실

그 동안 기업들이 데이터 문제를 해결하기 위해 시대별로 어떠한 시도를 했는지 알아보자.

단위 시스템 별로 데이터 관리를 하던 시절에는 데이터 용어의 통일이 안되었기 때문에 이를 해결하기 위해 전사 데이터 통합 관점의 데이터 표준화 작업을 수행하였다. 그러나 데이터 표준화 노력과 데이터 통합 노력에도 데이터 값 등 데이터 품질의 일관성 및 정확성 문제는 지속적으로 발생했다. 그래서 이를 해결하기 위해 IT조직을 중심으로 데이터 관리체계를 수립했다.

그러나 외부와의 다양한 데이터 교류가 발생하는 연결시대가 오고, 새로운 형태의 오픈 비즈니스가 추진되면서 IT조직 중심의 데이터 관리체계는 한계에 부딪혔다. 이를 해결하기 위해서는 IT와 현업이 함께 전사 데이터 거버넌스 조직을 구성해야 한다. 이 데이터 거버넌스 조직을 통해 데이터의 사전적 통제를 기반으로 정확한 데이터의 기준 및 분류체계 등을 마련하여 현업과 IT가 오너십을 갖고 주도적으로 데이터를 관리해야 한다.

지금도 다양한 데이터 관리체계를 통해 품질관리 활동을 수행하고 있지만 지속적으로 데이터 문제가 발생한다. 그 원인에 대해 알아보자.

 

현행 데이터 문제점

데이터 중복 문제
데이터 표준, 품질 및 데이터 통합을 기반으로 데이터 관리체계를 운영하지만 데이터 중복 문제가 발생하고 있다. 이것은 전사적으로 동일 데이터에 대한 통합 관리 기준이 없기 때문이다. 중복이 발생하는 경우 일반적으로 비즈니스 영역별로 독자적인 오너십을 갖고 데이터를 생성하고 있다. 동일한 데이터를 여러 시스템을 통해 획득할 수 있지만, 가장 정확하고 우선적이고 지속적으로 관리하려면 핵심(Core) 시스템을 정의하고 데이터를 관리해야 한다. 이를 기반으로 연관 시스템은 중복해서 데이터를 획득하지 말고 핵심(Core) 시스템의 데이터를 활용하는 것이 필요하다. 물론 연관 시스템이 독자적으로 관리할 데이터 속성에 대해서는 전사적으로 데이터 획득 우선권이 부여된다.

데이터 분류체계 문제
전사 표준분류체계 및 다양한 목적성 분류체계를 구성하기 위한 전사 분류기준 및 원칙 등이 부재하여 MECE(Mutually Exclusive Collectively Exhaustive, 상호배제와 전체 포괄 원칙)에 위배되는 경우가 발생하고 있다. 그래서 전사관점에서 보면 다양한 분류기준으로 인해 담당자 간의 의사소통의 어려움과 경영진 의사결정 지원을 위한 정확한 데이터 제공의 어려움이 발생하고 있다.

투이톡_데이터_3.jpg
[그림 3] 데이터 중복과 분류체계


데이터 일관성 문제
고객, 상품 등 업무시스템에서 처리되는 데이터와 채널시스템에서 처리되는 데이터, 그리고 분석시스템에서 처리되는 데이터 간에 일관성을 유지하기 위한 식별기준 및 원칙이 부재한 상태로 관리되고 있다. 그래서 고객과의 거래 발생시 채널시스템, 업무시스템, 분석시스템에서 고객 데이터가 동일 고객인지 식별하기 어려운 경우가 발생한다. 신규 상품 및 서비스 제공과 관련하여 실적 연계 시에도 상품 데이터의 식별기준 및 원칙 미비로 일관성 문제가 발생하여 분석(Analytics) 영역에서 데이터 분류에 문제가 발생한다.

투이톡_데이터_4.jpg
[그림 4] 데이터 일관성

●  데이터 관리 시점 문제

현행 데이터 품질관리는 새로운 비즈니스와 관련하여 데이터 표준화 적용 이외에는 대부분 사후 데이터 품질관리를 통한 품질 향상에 중점을 두고 있다. 그래서 데이터 사용 중 데이터 문제가 발생하더라도 예방 조치를 위한 전사 관리체계가 부족하여 사후적으로 데이터 생성 후 테이블 상호 품질 검증을 통해 문제를 발견하고 조치하는 한계를 보이고 있다.

 ● 데이터 Life Cycle 문제
데이터의 생성, 변경 및 폐기 프로세스에 대한 정의 및 데이터 오너십을 가진 조직의 데이터 승인 절차 등 데이터 Life Cycle에 대한 관리 역할이 체계적이지 않다. 그래서 데이터 생성시점부터 업무별 오너 부서의 데이터 검증 등 통제가 잘 안되고 있어 데이터 중복 및 일관성 문제가 지속적으로 발생하고 있다. 그리고 데이터 폐기 기준이 없거나 지연되어 불필요한 데이터가 집계 및 평가에 사용되어 정확성 문제가 발생하는 경우도 있다.

투이톡_데이터_5.jpg
[그림 5] 데이터 관리시점 및 Life Cycle

연결(Connectivity)시대가 오면서 새로운 데이터가 지속적으로 발생하지만 현행 사후적 데이터 품질관리체계 만으로는 디지털 시대에 적합한 데이터 품질을 확보하여 활용하는데 부족함이 있다. 그렇다고 모든 데이터의 품질을 확보하기 위해 전사 임직원이 많은 시간을 투자하는 것은 현실적으로 불가능하다. 2부에서는 이러한 데이터 문제를 해결하기 위한 방안에 대해 설명하겠다.


- 끝 -

 

본 칼럼은 ‘마스터 데이터 관리, 어떻게 도입할 것인가?’로 이어집니다.

 


 

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.