데이터 거래의 활성화
상태바
데이터 거래의 활성화
  • 조현주
  • 승인 2021.12.21 11:06
  • 조회수 385
  • 댓글 0
이 콘텐츠를 공유합니다

 

데이터거래의 시작

이제는 많은 기업이나 공공기관에서는 데이터를 쌓는 것에만 집중하지 않는다. 우후죽순 쌓여만 가는 내부 데이터를 어떤 데이터와 결합해 성과를 낼 수 있는지? 외부의 질(Quality) 좋은 그리고 분석·활용 가치가 높은 데이터를 어디에서 얻을 수 있을지 고민하고 있다.

분석·활용 가치가 높은 데이터는 개인정보나 민감정보가 다수 포함되어 있는 경우가 많아 개인정보보호 등의 문제로 활용하지 못했다. 그러나 2020년 데이터 3법 개정, 데이터결합전문기관의 등장 등으로 지금까지 활용하지 못한 데이터셋을 그리고 타 분야의 유용한 데이터를 내가 가진 데이터와 결합하여 활용할 수 있게 되었다.

Figure 1 프라이버시 수준과 데이터 유용성 관계 (데이터 결합과 익명화, KIPA 조사포럼 Vol.32, 김승환, 2020.03)

 

    결합전문기관과 데이터전문기관

2020년 8월 데이터 3법 개정·시행으로 가명 정보 결합 제도가 도입되었고, 전문적으로 개인정보, 신용정보, 민감정보 등을 가명처리하고 데이터 결합을 위한 “결합전문기관”과 “데이터전문기관”이 지정되었다. “결합전문기관”과 “데이터전문기관”은 영향 받는 법령(개인정보보호법, 신용정보법)과 대상 데이터 영역에 따라 호칭은 다르지만 두 전문기관의 역할은 사실상 동일하다.

개인정보보호법은 전체 산업을 아우르는 법률로 개인정보보호법 28조의 3에 의해 “서로 다른 개인정보 처리자 간의 가명정보의 결합을 수행’하고, ‘결합된 정보의 외부 반출을 승인하는’ 것으로 정의하며 “전문기관” 혹은 “결합전문기관”으로 표현하고 있다.

반면 신용정보법에서는 신용정보와 관련된 조직에 관한 법률로 대상 데이터 영역이 신용정보로 한정된다. 신용정보법 제26조의 4에서는 결합전문기관을 ‘정보집합물의 결합과 익명처리의 적정성 평가를 전문적으로 수행하는 법인 또는 기관’으로 정의하며 “데이터전문기관”으로 표현하고 있다.

 

 

2021년 12월 현재까지, 총 17개 결합전문기관, 총 4개의 데이터전문기관을 통하여 통계 작성, 과학적 연구, 공익적 기록 보존 등의 목적인 경우, 성명·주민등록번호·연락처 등 개인을 식별할 수 있는 개인정보와 신용정보, 병명·정치적 견해 등 민감정보를 가명처리할 수 있고, 기관간 데이터 결합도 가능해졌다.  

 

Table 1 결합전문기관과 데이터전문기관 지정 현황(2021.12)
Table 1 결합전문기관과 데이터전문기관 지정 현황(2021.12)

 

결합전문기관은 서로 다른 정보 처리자간(신청기관 A, 신청기관 B)의 가명 정보 결합을 주로 수행한다. 이때, 안전하게 가명 정보를 결합하고 처리하기 위하여 기술적·관리적·물리적 보안 조치된 시설이나 시스템을 보유하고 있어야 하며 데이터 결합·반출 등 가명 정보 결합에 관한 정책이나 공정한 절차, 전문성을 갖춘 조직 등 체계를 갖추고 있어야 한다.

 

Figure 2 가명 정보 결합·반출 절차(가명 정보 처리 가이드라인, 개인정보보호위원회, 2021)
Figure 2 가명 정보 결합·반출 절차(가명 정보 처리 가이드라인, 개인정보보호위원회, 2021)

데이터거래 사례

2020년 11월 의료와 인구, 금융과 보훈, 통신과 유통 등 결합전문기관을 통해 5대 분야 7개 시범사례가 선정되었다. 약 1년이 흐른 현재, 3개를 제외한 4개의 시범사례는 유의미한 성과를 내며 종료되었다. 이를 통해 민간과 공공 데이터간 결합 가능성, 민간 기업간에 산재된 데이터 활용 가능성을 확인할 수 있었다.

Table 2 가명 정보 결합과 사례발굴 현황 – 5대 분야 7개 시범사례 (개인정보보호위원회, 2020.11)
Table 2 가명 정보 결합과 사례발굴 현황 – 5대 분야 7개 시범사례 (개인정보보호위원회, 2020.11)

 

데이터거래 활성화는 생각보다 빠르게 확대되고 있지는 않다.

 

Figure 3 결합전문기관 분야별 가명 정보 결합 추진 현황 (개인정보보호위원회, 2021.07)
Figure 3 결합전문기관 분야별 가명 정보 결합 추진 현황 (개인정보보호위원회, 2021.07)

 

하지만 다양한 이종산업간 데이터의 이용 활성화를 기대했으나, 여전히 금융, 보건의료, 통신, 유통 분야에 한정된 데이터만이 연계되어 다양한 산업 분야로의 연계 확산 속도는 저조하다. 또한 국민이 체감할 수 있는 새로운 부가가치 창출 등의 성과는 크게 눈에 띄지 않는다. 그 이유는 무엇일까?

 이유 1. 데이터 가명처리, 결합 과정에서 정보손실 증가

첫 번째 이유는 개인을 재식별할 수 없도록 가명·비식별처리를 수행하면서 발생하는 정보 손실이다. 가명처리를 위해 개인 식별 가능 정보를 평균값으로 대체하거나 총계 처리, 값 삭제, 범주화, 마스킹 등의 비식별화 조치하게 된다. 일정 수준 이상 정보손실이 발생되면 사실상 데이터 활용 가치가 없어지며, 결합률이 현저히 낮은 경우에도 유용한 분석 결과 도출을 보장할 수 없다.

Figure 4 개인정보 가명처리 절차 (가명 정보 처리 가이드라인, 개인정보보호위원회, 2021)
Figure 4 개인정보 가명처리 절차 (가명 정보 처리 가이드라인, 개인정보보호위원회, 2021)

이유 2. 가명처리 기술이 있지만 안전성에 대한 불안감 존재

두 번째, 추가 정보의 사용 없이 특정 개인을 알아볼 수 없는 가명 정보임에도 개인정보 혹은 민감정보가 재식별되어 개인 프라이버시가 침해되는 것이 아닌가에 대한 우려 섞인 목소리가 여전하다. 가명 정보 처리를 위한 ISO/IEC 20889, k-익명성 등 다양한 기술과 모델이 있으나, 불안과 우려를 해소하기에는 역부족이다.

 

Table 3 개인정보 가명처리 기술 종류 (가명 정보 처리 가이드라인, 개인정보보호위원회, 2021)

Table 3 개인정보 가명처리 기술 종류 (가명 정보 처리 가이드라인, 개인정보보호위원회, 2021)
Table 3 개인정보 가명처리 기술 종류 (가명 정보 처리 가이드라인, 개인정보보호위원회, 2021)

 

가명정보 활용 컨설팅

가명 정보 활용 욕구는 충분하나 가명 정보를 결합하는 조건, 가명 처리 절차, 데이터 거버넌스 부재 등으로 어려움을 겪고 있는 기관이나 기업이 많다. 무엇을 어디에서부터 준비해 나가야 할지 막막한 경우 정부에서 제공하는 컨설팅 서비스를 이용할 수 있다.

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.