조충희 기자 choongbiz@businesspost.co.kr2024-05-30 16:43:35
확대축소
공유하기
[비즈니스포스트] 개인정보보호위원회가 개인정보 유출이나 권리 보장 문제를 발생시키지 않는 합성데이터 참조모델을 마련했다.
개인정보보호위원회는 30일 인공지능(AI) 학습에 필요한 합성데이터의 안전한 생성과 활용을 돕기 위해 합성데이터 참조모델 5종을 공개했다.
▲ 개인정보보호위원회가 합성데이터의 안전한 생성과 활용을 돕기위한 참조모델을 마련했다.
합성데이터는 실제 데이터와 통계적 특성이 유사하여 실제 데이터 분석결과와 유사한 결과를 얻을 수 있도록 새롭게 생성해낸 가상의 데이터를 가리킨다.
실제 데이터의 유용성을 최대한 유지하면서도 원본데이터에 포함된 개인이 식별되지 않도록 하는 것이 핵심으로, 개인정보의 일부 또는 전부를 변형하는 ‘비식별 처리(익명처리)’와 구분된다.
실제로 존재하는 것이 아니기 때문에 개인정보 유출이나 권리 보장 문제가 발생시키지 않아 대표적인 프라이버시 보호 기술로 꼽힌다.
이번 참조모델에는 △구강 이미지 △안전모 착용 이미지 △혈당 측정정보 △통신사 멤버십 사용 내용 △기업 주주와 대표자 정보 등 5가지 종류의 합성데이터셋과 함께, 해당 데이터를 생성한 절차와 과정에 대한 상세한 설명이 포함됐다.
위원회는 연구용역을 통해 참조모델을 마련했다. 각 참조모델은 △사전 준비 △합성데이터 생성 △유용성과 안전성 검증 △활용의 4단계 절차를 거쳐 만들어졌다.
먼저 합성데이터를 활용하고자 하는 기업·연구기관 수요를 조사하고 그 수요에 맞춰 유용한 데이터를 생성했으며 생성과정은 각 분야 전문가로 구성된 연구반 검토, 외부전문가의 적정성 심의 등을 거쳤다.
이렇게 만들어진 데이터는 6월3일 ‘가명정보 지원플랫폼’에서 공개된다.
고학수 개인정보보호위원회 위원장은 “이번에 개인정보위에서 공개한 '합성데이터 생성 참조모델'은 데이터 경제 시대의 개인정보 침해 우려를 없애면서도 데이터를 적극적으로 활용하도록 하여 관련 데이터 산업 생태계의 발전에 크게 기여할 것으로 기대된다”며 “본격화하는 데이터 경제 시대에 개인정보의 안전한 활용을 위해 적극 노력하겠다”고 말했다. 조충희 기자