제목 : 금융보안원, 「금융권 개인정보 보호 강화 기술(PET) 활용 방안 및 향후 과제」 연구보고서 배포
- 데이터 활용 확대 속 프라이버시 보호 강화, 금융권 PET 상용화 필요
□ 최근 데이터 규모 증가에 따른 개인정보 유출 등 보안 위험이 커지는 가운데 안전한 데이터 활용을 위한 개인정보 보호 강화 기술(PET)이 재조명됨에 따라,
ㅇ 금융보안원(원장 박상원)은 개인정보 보호 강화 기술 특성과 금융권 적용 분야를 분석하고 향후 적용을 위한 고려 사항을 체계적으로 정리한 연구보고서를 공개
※ 보고서는 금융보안원 레그테크 포털(regtech.fsec.or.kr) 참조
<개인정보 보호 강화 기술(PET) 주요 내용>
□ 개인정보 보호 강화 기술(Privacy Enhancement Technique, 이하 PET)*은 개인정보 원본을 공개하지 않은 상태에서 개인정보를 활용하여 계산·분석 등 정보 처리를 하는 기술로, 데이터 활용과 프라이버시 보호의 균형을 달성
* 합성데이터, 차분프라이버시, 동형암호, 영지식증명, 다자 연산(MPC) 및 연합학습 등이 해당
ㅇ 재식별 위험을 완화하기 위해 개인 식별성 축소, 은닉, 데이터 분할 등의 방식으로 PET를 도입해 침해 위험을 낮추고 안전한 데이터 활용을 지원
ㅇ 주요 PET로 원본 데이터를 모방해 통계적 특성은 같지만 개인을 식별할 수 없는 가상의 데이터를 생성하는 합성데이터, 분산된 데이터 분석 및 AI 모델 학습을 위한 연합학습, 암호화된 상태에서도 연산이 가능한 암호 기술인 동형암호 등이 활용
[ PET 주요 분류 ]
|
구분 |
종류 |
특성 |
|
개인 식별성 축소 · 파생 데이터 생성형 |
합성데이터 |
원본 데이터를 모방해 인공적으로 데이터를 생성 |
|
차분프라이버시 |
개인정보가 포함된 데이터에 개별 정보가 결과에 거의 영향을 주지 않도록 노이즈를 추가 |
|
|
은닉 · 차폐형 |
동형암호 |
암호화 상태로 데이터 연산 |
|
영지식증명 |
실제 정보는 공개하지 않되 사실을 증명 |
|
|
데이터 분할 · 접근통제형 |
다자 연산(MPC) |
원본 데이터 공유 없이 공동 계산 |
|
연합학습 |
분산된 데이터 분석 및 AI 모델 학습 |
<PET 적용 사례>
□ PET 기술 성숙도가 높아지면서 전 세계적으로 의료, 제조 등 개인정보를 취급하는 모든 데이터 공유 환경에서 활용되고 있으며,
ㅇ 특히 금융은 산업 특성상 다량의 개인(신용)정보를 취급하고 데이터 분석을 통한 부가가치가 높아, 고객 신원확인 및 부정거래 탐지(FDS) 등 목적으로 적극 활용하는 추세
[ 해외 금융 분야 PET 적용 사례 ]
|
분야 |
업무명 (국가/기관) |
적용 기술 |
|
고객 신원확인(KYC) |
Sedicii KYC export |
영지식증명 |
|
부정거래 탐지 대응(FDS) |
AI 학습 데이터 생성 (미국/American Express) |
합성데이터 |
|
Cross-Bank AML 분석 플랫폼 구축(미국/Future Flow Research) |
다자 연산(MPC) |
|
|
금융상품 판매 지원 |
AI를 활용한 판매 예측 모델 개발 |
다자 연산(MPC), 동형암호 |
|
금융사 간 협업 플랫폼 |
안전한 데이터 공유 · 검증 중계 플랫폼 구축 (영국/DANIE.tech) |
다자 연산(MPC), 동형암호, 영지식증명 |
<데이터 공유·활용 유형별 적정 PET>
□ 금융데이터 공유·활용 유형이 다양해지면서 상황별로 요구하는 보호 수준이 달라짐에 따라, 공유·활용 방식에 따라 적정한 PET 기술이 필요
ㅇ 공유·활용 유형은 데이터를 소유하는 기관의 수에 따라 단독·다자로 구분하고, 데이터 보호조치가 적용되는 시점에 따라 입력 보호(데이터 제공 시)·출력 보호(분석 결과 제공 시)로 구분
[ 금융 데이터 공유 · 활용 유형별 주요 PET ]
|
유형 |
참여 구성 |
보호 유형 |
주요 PET |
|
제3자 위탁 분석 |
단독기관 |
입력 보호형 |
동형암호 |
|
통계 공개 |
단독기관 |
출력 보호형 |
차분프라이버시 |
|
데이터 공유 없이 금융사 간 공동 모델 학습 |
다기관 |
입력 보호형 |
연합학습 + 집계 다자 연산(MPC-SA) |
|
금융사 간 부정거래 정보 공유 |
다기관 |
입 · 출력 보호형 |
차분프라이버시 + 교집합 다자 연산(MPC-PSI) |
ㅇ 적절한 PET 기술을 적용함으로써 데이터 과보호 또는 과소 보호를 줄이고, 도입 이후에도 발생할 수 있는 재식별 위험을 지속적으로 점검하며, 법적 준거성과 검증 가능성을 확인할 수 있는 표준화된 관리 절차를 확보하는 데 활용
<PET 활용을 위한 향후 과제>
□ 금융권에의 효과적인 PET 도입을 위해 ▲기술 표준화 등 기술 활성을 위한 생태계 조성 ▲PET 친화적인 규제 수립 ▲금융권 공통 검증 지표 정립을 통해 실증 연구 및 활용 기반 마련이 필요
ㅇ 금융보안원은 PET 도입의 일환으로 금융권 합성데이터 상용화를 위해 합성데이터 익명성 평가 방안을 마련하고 있으며, 은행권 공동 FDS 모델 구축을 목적으로 연합학습 및 차분프라이버시를 활용하여 각 금융사가 보유한 정보를 공개 없이 이용 가능토록 추진 중
ㅇ 추후에도 개인(신용)정보보호 및 데이터 결합·보호 업무를 기반으로 PET 활용을 위한 실증 연구를 단계적으로 진행하고 제도·기술적으로 지원할 계획
□ 금융보안원 박상원 원장은“AI 활용이 본격화되는 금융환경에서 데이터 활용 과정에서도 프라이버시 침해를 최소화할 수 있는 PET의 중요성이 한층 커질 것”이라며,
ㅇ“금융보안원은 PET의 실무 적용을 통해 금융권의 신뢰 기반의 데이터 공유 환경을 구축할 수 있도록 적극 지원하겠다.”고 밝힘. 끝.