Post

개인정보 보호 기술 1

가명·익명처리 기술, 연합 학습, 동형암호, 합성데이터/재현데이터, 차분프라이버시

  • 출처 : 데이터넷(https://www.datanet.co.kr)
  • 출처 : 인공지능 시대의 개인정보보호법 p.112
  • 정의 : https://en.wikipedia.org/wiki/Privacy-enhancing_technologies

연합 학습 Federated Learning

: * 각각의 장치가 갖고 있는 데이터를 중앙 서버로 보내지 않고, 각각의 장치에서 학습이 진행된다.

  • 학습을 통해 도출된 ‘가중치들만’ 중앙 서버로 전송이 되어, 중앙 서버는 이 가중치들을 하나의 가중치로 취합하는 최종 역할을 담당한다.
  • – 다음 라운드 –
  • 취합된 가중치를 그 다음 라운드에서 중앙 서버가 각각의 장치들에게 내려준다
  • 각각의 장치들이 이 가중치를 사용하여 각각의 데이터에 대한 학습을 한다
  • 이렇게 연속적이고 반복적인 방식으로 학습한다

재현 데이터 ~ 진짜같은 가짜 데이터

  • 실제로 측정된 데이터(Real Data)를 생성하는 모형이 존재한다고 가정한다
  • 통계적 방법이나 기계학습 방법 등을 이용하여 추정된 모형에서 새롭게 생성한 모의데이터(Simulated Data)
  • 모집단의 통계적 특성들을 유지하면서도 민감한 정보를 외부에 직접 공개하지 않으며, 개인이 제공한 데이터가 아닌 임의로 생성한 데이터
  • 개인정보보호 관련 법규의 규제로부터 자유로운 특징

영지식 증명 Zero-knowledge Proof, ZKP

  • 증명자(Prover)가 검증자(Verifier)에게 자신의 주장(Statement)이 사실임을 증명하는데 사용되는 암호화 기술
  • 증명자는 자신의 주장을 증명하기 위해서 검증자에게 자신의 주장에 관한 어떤 정보도 제공(유출)하지 않는다
  • 검증자는 증명자의 주장에 대한 어떤 정보도 알지 못한 상태에서 검증을 수행한다
  • 위키 영지식 증명

동형 암호 Homomorphic Encryption

  • 평문과 암호문의 동형(Homomorphic) 성질로 인해 암호문 상태에서도 연산이 가능한 차세대 암호기술
  • (기존 암호알고리즘) 데이터를 비식별화하는 경우 클라우드에서 암호화된 데이터에 대한 연산이 불가능
  • (동형암호를 활용) 민감정보를 안전하게 보호하면서도 유용하게 데이터를 활용할 수 있다

다자간 연산 Multi-Party Computation, MPC

  • 다수의 사용자가 각자의 비밀 값을 입력 값으로 하여 함수 값을 함께 계산하는 기술
  • 연관된 기술들은 머클 트리, 동형 암호, Taproot 등 다양한 암호학 관련 기술들
  • 원래 정보는 알 필요없이 도출된 비밀 값만을 몇몇 주체들이 해결해낸 뒤, 그 결과들을 활용하면 된다
  • 이를 통해 제 3자의 개입없이 프라이버시 및 신뢰를 구축할 수 있다

신뢰실행환경 Trusted Execution Environment, TEE

  • TEEware 곽노현 대표
  • 신뢰실행환경은 기존 컴퓨터 아키텍처(일반실행환경)에 보안 요소를 추가한 안전한 컴퓨터 아키텍처

읽을 자료

2017년에 서울대 산업수학센터에서 동형암호 HeaAN(한글: 혜안)을 개발하였으며 이는 최초의 근사(Approximate) 동형암호 기술입니다. 이 기술은 암호문 연산 과정에서 정확한 연산이 아닌 근사연산을 사용함으로써 효율성을 대폭 증가하였으며 연산이 부정확한 상황에서도 전체 결과에 영향이 크게 없는 통계연산 등의 수행 시 높은 성능을 보입니다. KISA는 HEAAN 기술에 대한 안전한 키관리 방안을 연구개발하고 있다

This post is licensed under CC BY 4.0 by the author.