텍스트 대화에서 개인정보 비식별 조치
‘이루다’ 사건?
㈜스캐터랩은 카카오톡 기반 감정분석 앱 서비스인 ‘텍스트앳’과 연애 상담 앱 서비스인 ‘연애의 과학’ 이용자로부터 카카오톡 대화를 수집하여 ‘이루다’의 AI 개발과 운영에 이용하였습니다. 구체적으로, ㈜스캐터랩은 ‘이루다’ AI 모델 개발을 위한 알고리즘 학습을 목적으로 카카오톡 대화에 포함된 이름, 휴대전화번호, 주소 등 개인정보를 삭제하거나 암호화하는 등의 조치를 하지 않고 약 60만 명 이용자의 카카오톡 대화문장 약 94억 건을 이용하였으며, ‘이루다’ 서비스 운영을 위하여 20대 여성의 카카오톡 대화문장 1억 건을 응답 DB로 구축하여 ‘이루다’가 위 문장 중 한 문장을 선택하여 발화할 수 있도록 운영하였습니다.
또한 ㈜스캐터랩은 소스코드 공유 및 협업 사이트인 깃허브(Github)에 이름(성 미포함) 22건, 지명 정보(구·동 단위) 34건, 성별, 대화 상대방과의 관계(친구 또는 연인) 등이 포함된 카카오톡 대화문장 1,431건과 함께 AI 모델을 게시하였습니다.
이용자 동의 범위 해석 주요 기준
- 이용자 의사와의 합치성
- 이용자의 예상가능성
- 이용자가 불측의 손해를 입을 우려
This post is licensed under CC BY 4.0 by the author.