텍스트 대화에서 개인정보 비식별 조치

Posted Jan 2, 2024

By 잠자리 2 min read

‘이루다’ 사건?

㈜스캐터랩은 카카오톡 기반 감정분석 앱 서비스인 ‘텍스트앳’과 연애 상담 앱 서비스인 ‘연애의 과학’ 이용자로부터 카카오톡 대화를 수집하여 ‘이루다’의 AI 개발과 운영에 이용하였습니다. 구체적으로, ㈜스캐터랩은 ‘이루다’ AI 모델 개발을 위한 알고리즘 학습을 목적으로 카카오톡 대화에 포함된 이름, 휴대전화번호, 주소 등 개인정보를 삭제하거나 암호화하는 등의 조치를 하지 않고 약 60만 명 이용자의 카카오톡 대화문장 약 94억 건을 이용하였으며, ‘이루다’ 서비스 운영을 위하여 20대 여성의 카카오톡 대화문장 1억 건을 응답 DB로 구축하여 ‘이루다’가 위 문장 중 한 문장을 선택하여 발화할 수 있도록 운영하였습니다.
또한 ㈜스캐터랩은 소스코드 공유 및 협업 사이트인 깃허브(Github)에 이름(성 미포함) 22건, 지명 정보(구·동 단위) 34건, 성별, 대화 상대방과의 관계(친구 또는 연인) 등이 포함된 카카오톡 대화문장 1,431건과 함께 AI 모델을 게시하였습니다.

이용자 동의 범위 해석 주요 기준

이용자 의사와의 합치성
이용자의 예상가능성
이용자가 불측의 손해를 입을 우려

정보보호

This post is licensed under CC BY 4.0 by the author.

‘이루다’ 사건?

이용자 동의 범위 해석 주요 기준

Trending Tags