AI 챗봇 ‘이루다’ 만든 스캐터랩, 개인정보 수집 논란

‘연애의 과학’으로 얻은 카톡 대화를 ‘이루다’에 적용하는 과정에 절차 문제 지적 진보넷 “개인정보의 목적 외 이용과 부적절한 고지 등 개인정보보호법 위반 소지”

2022-01-14     박효길 기자
인공지능(AI)
[매일일보 박효길 기자] 인공지능(AI) 챗봇 ‘이루다’를 개발한 스캐터랩이 윤리 논란에 이어 개인정보 수집 논란을 빚고 있다. 14일 업계에 따르면 스캐터랩은 IT 개발자들이 오픈소스를 공유하는 플랫폼 ‘깃허브’에 카카오톡 대화 데이터로 학습하는 인공신경망 모델 파일을 올렸다. 스캐터랩은 2019년 10월부터 카톡 데이터로 학습하는 인공신경망을 깃허브에 공유해왔다. 문제는 스캐터랩이 공개한 프로젝트에 데이터앱 ‘연애의 과학’ 이용자들 것으로 추정되는 개인정보 데이터가 비식별화 처리되지 않은 상태로 포함돼 있다는 점이다. 스캐터랩은 연애 분석 앱 연애의 과학 이용자들의 카톡 데이터 약 100억건을 재료로 이루다를 개발했고, 깃허브에 카톡 데이터 100건을 훈련 데이터로 공유했다. 이는 카톡 데이터 100건에 담겨 있는 카톡 대화량은 1700건에 이른다. 스캐터랩은 입장문을 통해 “본적으로 대화 중 실명은 ‘<NAME>’, 숫자는 ‘<NUM>’으로 자동화 비식별 처리를 했으나, 기계적인 필터링 과정에서도 미처 걸러지지 못한 부분이 일부 존재했음을 확인하게 됐다“며 ”한국어 자연어처리(NLP)와 관련된 기술 개발 및 공유를 위한 것이었으나, 데이터 관리에 더 신중하지 못했고, 일부 민감할 수 있는 정보가 포함된 대화 패턴이 노출된 점에 대해서 진심으로 사과드린다“고 밝혔다. 이어 “알려진 것처럼 데이터 베이스의 문장들을 조합해 개인을 특정하는 것은 불가능하며 일각에서 주장하듯 이루다 DB가 대화 기록을 그대로 가져다 썼다는 주장은 사실과 다르다”고 답했다. 개인정보 취급절차에 대해서 설명했다. 스캐터랩은 “먼저 ‘연애의 과학’ 초기 화면에 이용자가 로그인 하기 전 ‘로그인함으로써 이용약관 및 개인정보취급방침에 동의합니다’라고 기재돼 있고, 이용자가 이용약관이나 개인정보취급방침을 터치하면 전문을 확인할 수 있다”고 밝혔다. 또 “‘연애의 과학’은 대화의 당사자 중 한 명이 개인정보 수집, 이용에 동의해 자발적으로 대화 내용을 연애의 과학에 업로드한 것이므로, 내부적으로 문제가 없을 것으로 판단했다”며 “참고로 대화 내용은 제3자에게 제공하지 않고, 이용자의 동의를 받은 범위 내에서만 사용했다”고 주장했다.  시민단체 진보네트워크는 스캐터랩이 수집한 카카오톡 대화를 절차에서 개인정보 보호법 위반 등 의혹을 제기했다. 개인정보의 목적 외 이용과 부적절한 고지에 대해 지적했다. 진보넷은 “연애의 과학 로그인 페이지에서 ‘로그인함으로써 개인정보 처리방침에 동의합니다’로 간주하는 것은 각각의 사항을 알리고 명시적으로 동의를 받도록 한 개인정보 보호법 위반(제15조 제2항 또는 제39조의3제1항 및 제22조 위반)”이라고 주장했다. 또 대화 상대방 동의 부존재에 대해 지적했다. 진보넷은 “개인정보 보호법 제15조 또는 제39조의3제1항에 따라 마땅히 받아야 할 대화 상대방에 대한 동의 절차는 어디에도 없었다”며 “지난 12일 스캐터랩은 논란이 지속되자 서비스를 중지하고 사과의 뜻을 밝혔지만 대화 상대방의 동의 부존재에 대해선 한 마디 언급도 없었다(제15조 제1항 또는 제39조의3제1항 위반)”고 밝혔다. 앞서 페이스북 AI 챗봇 ‘이루다’는 사람처럼 자연스러운 대화로 인기를 얻었지만, 최근 동성애 혐오 발언으로 AI 윤리가 도마에 오른 바 있다.