전체전체메뉴닫기

서울신문
공식 SNS 채널
구독 & 좋아요!!

서울신문 페이스북서울신문 유튜브
서울신문 카카오스토리서울신문 인스타그램서울신문 트위터서울신문 네이버채널

광고안보이기
전체메뉴 열기/닫기검색
서울신문 ci
암호화폐 범죄를 쫓다

이루다 개발사 “원하는 유저에 한해 개인정보 삭제하겠다” 5일만에 사과문

페이스북 공유 트위터 공유 카카오톡 공유 카카오스토리 공유 네이버밴드 공유 네이버블로그 공유 구분선 댓글
입력 :ㅣ 수정 : 2021-01-14 08:26 사회 섹션 목록 확대 축소 인쇄
이루다
클릭하시면 원본 보기가 가능합니다.

▲ 이루다

인공지능(AI) 챗봇 서비스 이루다의 개발사 스캐터랩이 지난해 오픈소스 공유 플랫폼 깃허브에 연애의 과학을 통해 수집한 카카오톡 대화 1700건를 올린 것에 대해 인정하고 사과했다.

또 이용자들 중 AI 학습에 데이터가 활용되기를 원하지 않는 사람들의 카카오톡 대화는 개인정보보호법에 따라 데이터베이스에서 삭제하고 앞으로 이루다 DB에 활용되지 않도록 적극적인 조치를 진행하겠다고 밝혔다. 하지만 논란이 된 카카오톡 대화 내용 수집 절차에 대해서는 “위법성이 없었다”는 기존 입장을 되풀이했다.

스캐터랩은 13일 오후 11시쯤 사과문과 함께 언론에 배포한 질의응답서에서 “‘깃허브’에 오픈 소스로 공개한 “KG-CVAE-인공지능 한국어 자연어처리(NLP) 연구 모델” 에 내부 테스트 샘플이 포함된 사실이 확인되었다”며 “해당 연구에는 내부 테스트를 위해 샘플로 추출한 100건의 데이터(100개 세션, 개별 문장으로 환산 시 1700여 건)가 포함되어 있었다. 실명은 “<NAME>”, 숫자는 “<NUM>” 명령어를 통해 자동화 비식별 처리를 하였으나, 기계적인 필터링 과정에서도 미처 걸러지지 못한 부분이 일부 존재하였음을 확인하게 되었다”고 밝혔다.

이루다를 성적 도구화해 사회적 물의를 일으켰던 남초 커뮤니티에서는 오픈소스를 이용해 ‘제2의 이루다’를 만들고 있다.

스캐터랩은 “한국어 자연어처리(NLP)와 관련된 기술 개발 및 공유를 위한 것이었으나, 데이터 관리에 더 신중하지 못했고, 일부 민감할 수 있는 정보가 포함된 대화 패턴이 노출된 점에 대해서 진심으로 사과드린다”고 했다.

또 AI 학습에 데이터가 활용되기를 원하지 않는 이용자들의 정보를 개인정보보호법에 따라 데이터베이스에서 삭제하고 앞으로 이루다 DB에 활용되지 않도록 적극적인 조치를 취하겠다고 말했다. 하지만 구체적인 삭제 요청 경로에 대해서는 밝히지 않았고, 여전히 자신이 제공한 카카오톡 대화가 AI 개발에 사용됐다는 걸 모르는 사용자들의 개인정보는 남아있게 된다. 또한 이러한 스캐터랩의 조처와는 별개로 비식별화가 충분히 되지 않은 개인 정보는 이미 깃허브에서 유출됐을 가능성이 크다.

스캐터랩은 2019년 9월부터 사용자들이 ‘연애의 과학’ 앱을 통해 내보내기 한 카카오톡 대화로 학습하는 인공신경망을 깃허브에 공유했다. 비식별화가 충분히 되지 않은 개인 정보들(집주소, 예금주명이 포함된 계좌번호, 학교 이름, 직장 이름과 위치, 건강 정보)은 지난달 23일 출시된 이루다를 통해 노출되기도 했다. 이에 대해 스캐터랩은 “숫자를 한글로 기재하는 전형적이지 않은 사례들이 극히 일부 발견되었다”면서 “OO은행과 같이 특정 명칭이 일부 이루다 서비스에서 발견된 것은, 앞서 알려드린 바와 같이 수차례의 기계적인 필터링 과정에서도 미처 걸러지지 못한 부분”이라고 해명했다.

카카오톡 대화를 수집하면서 충분한 동의를 얻지 않은 것에 대해서는 여전히 “법적 문제가 없다”는 기존의 입장을 고수했다. 스캐터랩은 “‘연애의 과학’이 개인정보의 수집, 이용에 동의를 받는 방법은 국내외 서비스들이 채택하고 있는 동일한 방법으로 내부적으로 법적으로 문제가 없을 것이라고 판단하였다”면서 “대화의 당사자 중 한 명이 개인정보 수집, 이용에 동의하여 자발적으로 대화 내용을 연애의 과학에 업로드한 것으로 내부적으로 문제가 없을 것으로 판단하였다”고 해명했다.

스캐터랩 전직 직원이 언론과의 인터뷰에서 직원들끼리 이용자의 카톡 대화를 단톡방에 공유해 돌려봤다는 주장에 대해서는 “진상조사위를 꾸려 조사한 결과 아직까지는 발견되지 않았다”며 “만에 하나 의혹이 사실로 드러나는 경우에는 직위 고하를 불문하고 관련자들에게 엄중히 책임을 묻고 필요한 조치를 취하도록 하겠다”고 선을 그었다.

한편, 개인정보보호위원회와 인터넷진흥위원회는 이날부터 현장에 투입돼 조사에 착수했다. 스캐터랩은 “해당 관계 기관의 요청에 따라 성실하게 조사에 최선을 다해 임하겠다”고 밝혔다.

최영권 기자 story@seoul.co.kr
페이스북 공유 트위터 공유 카카오톡 공유 카카오스토리 공유 네이버밴드 공유 네이버블로그 공유 구분선 댓글

서울신문 공식 SNS 채널
구독 & 좋아요!!
서울신문 페이스북서울신문 유튜브서울신문 카카오스토리서울신문 인스타그램서울신문 트위터
  • 주소 : 서울시 중구 세종대로 124 (태평로1가) l 인터넷신문등록번호 : 서울 아03681 등록일자 : 2015.04.20 l 발행·편집인 : 고광헌
  • Copyright ⓒ 서울신문사 All rights reserved. l Tel (02)2000-9000