크게 크게 작게 작게
페이스북 트윗터
스캐터랩, '이루다' 데이터·모델만 폐기…'연애의 과학' 데이터는 요청해야 삭제
이루다서 활용한 1억건 카톡대화, 연애의 과학 카톡대화 100억건 중 일부
입력 : 2021-01-15 오후 1:48:06
[뉴스토마토 배한님 기자] 개인정보 유출로 논란의 중심에 선 인공지능(AI) 챗봇 '이루다' 개발사가 이루다의 데이터베이스(DB) 및 딥러닝 대화 모델을 폐기한다. 이용자의 불안감을 고려한 결정이다. 그러나 여전히 회사의 다른 서비스인 연애의 과학에서 수집한 데이터 전면폐기는 약속하지 않았다. 
 
 
스캐터랩은 15일 개인정보보호위원회와 한국인터넷진흥원(KISA) 조사 후 이루다 DB 전량 및 딥러닝 대화 모델을 폐기한다고 밝혔다. 스캐터랩은 "관련 후속 조치는 각 애플리케이션(앱) 공지를 통해 안내받을 수 있다"고 설명했다. 회사 측은 "향후 신규 가입 및 서비스 이용 시에는 개인정보 수집·이용 동의 절차를 강화할 계획이다"고 덧붙였다. 
 
DB와 딥러닝 대화 모델과 관련, 스캐터랩은 개인정보가 유출될 가능성은 없다고 강조했다. 스캐터랩 측은 "이루다 DB는 비식별화 절차를 거쳐 개별적이고 독립적인 문장 단위로 이루어져 개인 식별이 가능한 데이터를 포함돼 있지 않다"며 "또한 딥러닝 대화 모델을 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고, AI는 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다"고 주장했다. 스캐터랩은 유출 위험이 없음에도 폐기를 결정하게 된 이유로 "이용자의 불안감"을 들었다. 
 
그러나 여전히 개인정보가 유출된 자사 서비스 '연애의 과학' 데이터의 전량 삭제에 대한 언급은 없었다. 스캐터랩은 "'연애의 과학'과 '텍스트앳'에서 수집된 기존 데이터는 활용을 원하지 않는 이용자로부터 신청을 받은 후 해당 이용자의 데이터를 모두 삭제할 예정이며, 이는 향후 딥러닝 대화 모델에도 이용되지 않는다"고 밝혔다. 
 
연애의 과학 이용자들은 '데이터 전면폐기'가 필요하다는 입장을 고수하고 있다. 이루다 데이터는 '연애의 과학'에서 수집한 사용자 카카오톡 대화의 일부에 불과하기 때문이다. 스캐터랩은 연애의 과학으로 모은 카카오톡 대화 약 100억건 중 1억건을 이루다 DB에 사용했다고 밝힌 바 있다. 한 AI 전문가는 "스캐터랩이 연애의 과학에서 수집한 데이터를 어디까지 사용했는지 알 수 없기 때문에 이루다 DB와 모델 폐기만으로는 부족하다"며 "비식별화가 충분하지 않은 연애의 과학 사용자 데이터와 이를 통해 학습한 모든 모델에 대한 후처리가 필요하다"고 강조했다. 
 
배한님 기자 bhn@etomato.com
배한님 기자


- 경제전문 멀티미디어 뉴스통신 뉴스토마토

관련 기사