[뉴스토마토 김동현 기자]
SK텔레콤(017670)은 국립국어원과 업무협약을 체결하고, 국립국어원의 언어 정보를 활용해 한국어에 최적화한 차세대 인공지능(AI) 언어 모델을 개발한다고 7일 밝혔다.
차세대 AI 한국어 모델은 사람의 능력 수준으로 평가되는 GPT-3와 유사한 성능을 발휘하는 한국어 범용 언어 모델(GLM)이다. 언어 관련 문제풀이, 글짓기, 번역 및 주어진 문장에 따라 간단한 코딩을 수행할 수 있는 GPT-3의 기능을 한국어에서도 구현할 수 있게 된다. GLM은 일상의 감성대화, 다양한 업종의 고객센터 대화뿐 아니라 시사, 문학, 역사 등 다양한 영역의 언어 활동에 적용될 수 있다. 이를 기반으로 새로운 산업 분야에서도 활용될 전망이다.
데이비스 에릭 하트먼 SKT Language Superintelligence Labs장(사진 왼쪽)과 정희원 국립국어원 어문연구실장이 업무협약을 체결한 후 기념 촬영을 하고 있다. 사진/SKT
SKT가 개발하는 GLM은 1500억개의 매개변수를 가진 거대 언어 모델로 개발될 예정이다. 최신 언어 모델인 GPT-3가 1750억개의 매개변수를 가지고 있다. SKT는 올해 말까지 GLM을 개발해 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행할 예정이다. 또한 한국어 언어모델 성능 평가 방법 개발 및 한국어 데이터 품질 평가 연구도 추진할 예정이다.
SKT는 2018년부터 AI 언어모델을 개발했고, 2019년에는 'KoBERT'를 개발해 챗봇 등에 활용 중이다. 지난해 4월 'KoGPT-2'를 개발해 챗봇의 대화를 발전시켰고, 10월에는 뉴스나 문서를 고품질 요약문으로 만드는 등 텍스트 처리 역량이 뛰어난 'KoBART'를 개발했다. 국립국어원은 올해 '국어 정보처리 시스템 경진대회'를 AI의 언어소통 능력을 겨루는 방식으로 개편해 한글 주간에 개최할 계획이다.
데이비스 에릭 하트먼 SKT Language Superintelligence Labs장은 "SKT는 한국어에 최적화한 AI 언어모델을 선제적으로 개발해 한국어의 정보화에 이바지하고 있다"며 "국립국어원과의 협력을 계기로 한국어의 과학·세계화에도 기여할 계획"이라고 밝혔다.
김동현 기자 esc@etomato.com