[뉴스토마토 배한님 기자] KT가 지난해 2월 출범한 'AI(인공지능) 원팀'이 다자간 공동연구로 초거대 AI 모델 개발에 나선다. AI 원팀 참여기관들과 많은 양의 데이터 연산이 가능한 인프라를 구축하고 내년 상반기까지 상용화 가능한 초거대 AI 언어모델을 만든다는 목표다.
KT는 18일 AI 원팀 참여기관인 한국전자통신연구원(ETRI)·카이스트·한양대와 초거대 AI 모델 개발을 위한 공동 연구 협약을 체결했다고 밝혔다.
초거대 AI란 대용량 연산이 가능한 인프라를 바탕으로 대규모 데이터를 학습해 사람처럼 스스로 사고할 수 있도록 설계된 인공지능을 뜻한다. 데이터 정제·학습 알고리즘·분산 및 병렬학습·경량화·응용모델 발굴 등 다양한 분야의 연구가 필요해 한 기업이 단독 추진하기 어렵고, 학교와 연구 기관에서 접근하기도 쉽지 않다. 이에 KT는 AI 원팀에서 기업의 대규모 투자를 이끌어내 GPU 인프라를 구축하고 산·학·연이 협력할 수 있는 모델을 적용하기로 했다.
이번에 개발하는 초거대 AI 언어모델은 즉시 상용화가 가능한 과제 지향적 형태로 설계된다. 이에 초거대 언어모델을 통해 향상된 △STT(Speech-to-Text) △대화 TTS△(Text-to-Speech) △TA(Text Analytics) 등 요소기술은 KT 기가지니와 AICC 서비스 고도화를 위해 활용된다. 향후 제조·금융·물류·유통 등 AI 원팀 참여기업의 다양한 사업 분야에도 적용할 예정이다.
KT는 초거대 AI 모델 개발에서 △대규모 GPU 인프라 구축 △데이터 수집·분석 △모델 학습 △응용태스크 적용 등 연구·개발(R&D) 및 상용화 관련 업무를 총괄적으로 수행한다.
카이스트는 △머신러닝 알고리즘 최적화 및 애플리케이션 파트를 맡는다. 한양대는 △데이터 정제·필터링 알고리즘 개발 △분산·병렬 알고리즘 및 모델 최적화 분야에 힘을 보탠다. ETRI는 △대형 모델학습 및 모델개발 분야에 참여한다.
AI 원팀은 올해 말까지 1차로 초거대 AI의 학습을 완료하고, 오는 2022년 상반기 내로 초거대 AI모델을 상용화할 계획이다. 아울러 대규모 AI 연산 인프라를 구축하고, 향후 2000억 파라미터(매개변수) 이상의 모델까지 운영할 수 있도록 인프라 규모를 점진적으로 확대할 예정이다. 또한 학습데이터 필터링 강화, 데이터 간 균형 조정 등으로 AI의 편향성을 우선 제거하고, 유해 콘텐츠 필터링 기술 등 다양한 딥러닝 기반 탐지 기술을 적극 활용해 AI 윤리 이슈도 사전에 차단할 계획이다.
AI 원팀의 KT, ETRI, KAIST, 한양대 관계자들이 28일 온라인으로 진행된 공동 연구협약식을 마치고 기념사진을 촬영하고 있다. 사진/KT
AI 원팀은 향후 △영상·로봇 등의 복합인지 △이미지 기반 해석 △인간중심 AI(Humanistic AI) 등에서 초거대 AI 모델로 영역을 확장해 국내외 많은 기업과 학교, 연구기관이 초거대 모델을 활용할 수 있도록 지원할 계획이다.
홍경표 KT 융합기술원장은 "AI 원팀 소속기관이 보유한 세계적 수준의 기술과 경험을 모두 결집한 초거대 AI모델 개발은 차세대 AI 핵심 원천기술 확보라는 측면에서 각별한 의미를 가진다"며 "이번 프로젝트를 통해 대한민국의 국가 AI 산업 경쟁력 강화에 크게 기여하고, 산업전반의 디지털 트랜스포메이션과 고객 라이프스타일 변화를 선도하겠다"고 전했다.
배한님 기자 bhn@etomato.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김기성 편집국장이 최종 확인·수정했습니다.
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지