[뉴스토마토 홍연 기자]
KT(030200) 산·학·연 인공지능(AI) 연구 협력체 'AI 원팀'이 개발한 AI 기술 4종을 14일 공개했다.
4종의 기술은 △로봇 실내 공간지능 기술 △로봇 소셜 인터랙션(Social Interaction) 기술 △보이스 클로닝(Voice Cloning) 기술 △한국어 E2E(End to End) 음성인식 트랜스퍼 러닝(Transfer learning)으로, KT는 자사 AI 사업 및 서비스에 활용할 예정이다.
KT와 한국과학기술원(KAIST) 명현 교수가 함께 개발한 로봇 실내 공간지능 기술은 로봇이 실내 공간의 사물을 식별하고 사물의 위치를 기억하도록 한다. 로봇이 공간 내에서 3D 지도를 생성하고 실시간 업데이트를 할 수 있게 해준다. AI 원팀은 이를 바탕으로 로봇의 실내 자율주행 정밀도를 높일 계획이다.
로봇 소셜 인터랙션 기술은 KT와 KAIST 윤성의 교수 연구진이 함께 개발했으며, 로봇이 사용자의 얼굴 및 행동을 인식한 뒤 수행할 행동을 추천한다. KT 로봇은 향후 이와 같은 개별 알고리즘을 연결해 로봇의 개인화된 상호작용을 구현할 계획이다.
KT와 KAIST 김회린 교수가 공동 연구한 보이스 클로닝 기술은 개인화 음성 합성을 위한 목소리 복원 알고리즘으로, 개인의 오디오 샘플을 딥러닝으로 학습해 맞춤형 음성을 제공한다. 특히 맞춤형 음성 학습에 필요한 녹음 시간을 기존 30분에서 3분으로 단축했다. KT는 이 기술을 기가지니, AI통화비서, AI 로봇, AI 교육 등에 도입해 ‘커스텀 개인화 TTS 서비스’를 상용화할 예정이다.
한국어 E2E 음성인식 트랜스퍼 러닝 기술은 KT와 한양대 장준혁 교수가 개발했다. 한국어 음성인식 성능을 높이면서도 학습에 필요한 데이터를 줄였다. KT에 따르면 이 기술은 기존 최고 성능을 내는 딥러닝 음성인식 모델 대비 에러율이 13.7% 감소해 세계 최고 수준의 음성인식 성능을 갖췄다.
송재호 KT AI/DX융합사업부문장 부사장은 "올해도 AI 원팀에서 연구기관, 기업, 스타트업 간의 협력을 통해 시너지를 내고 AI 국가 경쟁력을 높이도록 최선을 다하겠다"고 말했다.
서울 서초구의 KT 융합기술원에서 연구원들이 AI원팀에서 개발한 AI 기술을 살펴보고 있다. (사진=KT)
홍연 기자 hongyeon1224@etomato.com