[뉴스토마토 이범종 기자]
엔씨소프트(036570)가 국내 최초로 거대언어모델(LLM)의 성능과 수행능력을 검증하는 평가모델 '바르코 저지(VARCO Judge) LLM'을 출시했다고 23일 밝혔습니다.
바르코 저지 LLM은 다른 LLM이 얼마나 빠르고 정확하게 작업을 수행하는지 검사하는 평가모델입니다. 최근 기업들은 시장에서 서비스하는 다양한 유형·규모의 LLM 중 적합한 모델을 찾기 위해 많은 시간을 쓰고 있습니다. 엔씨는 바르코 저지 LLM이 각 기업의 AI 서비스에 적합한 LLM 모델을 효과적으로 검증할 수 있다고 자평합니다.
엔씨소프트 판교 사옥. (사진=엔씨소프트)
엔씨는 바르코 저지 LLM에 대해 "우수한 LLM 편향(Bias) 문제해결 능력과 뛰어난 한국어 성능을 자랑한다"며 "동급 모델 중 가장 높은 성능을 갖췄다"고 했습니다.
엔씨는 올해 NLP 학회 'EMNLP(Empirical Methods in Natural Language Processing)'에 LLM 평가모델 논문을 싣기도 했습니다.
엔씨는 이 평가모델을 활용할 경우, AI 기반 서비스를 만드는 기업이 각종 LLM 품질을 빠르게 비교·평가해 자사 서비스에 최적화된 모델을 채택할 수 있다고 설명했습니다.
엔씨 관계자는 "AI 모델 연구개발 기업은 자사 LLM의 성능 수준을 평가모델로 검증해 타 모델 대비 성능 우위를 증명하거나, 약점을 빠르게 파악해 보강할 수 있다"며 "모델 허브(Model Hub) 사업자는 LLM을 선택, 최적화 및 배포하는 프로세스를 가속화함으로써 더욱 효과적으로 모델을 제공할 수 있다"고 말했습니다.
이연수 엔씨 리서치 본부장은 "빠르게 진화하는 AI 시장에서 각자 산업에 맞는 최적의 모델을 선별하고 적용하는 서비스가 더욱 중요해지고 있다"며 "VARCO Judge LLM은 기존 LLM 기반 서비스의 품질 향상을 넘어 AI 비즈니스에서 없어서는 안 될 중요한 도구로 자리매김할 것"이라고 내다봤습니다.
이범종 기자 smile@etomato.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김나볏 테크지식산업부장이 최종 확인·수정했습니다.
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지