(인터뷰)김화종 AI신약융합연구원장 "시간·비용 획기적 단축, K-신약개발 혁신 시작"
ADMET 예측 모델 'FAM 시스템' 개발…신약개발 시간·비용 획기적 단축
"AI·바이오 기술 결합 '연합학습 플랫폼' 신약개발 생태계 혁신 주도할 것"
2024-07-24 16:48:36 2024-07-24 22:04:40
 
[뉴스토마토 이혜현 기자] 연합학습을 통해 고도화된 인공지능(AI) 모델을 구축해 신약 연구개발 시간과 비용을 획기적으로 단축하고 성공 확률을 높이는 새로운 패러다임 변화의 장이 열렸습니다.
 
그동안 신약 개발 생산성 저하는 제약 바이오 업계의 고질적인 문제점이었고 대형사와 중소형사, 바이오텍 간 기술력 격차도 심화하면서 신약 개발 과정의 효율성 개선이 꾸준히 요구돼왔습니다. 이를 해소하기 위한 가장 적절한 방법은 자율화와 자동화, 의사결정 지원이 가능한 AI 기술을 신약 연구 개발에 적용하는 것입니다.
 
이를 구체화하기 위해 정부와 제약산업계가 참여한 연합학습 기반 신약 개발 가속화 프로젝트(K-MELLODDY) 사업단이 지난 4월 정식 출범했습니다. 과학기술정보통신부와 보건복지부가 공동으로 추진하는 연합학습 기반 신약 개발 가속화 프로젝트는 올해부터 5년간 348억원의 예산을 투입해 연합학습 기반 약동학(ADMET) 예측 모델인 FAM(Federated ADMET Model)을 개발하는 것이 단기 목표입니다.
 
K-MELLODDY 사업단 4월 정식 출범…신약 개발 생태계 활성화
 
연합학습 기반 신약 개발 가속화 프로젝트 사업단 초대 단장으로 취임한 김화종 한국제약바이오협회 AI신약융합연구원장은 23일 뉴스토마토와 인터뷰를 통해 사업단의 핵심 과제인 기술 고도화와 상용화, 협업 생태계 구축, 중장기 사업 비전을 설명했습니다.
 
제약 바이오 업계에는 연합학습 기반 신약 개발 가속화 프로젝트를 통해 축적된 양질의 신약 데이터가 보안을 유지하면서 안전하게 공유되고 활용할 수 있는 환경이 마련돼 기업들의 신약 연구개발 경쟁력이 높아지는 긍정적인 효과를 기대하고 있는데요.
 
김화종 AI신약융합연구원장(K-MELLODDY 사업단장)은 "연합학습 기반 AI 신약개발 플랫폼을 구축하고, 응용 사례를 제시해 국내 제약산업의 인공지능 기반 신약 개발 생태계를 활성화시키는 것이 핵심인데, 여기에는 성공적인 플랫폼 개발 및 실증을 위해 데이터 확보와  ADMET 예측 인공지능 모델 개발이 포함돼 있다"고 설명했습니다.
 
다수의 기업과 기관이 보유한 신약 연구개발 관련 양질의 데이터가 축적돼 이를 기반으로 AI 신약 개발 플랫폼을 구축하는 것이 주요 골자인데 문제는 기업의 핵심 자산인 신약 개발 정보를 외부에 알리기를 꺼리는 분위기와 데이터 보안 문제를 해결해야 하는 과제가 있습니다. 일부에서는 양질의 데이터가 성능과 직결되기 때문에 신약 연구개발 데이터 확보가 전제되지 않는다면 연합학습 기반 AI 신약개발 플랫폼 구축에 상당한 어려움이 있을 것이라는 지적도 나옵니다.
 
이에 대해 김 원장은 "각 제약사와 위탁 시험 기관, 인증 기관은 적지 않은 신약 개발 관련 데이터를 보유하고 있다"며 "기업이 신약 개발을 위해 비용을 투입해 만들어진 데이터는 그들의 자산으로 보호하기 위해 인공지능 모델 학습을 위한 데이터 공개에 소극적일 수 있지만 이런 문제를 해결할 수 있는 기술이 연합학습"이라고 강조했습니다.
 
연합학습은 각 기관의 데이터를 외부로 유출하지 않고, 모델 파라미터만을 송수신해 모델을 학습하는 기술인데요. 현재 이러한 연합학습을 활용할 수 있는 환경이 구축되지 않아 실용화되고 있지는 않지만, AI 신약개발 생태계를 활성화시키기 위해서는 반드시 필요한 플랫폼이죠.
 
김 원장은 "연합학습은 데이터 이질성, 보안, 인센티브 등 몇 가지 기술적 고려사항이 존재하는데 사업단은 이러한 고려사항들을 연구하고 반영할 수 있도록 사업을 계획했으며, 실용 가능한 신약 개발 연합학습 플랫폼과 환경을 만드는 것이 사업의 최종 목표"라고 말했습니다. 그는 이어 "신약 연구개발 연합학습 플랫폼은 AI와 바이오 기술이 결합해 새로운 성과를 창출하는 첨단바이오 분야의 대표적인 성공 사례로 안착해 기업들은 AI를 신약 개발에 실제로 적용하는 구체적인 도구를 확보하는 동시에 협력과 경쟁을 통해 국제 경쟁력을 갖게 될 것"이라고 자신했습니다.
 
데이터 및 개인정보 유출 위험…보안 강화 대책 구체화
 
또 다른 걸림돌로 꼽히는 데이터 및 개인정보 유출 위험에 대해서는 동형 암호화, 차등 정보보호, 안전한 다자간 계산, 영지식증명, 암호화 등 보안 강화 대책을 구체화했습니다.
 
김 원장은 "데이터 보안뿐만 아니라 다양한 수준에서의 보안이 요구되는데, 보안 문제는 엔드 유저, 클라우드 시스템, 연합학습 프레임워크 수준에서 모두 준비하고 있다"며 "엔드 유저 수준에서는 개인정보보호법을 따라 명확한 신원 증명을 요구할 것이고, 클라우드 시스템에서는 정보보안에 대한 인증을 받은 클라우드 업체를 활용해 정보보안에 대한 대처가 가능하도록 준비하고 있다"고 설명했습니다. 연합학습 프레임워크에서는 모델 보안, 통신 보안이 중요한데 연합학습에서 발생할 수 있는 보안 이슈 등 연합학습 주요 현안의 해결 방안 연구 및 반영이라는 항목을 명시해 보안 문제를 해결하도록 설계했다고 밝혔습니다.
 
특히 김 원장은 연합학습이 각 기관이 보유한 데이터를 한곳으로 모으지 않고 개별 기관에서 AI를 학습시키는 기술로 정보 유출 위험이 거의 없고 민감정보의 보호와 활용이 동시에 가능한 점을 강조했습니다. 즉 모든 연합학습 시스템은 보안 클라우드 환경에서만 구현됩니다. 보안 클라우드 환경은 사업단에 참여한 제약사의 데이터 저장소도 포함되며, 해당 저장소의 데이터는 제약사만이 접근할 수 있어 기업들이 우려하는 데이터 공유와는 다르다는 것이죠. 김 원장은 "모든 연합학습이 분할된 보안 클라우드 내에서 동작하기에, 참여 제약사는 데이터 유출 걱정 없이 연합학습에 데이터를 활용할 수 있다"고 말했습니다.
 
또한 연합학습 플랫폼에는 학습된 AI 모델의 기여도를 측정하는 기능이 있습니다. 학습된 AI모델 사용 시 기여도에 기반해 수익 배분 등을 결정하는데 활용될 수도 있는 것인데요. 이는 각 제약사가 높은 기여도를 얻기 위해 적극적으로 양질의 많은 데이터를 학습에 활용하도록 유도하는 데 도움이 될 것으로 보입니다. 김 원장은 초기 플랫폼이 구축되는 해는 2026년으로 내다보고, 사업 참여 전체 기관이 연합학습에 참여해 초기 성과를 확인할 수 있을 것으로 예상했습니다.
 
약동학 예측 모델인 'FAM 솔루션' 구축 추진
 
사업단은 단기적 과제로 약동학(ADMET) 예측 모델인 'FAM 솔루션' 구축을 추진하고 있습니다. ADMET은 약물 흡수와 분포, 대사, 배설 및 독성 등 임상 시험 성공의 가장 중요한 요소로 일반적으로는 신약 개발 비용의 22% 가량을 차지하죠. 하지만 국내 제약 바이오 업계는 주로 초기 개발 단계에서 기술수출을 염두하고 임상 1상까지 하는 경우가 많아 실제로는 ADMET 검증 단계가 신약 임상 비용의 대부분을 차지하고 있다고 봐야 합니다.
 
신약 후보 물질의 ADMET 값을 예측할 때 시험관 시험 결과만으로는 비임상 및 임상시험 통과를 보장하기 어렵고, 현재 학습용 데이터 부족으로 AI 활용 성능에 한계가 있습니다. 약동학(ADMET) 예측 외에 특정 타겟과 상호작용, 약물 간 상호작용, 사용자 유형별 반응 예측, 다양한 독성 예측 등으로 확대할 수 있는 솔루션이 필요해 사업단은 우선 연합학습 기반의 ADMET 예측 모델인 FAM 솔루션 개발에 집중할 계획이라고 김 원장은 강조했습니다.
 
김 원장은 "FAM 솔루션 개발 프로젝트가 일회성에 그치는 것이 아니라 데이터 추가를 통해 자동 연속적으로 성능이 개선된다는 장점이 있다"며 "연합학습 플랫폼을 통해 다기관의 ADMET 데이터를 수집하고 고성능의 예측 도구를 개발해 비용효과성을 극대할 방침"이라고 설명했습니다. 그는 "FAM 솔루션 확보 이후 연합학습의 실용성을 검증하고 참여기관을 확대해나가는 동시에 신약개발 단계 적용 및 확장, 데이터 기여도 평가, 글로벌 협력 확대 등도 추진해나갈 예정"이라고 덧붙였습니다.
 
사업단에 따르면 FAM 솔루션은 기존의 다양한 상용 ADMET 예측 모델과는 다른 형태로, 다양한 시점에서 임상시험 통과를 예측할 수 있도록 모델을 개발해 AI의 활용 범위를 확대할 수 있는데요. 이를 위해 사업단은 연합학습 기반의 신약개발 플랫폼에 산업계와 학계, 연구기관, 병원 등에서 발생하는 데이터를 종합적으로 활용할 계획입니다.
 
김 원장은 "연합학습 기술을 활용함으로써 개별 연구기관이나 기업이 독자적으로 수행하기 어려운 대규모 데이터 분석과 모델링 작업을 공동으로 수행할 수 있게 되는데 이는 궁극적으로 신약 개발의 효율성을 크게 향상시키는 동시에 신약 개발 프로세스에 혁신적인 변화를 가져올 것"이라고 강조했습니다. 
 
김화종 한국제약바이오협회 AI신약융합연구원장(K-MELLODDY 사업단장)이 23일 뉴스토마토와 인터뷰를 진행하고 있다.(사진=뉴스토마토)
 
이혜현 기자 hyun@etomato.com

이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 강영관 산업2부장이 최종 확인·수정했습니다.

ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지

지난 뉴스레터 보기 구독하기
관련기사