팜이데일리 프리미엄 기사를 무단 전재·유포하는 행위는 불법이며 형사 처벌 대상입니다.
이에 대해 팜이데일리는 무관용 원칙을 적용해 강력히 대응합니다.
[이데일리 김승권 기자] 국내 인공지능(AI) 신약개발 기업들이 자체 임상 진행에 어려움을 겪고 있지만 해외 기업들은 이미 임상 3상 신청을 한 약물도 나올 만큼 속도가 빠르다.
이들에겐 어떤 공통점이 있을까. 팜이데일리가 미국 리커전파마슈티컬스, 인실리코메디신 등과 같은 기업의 성공 방정식을 분석해봤다.
7일 AI신약개발 업계에 따르면 국내 기업 중 AI로 발굴한 약물을 임상 2상에 진입시킨 건수는 1건(이노보)에 그쳤다. 해외에선 대표적인 기업인 리커전(4건), 인실리코메디신(2건) 이 두 기업의 성과만 6건에 달한다.
매출로 봐도 리커전은 작년 약 823억원(yoy 32%), 슈뢰딩거는 약 3036억원(20%)에 달했지만 국내 상장사인 파로스아이바이오(0원), 신테카바이오(1억원) 등은 미미했다.
 | 임상 속도별 글로벌 AI신약개발 회사 리스트 (자료= 딥파마인텔리전스(DPI) Artificial Intelligence for Drug Discovery 2023, LG경영연구원) |
|
엔드투엔드 방식, AI신약개발 대세로 떠올라 이런 차이에 대해 전문가들은 해외의 AI신약개발 기업은 ‘엔드투엔드 AI’ 모델로 방식을 바꾼 것이 주효했다고 분석했다. 엔드투엔드 방식은 후보물질 발굴에 초점을 맞춘 1세대 방식이 아니라 약물 디자인부터 임상 분석까지 가능한 방식이다.
실제 인실리코 메디신은 생성형 AI와 딥러닝 기술을 활용해 신약 개발 전 과정을 혁신했다. 인실리코 메디신이 자체 개발한 AI 플랫폼 ‘파마.AI는 환자 유전자 분석을 통해 치료 표적을 파악(판다오믹스), 약물 화학 구조를 생성하거나(케미스트리42), 임상 성공률을 예측(인클리니코)하는 것이 모두 가능하다. 이 때문에 인실리코 메디신은 2021년부터 AI를 활용해 18개월만에 22개의 신약 후보물질을 발굴했다. 전임상 진입 성공률은 100%에 달했다.
 | 김우연 전 한국제약바이오협회 AI신약개발지원센터장(사진=히츠) |
|
이 회사가 제시한 성공적인 AI신약개발 핵심 요소는 △표적 단백질과의 결합 친화도를 확인하는 효소 분석 △약물 대사 및 체내 동태(ADME) 평가 △세포 및 동물 실험을 통한 약효 및 독성 평가 △생체 내(in vivo) 약물 역학(PK) 연구 △표적과의 작용기전을 확인하는 바이오마커 분석 등이다.
김우연 전 제약바이오협회 AI신약개발센터장(히츠 대표)은 “글로벌 AI신약개발 업계에선 ’환원주의‘ 방식으로 접근하는 추세”라며 “현 상황에서 인간의 세포 전체를 분석·학습하는 것이 어렵기 때문에, 요소별로 나눠 접근하고 충분한 데이터가 누적되면 이런 기술들을 통합하는 방식으로 플랫폼이 개발된다”고 설명했다.
AI 신약개발도 고품질 학습 데이터 확보가 중요한 성공 요소 또 다른 성공 공식은 ’차별화된 AI 학습 데이터‘다. 모든 AI의료 플랫폼이 그렇듯 정제된 데이터를 많이 확보한 기업이 고도화된 AI 플랫폼을 가질 수 있는데 이 지점에서 미국 기업이 우위를 보였다는 것이다.
리커전의 경우 ’세포 이미지 분석 모델 고도화‘로 성공한 케이스다. 사람 눈으로는 식별하기 어려운 미세한 세포 변화까지 감지하는 AI를 고도화해 약물 후보 물질 발굴 효율을 크게 높였다.
 | 슈퍼컴퓨터를 활용한 리커전 AI신약개발 실험실 (사진=리커전 홈페이지 갈무리) |
|
이 회사가 자체 개발한 AI 이미지 분석 모델 페놈베타는 약 20억개의 세포 이미지와 수억개의 약물 특성을 학습한 생성형AI 모델이다. 2023년 기준 총 학습 데이터는 50 페타 바이트에 달한다. 매우 큰 디지털 데이터 단위인 페타 바이트는 1000 테라 바이트와 같은 데이터량이다. 미국 주요 병원 등과 파트너십을 통해 막대한 양의 데이터를 축적한 것이다. 이를 이용해 약물 설계를 반복하고, 실험을 통해 신속하게 가설을 검증할 수 있게 됐다.
김수민 LG경영연구원은 고품질 신약개발 데이터를 얻는 것이 어렵지만 AI신약개발 플랫폼 경쟁력 확보의 지름길이라고 강조했다. 그는 “AI신약개발 권위자인 블라디미르 마카로브 박사도 27개 신약개발 공개 데이터 중 단 4개만을 사용할 수 있었다고 한다”며 “자신의 신약개발에 맞는 고품질 데이터를 확보하는 것이 그만큼 어렵다는 의미다. 따라서 고품질 데이터를 확보하려면 파트너십을 확장하거나 자체 실험실을 통해 데이터를 생성할 수 있어야한다”고 강조했다.
이어 “리커전의 경우 유전자 라이브러리 제공업체인 에나민, 템퍼스 등과 협력해 360억개 화합물에 대한 단백질 표적을 예측하며 크게 고도화됐다”고 덧붙였다.
 | 인실리코메디신 파이프라인 (사진=인실리코메디신) |
|
실제 리커전 AI실험실에서는 인간이 일을 하지 않는 시간에도 연구가 실시간으로 이뤄진다. 슈퍼컴퓨터인 바이오하이브-1을 통해서다. 전기차 테슬라 데이터센터에 계속해서 드라이빙 데이터가 쌓이며 고도화되는 것과 비슷한 이치라는 게 회사 측 설명이다.
김우연 전 제약바이오협회 AI신약개발센터장(히츠 대표)은 “바이오 분야는 DNA부터 RNA, 단백질에 이르기까지 시스템이 매우 복잡하다. 더구나 세포마다 사람마다 종마다 환경이 다르다”며 “이렇게 복잡하면서도 다양한 시스템을 AI가 이해하기 위해선 지금보다 더 많은 데이터가 필요하다. 국내 기업도 데이터 확보가 성공의 중요한 요소인 것은 분명하다”고 말했다.