기술&시장동향

전문가기고 [김남두] 인공지능(AI) 기반 신약개발

2020-05-12603

인공지능(AI) 기반 신약개발

(주)보로노이바이오, 김남두)

최근, 산업 전반에 걸쳐 인공지능(Artificial Intelligence, AI)을 활용한 연구가 활발하게 진행되고 있으며, 일부 산업 분야는 실생활에 밀접하게 이미 적용이 되고 있다. 인공 지능(AI)은 기계가 경험을 통해 학습하고 새로운 입력 내용에 따라 기존 지식을 조정하여, 사람과 같은 방식으로 과제를 수행 할 수 있도록 지원하는 기술이다. 인공지능을 구현하는 과정은 정보수집, 정보 사용을 위한 규칙 개발, 근사 또는 명확한 결론 도출 및 자기 교정이 포함된다. 인공지능의 발전은 양날의 검으로도 작용할 수 있는데, 많은 사람들이 인공지능 기술이 고용을 위협할 것이라는 두려움이 있으며, 그에 반하여 인공지능의 발전은 다양한 산업분야의 기술발전에 크게 기여할 것이라는 기대가 있다. 인공지능은 혁신적인 교육 방법부터 비즈니스, 산업현장의 프로세스 자동화에 이르기까지 다양한 분야에서 적용이 되고 있다.

헬스케어 산업에 있어서 인공지능 기술의 적용 가능 분야는 그림과 같이 다양한 분야에서 기여가 가능할 수 있다. 제약산업은 특성상 R&D 비용의 증가와 신약개발의 효율성 감소로 인하여, 신약개발 프로그램을 유지하는데 많은 어려움을 겪고 있다. 따라서 효율적인 신약개발을 위한 새로운 패러다임 전환이 필요한 시점이다. 따라서 제약산업의 경우에도 예외없이 인공지능을 적용한 신약개발 연구에 다수의 제약사가 관심을 가지고 활발한 연구를 진행하고 있다. 신약개발 과정에서 인공지능 기술을 적용이 가능한 분야는, 약물 개발전략 및 프로세스, 의약품 연구 개발 효율성 증대 및 인공지능 전문기업과 제약사의 파트너십을 통한 의약품 개발 파이프 라인 확대 등에 기여가 가능할 것으로 기대를 하고 있다.

인공지능은 기계 학습 (Machine Learning, ML)이라는 subfield가 포함되어 있는데, 1959년 ML의 선구자 중의 한명인 Arthur Samuel은 ML을 컴퓨터에게 명시적으로 프로그래밍 하지 않고 학습을 할 수 있는 능력을 주는 연구 분야로 정의 하였다. ML은 지도(supervised learning), 비지도(unsupervised learning) 및 강화 학습으로(reinforced) 분류할 수 있다. ML에서 지도 학습은 이미 정답이 주어진 상태에서 학습시키는 방법이다. 즉 주어진 입력 값에 대해 어떤 결과가 나올지 알고 있는 데이터를 이용하여, 모델을 만들고 새로운 데이터에 대해 결과값을 추정하는 방법이다. 비지도 학습의 경우에는 정답이 주어지지 않은 상태에서 기계 학습을 시킨다. 비지도 학습의 경우에는 수많은 데이터를 비슷한 특징에 따라 묶는(clustering) 방식으로 학습이 진행되며, 입력 값에 대한 목표치가 없으므로, 데이터에 숨겨져 있는 특징이나 패턴을 찾는 연구에 사용되는 방법이다.

강화 학습의 경우에는 학습을 지시하는 쪽이 원하는 답을 만들어 가기 위하여 사용하는 방법으로, 원하는 결과가 나왔을 경우에 보상(reward)이 주어지게 되며, 기계는 이 보상을 최대화 하는 방향으로 학습하게 된다. 즉 지도 학습과 비지도 학습은 데이터가 주어진 정적인 상태(static environment)에서 학습을 진행 하였다면, 강화 학습은 주어진 환경(state)에 대해 액션을 취하고 이로부터 보상(reward)를 얻으면서 학습을 진행하므로, 일종의 동적인 상태(dynamic environment)에서 데이터를 수집하는 과정까지 포함하는 알고리즘이다.

딥 러닝은 머신 러닝의 부분집합으로, 연속된 층(layer)에서 점진적으로 의미 있는 표현을 배우는데 강점이 있으며, 데이터로부터 표현을 학습하는 새로운 방식이다. 즉 입력된 데이터 값을 이용하여 여러 층을 통해 예상 결과 값을 만들고(매핑 과정), 실제 값과 비교하여 그 차이(타깃과 손실 함수)를 구한 후, 이 차이를 줄이기 위한 방법으로 앞의 층들의 가중치를 수정하는 과정(back propagation)을 반복적으로 수행하여 규칙을 계속 개선하는 과정을 거치게 된다.

저 분자 합성 신약 개발의 경우 이론적으로 생성할 수 있는 화합물의 공간(Chemical Space)은 1060개에 달하는 분자를 이론적으로 합성이 가능하다고 보고되고 있다. 지금까지 세상에 알려진 화합물의 수가 109인 것을 감안하면, 이와 같이 어마어마한 개수의 화합물 공간에서 새로운 의약품을 개발하는 것은 확률적으로도 매우 어려운 일이다. 따라서 인공지능 기술을 신약개발 전 분야에서 활용을 한다면, 신약개발의 비효율성과 불확실성을 어느정도 해소하는데 기여를 할 것으로 기대한다. 현 단계에서 인공지능 기술을 이용한 신약개발 연구에 적용할 수 있는 분야는, 질환 치료제에 대한 신규 표적 발굴, 검증, 신약 설계, 최적화, 지금까지 알려진 약물의 새로운 용도 발굴, 생물의학 정보 수집 및 분석과 같은 다양한 약물 개발 단계에서 적용이 가능하다. 세부적으로는 화합물에 대한 합성 경로 예측, 약리학적 특성 예측, 및 약물의 효능 예측 연구에도 적용이 가능하다. 더불어 오믹스(omics) 분석 데이터를 이용한 약물 타겟과 새로운 기전 연구 예측을 통하여 맞춤형 의약품 개발에 적용이 할 수 있다.

인공지능을 이용한 선도물질 개발의 최근 예로, 인실리코메디슨(https://insilico.com)이라는 인공지능기반 벤처회사에서 발표한 논문에 의하면, 새로운 인공지능 시스템(GENTRL이라 명명한 Deep Generative Model)을 개발하고, 이를 이용하여, 섬유증 및 기타 질환치료제로 적용이 가능한 DDR1 kinase target에 대한 저해 물질 발굴 내용을 소개 하였다. 이 모델은 DDR1과 기존에 알려진 저분자 화합물 데이터베이스를 학습하여 새로운 화합물을 도출하고, 실제 합성 연구를 수행하여 in vitro, in vivo 효능 평가를 통하여 우수한 활성을 물질을 단 기간 내에 발굴한 내용으로, 인공지능 기술을 적용할 경우 전통적인 방식으로 접근하는 연구 방법에 비해 연구 기간과 비용을 획기적으로 절감할 수 있다는 것을 보여준 의미가 있는 연구 결과이다.

또 다른 예로, 영국에 소재하고 있는 Exscientia(https://www.exscientia.ai )라는 회사에서 AI로 개발한 신약 후보물질이 임상 1상 시험에 들어 갔다는 소식이 올 초에 발표 되었다. 뉴스에 의하면 강박장애(OCD) 치료제 개발을 위해 Exscientia와 일본의 Sumitomo사와 공동으로, 인공지능 기술을 이용하여 DSP-1181이라는 임상 후보물질을 1년여 만에 도출하였다는 내용인데, 이는 전통적으로 임상에 들어가는 후보물질을 개발하는데 소요되는 기간이 통계적으로 5년 이상 소요되는 것을 감안하면 획기적인 연구 성과로 평가할 수 있다.

신약개발은 타겟 발굴부터 전임상 후보물질 선정까지 통계적으로 4.5년 정도가 소요되며, 이후 비임상, 임상 개발을 진행하여, 신약 판매허가를 받을 때까지 약 10년의 개발기간이 필요한 것으로 알려져 있다. 예외적으로 패스트트랙, 혁신의약품, 지정승인제도를 이용할 경우 획기적으로 개발기간을 단축 할 수 있지만, 일반적으로 비임상 부터 임상 시험 완료 후 제품 발매까지 개발기간을 단축하는 것은 용이하지 않은게 현실이다. 따라서 신약개발 기간과 비용을 줄일 가능성이 큰 단계는 전임상 후보물질 발굴 단계 전 까지라고 할 수 있으므로, 이 단계에서 AI를 적용할 경우 연구기간 단축과 비용을 줄이는데 크게 기여를 할 수 있을 것으로 기대된다.

앞에서 대표적인 예시를 들었지만, 최근 인공지능 기술을 이용한 신약개발에 대한 방법론과 연구결과에 대해서 다양한 논문과 뉴스가 나오고 있지만, 아직까지 의약품 개발분야에서는 초기 단계라서 국내 제약사의 경우에도 꾸준한 기술개발을 한다면 신약개발의 효율성 및 생산성을 크게 증대 시킬 수 있는 기회가 있다고 사료된다. 인공지능 기술을 이용하여 현재까지 신약이 출시된 예은 없지만, 향후 수년 내에 AI 적용 신약이 출시될 가능성은 매우 클 것으로 기대된다. 인공지능기술이 신약개발의 기간, 비용 단축 및 효율성 증대 측면에서 기여를 하려면, 필수적으로 인공지능을 활용한 분석결과를 실제 실험에서 검증하는 것이 필수적이다. 따라서 신약개발 연구에 필요한 타겟 발굴, 검증, 의약합성, 약효평가, 독성연구, MOA 분석 및 ADME 등 신약개발 전 분야의 전문가와 효과적인 협력 연구가 필수적이다.

참고문헌)
1.https://biocapitalist.tistory.com/19?category=975441
2.Segler, M.H.S. et al. (2018) Generating focused molecule libraries for drug discovery with recurrent neural networks. ACS Cent. Sci. 4, 120–131
3.Kit-Kay Mak, et al., (2019) Artificial intelligence in drug development: present status and future prospects. Drug Discovery Today, 24, 773-780
4.Zhavoronkov, A., Ivanenkov, Y.A., Aliper, A. et al. (2019) Deep learning enables rapid identification of potent DDR1 kinase inhibitors. Nat Biotechnol 37, 1038–1040
5.Paul, S.M. et al. (2010) How to improve R&D productivity: The pharmaceutical industry’s grand challenge. Nature Review Drug Discovery. 9(3), 203-214
6.https://www.europeanpharmaceuticalreview.com/news/112044/dsp-1181-drug-created-using-ai-enters-clinical-trials/

열람하신 정보에 대해 만족하십니까?