编者按
随着生物医学、生命科学及信息技术领域的快速发展,新技术、新模式正在以前所未有的速度融入医药研发,其中最值得关注的是人工智能(AI)在制药行业的广泛应用。本版邀请专家围绕AI在制药行业的应用及面临的挑战、AI药物研发展望进行解读。文章分上、下两篇,敬请关注。
□ 侯小龙
近年来,AI被广泛应用于多个行业,给社会生活带来很大改变。在制药行业,AI也有诸多应用。如,应用于药物研发的靶点发现、化合物设计与合成、ADMET(药物的吸收、分配、代谢、排泄和毒性)性质和理化性质预测、药物临床试验设计和管理、药物警戒应用及真实世界证据生成等多个流程和环节,大大提高了药物研发效率。那么,AI应用于制药的逻辑是什么?AI如何改变药物研发?这需要从制药行业的困境说起。
制药困境
过去数十年,许多科学技术和管理因素都取得巨大进步,对提高药物研发生产率起到积极的推动作用。然而,自1950年以来,每10亿美元研发投入获得批准的新药数量几乎每9年减少一半,该趋势在过去60年间非常稳定,被称为制药行业的反摩尔定律。这一现象导致新药开发成本越来越高,药物研发面临严重的生产力危机。
关于反摩尔定律主要有3种解释,即低垂果实假设(好摘的果子被摘走了)、监管障碍假设(新药申报的监管要求不断提高)及研发模式问题。前两种解释都是客观事实,难以改变,那么,对于第三种解释,是否有更好的药物研发模式?这是制药行业一直在思考的问题。
制药行业在遭遇生产力困境的同时,也面临数据困境。
随着数字化信息化快速推进、药物研发设备不断升级及研发数据长期积累,可用的药物研发数据越来越多,以至于在一定时间范围内无法使用常规方法和软件工具分析和处理所有数据。传统的统计学在浩瀚的药物研发大数据面前越来越力不从心。日益增长的数据处理需求,与现有数据分析能力之间的矛盾,推动制药行业寻求新的出路。
多场景应用
2016年3月,AI程序AlphaGo大胜韩国棋手李世石,是AI发展史上的里程碑事件。这一事件加快了AI在诸多领域的探索和应用,也让制药行业看到了提高药物研发生产率的希望。此后,AI在制药行业的技术测试大量开展,以数据为中心的药物发现逐渐走上舞台。
在随后的几年时间里,AI制药逐渐 “升温”:概念验证研究持续开展,大量资本涌入AI驱动的生物技术初创公司,制药公司与AI生物技术公司、AI技术供应商之间的合作越来越多……一些领先的制药公司认为,AI不仅是一个先导化合物发现工具,还是一个促进生物学研究、发现新的生物靶点、开发新的疾病模型的通用工具。
数年间,AI已经被尝试应用于药物研发的几乎所有流程和环节,主要有以下几个方面:
一是靶点确认。靶点确认是药物开发的关键步骤,也是最复杂的步骤之一。目前已知的药物靶点大多为蛋白质,通过机器学习的方法,从蛋白质原始信息中提取特征,构建准确稳定的模型进行功能推断、预测和分类,已成为靶点研究的重要手段。从患者样本及海量的生物医学资料中提取基因组学、蛋白质组学、代谢组学等多组学数据,借助深度学习分析非疾病和疾病状态的差异,也可用来发现对疾病有影响的蛋白质。
二是基于表型的药物发现。近年来,基于表型的药物发现(直接使用生物系统进行新药筛选)受到关注。机器学习可以在表型筛选中将细胞表型与化合物作用方式联系起来,获得靶点、信号通路或遗传疾病关联的聚类。而AI强大的图像处理能力,能够将生物系统的所有形态特征整合,系统研究药物潜在的作用方式和信号通路,扩展对于疾病的生物学认识。
三是分子生成。机器学习可以产生新的小分子。AI可以通过对海量化合物或者药物分子的学习,获得化合物分子结构和成药性方面的规律,进而根据这些规律生成很多新的化合物作为候选药物分子,有效构建拥有一定规模且高质量的分子库。
四是化学反应设计。AI目前正在取得进展的化学领域之一,是对化学反应和合成路线进行建模和预测。AI可以将分子结构映射为可以由机器学习算法处理的形式,根据已知化合物的结构,形成多条合成路线,并推荐最佳合成路线。反过来,在给定反应物的情况下,深度学习、迁移学习可以预测化学反应结果。AI还可用来探索新的化学反应。
五是化合物筛选。AI能够对化合物化学结构与生物活性之间的关系进行建模,预测化合物的作用机制。如,MIT的研究人员基于深度学习发现了新的抗生素。
六是ADMET性质预测。药代动力学性质不理想,是临床研究阶段药物研发失败的主要原因之一。深度学习可以自动识别化合物的相关特征,评估数据集中多个ADMET参数之间的隐藏关系和趋势,预测化合物的细胞渗透性和溶解性等性质。
七是药物临床试验。AI在临床试验的设计、管理及患者招募方面皆有应用潜力。自然语言处理技术可从各种结构化和非结构化数据类型中提取信息,找到符合临床试验入组标准的受试者;也可用于关联各种大型数据集,找到变量之间的潜在关系,改进患者与试验的匹配情况。诺华已使用机器学习算法监控和管理所有的临床试验。
八是药物警戒。随着监管要求的日趋严格及患者安全意识的不断提高,药物警戒的工作量和成本大大增加。AI可以将药物不良反应从接收到报告的整个流程实现自动化,优化药物警戒工作并降低成本。AI系统还可能通过预测能力开展药物风险评估。
九是真实世界研究。AI为分析大型多维真实世界数据提供了新的策略。AI能够识别真实世界数据的内在关联,生成新的假设,也能为临床试验提供新的信息。
此外,AI在药物研发中的应用还包括理化性质预测、药物重定向、制剂开发等。
问题显现
AI在药物研发中的应用并非一帆风顺,如何与制药场景相互“适配”仍然待解。
对于制药行业来说,应主动适应AI的适用条件。AI对于适用对象的相关条件有诸多要求,基于AI的药物研发需要配备数据、算法、算力,其中对数据的要求最为严格。
传统的药物研发以实验科学为主。数十年来,药物研发数据的记录、整理和储存都以实验为核心,根据实验的需求进行调整,数据只是实验的“附属”。而AI直接从数据入手,将数据放在第一位,对于数据的格式、标准、质量、数量都有内在的要求。在这样的情况下,AI直接使用传统药物研发模式的数据往往遇到困难。
对于AI来说,进入制药行业主场,就应当遵循制药的规律。比如,药物开发是一个多维同步优化的过程,鉴于数据的大规模和复杂性,基于AI的药物研发往往需要重写机器学习算法,而不是简单地调用。AI与制药行业核心业务的深度融合,需要更深刻的行业理解力和更高的技术准确率。AI虽然已经可以从大量已知论文、实验数据中挖掘新的知识,改变了传统基于学术经验的研究方式,然而方法的准确性、可解释性、可重复性等还有待提高。
此外,传统的药物研发模式已有相对健全的监管政策和行业体系。作为一种新的模式,AI在制药行业的应用探索,也需要相应的监管政策和行业体系予以规范和引导。