AI制药领域将迎来行业大爆发?看看专家怎么说
AI制药领域将迎来行业大爆发?看看专家怎么说AI技术到底能在多大程度上影响一颗新药的诞生?未来十年,AI技术又将如何实质性地颠覆生命科学领域?5月10日,“首届中国生物计算大会”
AI技术到底能在多大程度上影响一颗新药的诞生?未来十年,AI技术又将如何实质性地颠覆生命科学领域?
5月10日,“首届中国生物计算大会” 在苏州金鸡湖畔拉开帷幕,产、学、研、资界专家围绕 “BT&IT” 主题,从各自领域出发,从不同角度探讨生物计算的定义、边界以及 AI 对于生物数据的意义。此次大会由中国首家生物计算技术驱动的生命科学公司百图生科,与致力于 IT 和 BT 交叉融合的创新孵化中心播禾创新共同主办。
在国际视角下的生物计算新孵化专场,进行了两场极具深度且充满干货的圆桌讨论,其中一场是由百图生科联合创始人&CEO刘维、恒瑞医药高级副总经理兼全球研发负责人张连山、药明康德联席CEO杨青、佐治亚理工学院机器学习中心副主任宋乐、清华大学智慧产业研究院首席科学家马维英五位嘉宾共同参与的圆桌对话,动脉网对场上嘉宾的精彩观点进行了不改变原意的整理,以飨读者:
刘维:首先请各位结合各自在生物计算领域所做的探索,进行一个简单的自我介绍。
张连山:我来自江苏恒瑞,主要负责公司研发。我们公司在设计领域开始地比较早,至少五年之前已经跟很多公司做过接触。过去,我们是从“猜”做药,那时能做的靶点非常多,给社会和患者带来了很大的红利。但到今天形势已经变得复杂,很难再找到一个新的靶点。所以我们需要AI帮助,利用计算机辅助制药的发现。
很多患者认为一款新药太贵,这是因为新药研发的成本极高,一款新药的落地需要10亿美金甚至更贵。事实上,研发成本还在不断上升。今天我想通过与同行和跨领域的科学技术研究者来探讨一种新的模式,努力把做药的成本降下来。
马维英:我在这个领域是最新进入的研究人员,过去20年一直在互联网做搜索、做推荐,做内容生成,都是比较传统的AI领域,例如计算机视觉、自然语义处理、语音、机器翻译、个性化推荐算法方面。
为什么开始对这个AI新药这个领域感兴趣呢?2019年,我开始注意到做自然语言处理的与新药发现这两个领域产生交叉,也就从那个时候进入这个领域。我相信随着生命科学数据的累计到了一定阶段,接下来十年,AI在生命科学、生物计算领域会有一个非常大的爆发和蓬勃的发展态势,就相当于过去20年互联网时代的发展。
所以我最近常常跟AI领域的同事说,你们不要在红海里面“拧毛巾”了,不管是视觉、自然语言理解都有非常多的事情可以做。今天在生命科学领域,我们把已有的工具借鉴过来,就会产生非常大的突破。AI新药市场还是一片蓝海,拥有巨大的机会。
随着个体化精准医疗时代的到来,越来越多的个性化治疗方案被推出,比如一些免疫疗法。但目前这些疗法对于患者来说还是太贵,精度也还不够高。如果AI介入提升新药研发效率,把这些个性化疗法的价格降下来,把基因测序价格降下来,缩短新药研发时间,把精度提升上去,无疑会颠覆现有的医疗行业。
宋乐:我是百图生科的顾问宋乐,我的背景和马老师有很多重叠的地方,在过去大部分时间在AI和互联网领域,研究AI对模态的数据分析,图像、文本和复杂网络的数据分析。我在学术界也做了很多关于生物数据的分析,包括多组学数据、小分子数据分析等。
目前在互联网上有很多公开的数据集,有各种各样的手段能够测量生物很多不同的指标,似乎是已经到了一个点。通过AI的方法,通过把公开的数据集合在一起,为新药的发现起到助力作用。
刘维:场上嘉宾有来自大药企生态链的高管都对生物计算持拥抱态度,邀请你们此次前来参会也正是因为我们看到了这一点。你们各自公司自身内部都有很大的团队在做这方面的研发,在对外合作层面也有非常多的尝试。作为传统药物研发企业,你们认为还有什么机会是留给外面的AI药物发现?有哪些事是你们传统企业做不了,希望他们来做的?
张连山:在做药方面,我们对AI非常有兴趣。政府和国家层面都希望药企做一个First-in-Class的东西,但目前我们很难找到全新的靶点。能不能通过应用AI来解决这类问题,提高药物研发效率、降低研发成本,目前的探索还处于初期。
此外,现在我们倡导精准诊断、精准治疗。由于每一个药对不同的患者不一定都有效,如果没效的话对于患者来讲带来的就剩下药物的副作用。如果AI技术能够帮助我们提高进行精准诊断、精准治疗的效率,降低成本,我们就可以腾出更多的资源去做更重要的事情。
刘维:大家是否愿意把数据开放给AI领域的伙伴?这是一个通用的问题。同时我们也请两位AI方面的专家来谈一谈,如果他们回答是“yes”,你们最想要什么数据来加速模型的构建?
张连山:我们研发新药是从一个靶点开始,这个信息完全可以跟大家共同享受。我要的是分子,至于里面的知识也是可以跟大家共同享受的。
马维英:最近我注意到美国有几个大学在做一件事情叫TDC(Therapeutics Data Commons),这是一个机器学习在生物医药的大规模公开数据集。TDC包含了20+有意义的任务和70多个高质量数据集,从靶蛋白的发现,药物动力学,安全性,药物生产都有包含。20几个任务由专门的生命科学专家定出,又有标准化的表达。在这个公开数据集出来以后,就会有很多聪明的人进行竞赛,想办法提高数据精度。这个发展模式蛮值得我们参考。如果生命科学领域联合AI人才共同推进该领域的发展,我个人觉得是一个非常好的方式。
另外一个维度——个人健康管理也值得思考。目前,我们有越来越多的个人健康管理工具,包含可穿戴设备。AI赋能个人健康,让个人积极主动参与健康管理,贡献数据。用一个开放的模式驱动数据AI在医疗、生命健康领域发展,这是蛮值得参考的方式。总的来讲,AI还是靠数据。我个人觉得随着时间的积累,数据的问题会被解决。
宋乐:我很赞同马老师说的一些观点,包括在医药行业如果能够设计一些数据集和问题,就会发动更多的人参与,用AI来挖掘、探索新药的靶点或者药物设计的问题。这里非常重要的一个点就是在数据和AI模型之间产生闭环系统,让更多人尝试用系统发现新的药物靶点或者成药的可能性。
用AI去赋能升级实验平台其实和互联网的发展有很多相似之处,比如用户搜索平台和平台智能推荐搜索可以相辅相成。当AI的数据库平台建立起来后,用户通过使用平台会更新AI的模型,AI的模型会对用户产生一些新的推荐,用户根据推荐做一些相应的操作,就会有越来越多的数据在平台上积累。但如果没有数据和AI模型闭环的操作,就很难看到AI的模型进行不断迭代和提高。
刘维:我挺同意马老师和宋老师的观点,我们百图生科也很想做宋老师说的闭环系统,我们将自己定位为一些创新药物领域的“创新药厂”,希望能够在这些领域能够解决这几点问题:一是行业数据稀缺,比如说董晨老师提到的免疫靶点的数据,尤其是自身免疫性疾病领域,整个行业都是稀缺的,大药厂内部数据也有限;第二是怎么把闭环的验证能力建立起来,无论是我们自己利用数据集进行更好的学习、验证,还是为行业更多的AI伙伴提供循环,让大家可以围绕新的数据挖掘出新的可能性,再去赋能传统的大型药厂,看看能否围绕这些数据做后续的研发。围绕新的数据集和新的计算方法的初期尝试,其实失败率还是比较高的,需要比较长周期的尝试和验证才能符合大药厂的标准。
张连山:目前有各种各样的数据,比如多组学、基因、免疫等等,但难的是如何把似乎不相关的数据通过AI处理串联起相关性,找到实质性的东西,我认为这是这个领域想发展起来首先需要解决的问题。
刘维:是的,很多数据存在批次效应,散在各处的标准化程度不够。标准化程度不够在以前数据的颗粒度比较粗的时候不太会形成实质性的阻碍,但随着目前数据的颗粒度越来越细的时候,误差可能就会掩盖规律。
马维英:如何把看似不相关的数据、知识关联起来真的很重要,尤其是在生命科学这一非常需要专业知识储备的领域。目前的AI制药公司,还只是做到把小分子化合物推演出来交给后面,但他也不知道怎么引导、去搜索更好的药物空间,这在目前还是一个断裂的。
我认为的确需要把知识引擎、知识图谱规则的东西引入到深度学习里面。生命科学也提供了一个新的土壤,让AI继续往前突破,把知识跟符号逻辑,跟统计,跟纯数据驱动的,或者原来是模型驱动和数据驱动进一步结合,再把实验室打通。我相信将来这个链条越通畅我们整个流程会转得越快,创新也会越快,新的科学发现也会越快。
刘维:现在有一个词叫做“计算可成药性”或者叫“计算药物”,如果没有生物计算,这个药不太能够做出来,或者说是转化率太低,没有人敢做。我想问大家比较看好哪一个细分领域,会因为生物计算出现一大批的创新药物?
张连山:我觉得是在国内的小分子领域会有一些突破,我也很有信心我们能做到这一点。
马维英:我个人的理解是如果是在已有的靶点的基础上用AI的方法去推断结构,预测功能。此外,我认为一个新的机会是将来AI成药性能更加精准化、个体化。
宋乐:我很赞同马老师的观点。除此之外,我的另外一个理解就是AI可以在哪些方面能够助力现在的新药开发。目前该领域已经有一些公开数据集存在但散落在不同的角落。为了发现一个新的靶点或设计一款新的药物,我们能否把这些纷繁复杂的数据组合起来,通过AI的模型进行数据统计、分析和推理,或者通过AI来筛选比如小分子结构、蛋白质结构等。在这样的情况下,AI会助力传统医药研发进步,带来突破。
刘维:我自己的选择跟两家大药厂的不太一样。百图生科会把更多的重心放在大分子药物的设计中。刚刚马老师也提到蛋白质本质上也是一种语言,包括它的序列、结构预测的进程等,会对整个状态空间起到了辅助探索的作用。我们自身会围绕复杂动态免疫问题,复杂的可编程抗体等作为我们重要的探索方向,希望在这个过程中实现比较精准的,针对动态免疫组装的免疫药物。
因为时间关系,今天我们就交流到这里,谢谢各位。
作者:陈宣合
-
网信办发布《汽车数据管理规定》,信息需在境内存储2021-05-14
-
乘联会发布4月乘用车产销数据:一汽-大众领跑,长安进前三甲2021-05-12
-
人口普查数据出炉,医健行业这些领域将受到影响2021-05-12
-
乘联会公布国内乘用车市场最新销量数据2021-05-12
-
智能驾驶系统数据流构成及其分析2021-05-12
-
数据中心全产业链梳理解析2021-05-12
-
猿辅导xDorisDB:构建统一OLAP平台,全面升级数据分析能力2021-05-11
-
全球数据库格局迎来关键之变,阿里云稳居第一阵营2021-05-11
-
吉利汽车4月销量数据公布:高达100331辆2021-05-11
-
大数据守护城市安全,蜜度信息亮相首届长三角应急博览会2021-05-10
-
行业增长势头明显,数据中台市场规模2023年将达183.2亿元!2021-05-10
-
扫地机器人哪个牌子好?2021全电商平台扫地机销售数据前十名统计2021-05-08
-
维权余波:特斯拉给出车联网数据管理新方案2021-05-06
-
Redis常见数据结构以及使用场景分别是什么?2021-05-04
-
数据泄露:外贼易挡,家贼难防2021-05-01