订阅
纠错
加入自媒体

英矽智能任峰:数据与算法优化是AI新药研发的壁垒,药企对AI制药的态度更加开放

2022-01-12 14:24
IPO早知道
关注

英矽智能与复星医药的合作或将开启AI制药与药企合作的转折点。

本文为IPO早知道原创

作者|罗宾

微信公众号|ipozaozhidao  

据IPO早知道消息,上海复星医药(集团)股份有限公司(下称“复星医药”,600196.SH,02196.HK)与端到端人工智能驱动的药物研发公司英矽智能(Insilico Medicine)于1月10日宣布达成合作协议,在全球范围内共同推进多个靶点的AI药物研发。

《IPO早知道》对话了英矽智能首席科学官任峰博士,他结合此次合作分析了AI制药行业最新的变化。

英矽智能首席科学官任峰博士(来源:受访者提供)

任峰表示:“以往药企对于AI赋能新药研发抱有试探性的态度,但现在越来越开放地进行共同的研发。这次合作从规模和首付款金额上看都是业内迄今最大的一次合作,我希望这次合作也能推动传统药企今后在与AI企业的合作上有更大的决心和步伐。”

此次战略合作包括针对四个指定靶点的以人工智能驱动的药物研发合作,以及双方对于英矽智能QPCTL项目的共同开发合作。根据协议,英矽智能将获得1300万美元的首付款,及里程碑式付款,并分享QPCTL项目的商业化利润。此外,复星医药将向英矽智能提供股权投资。

根据合作协议,英矽智能将负责为QPCTL项目提名临床前候选药物,并将该候选药物推进到临床前阶段,之后复星医药将对其展开临床阶段研究,共同推进该项目在全球范围内的开发。同时,复星医药的研发团队将提名四个靶点,由英矽智能的人工智能平台和研发团队进行评估和开发,并将候选药物推进到临床前阶段。作为合作的一部分,复星医药将获得英矽智能人工智能平台PandaOmics和Chemistry42的使用权,以推进公司内部人工智能驱动的药物发现和开发工作。

任峰表示,尽管很多AI公司都取得了进展,但AI还是个新事物,目前也没有任何一家AI公司可以证明它的算法是最好、最正确的。只有保持算法的优化能力,AI赋能药物研发的公司才能维持自己的竞争力,而算法优化的能力需要经过长时间的验证、积累,所以难以被复制。此外,数据的标准化也是这个行业中的企业壁垒。所以未来AI公司的竞争会从单纯的算法、项目层面的竞争进化为数据独特性的竞争。

以下是《IPO早知道》精编整理的对话内容:

Q:IPO早知道

A:任峰

Q:英矽智能此次与复星医药的合作背景、双方价值与能力的匹配点是什么?

A:这次合作以股权投资加项目合作的方式展开,包括QPCTL项目的共同开发。QPCTL之前是我们内部的一个自研项目,QPCTL是CD47信号通路中的一个靶点,我们在针对此靶点的早期动物实验中看到它对癌症的免疫治疗有非常好的效果。复星看到了此项目的价值,同时也想利用我们的人工智能平台赋能他们希望推进的另外几个靶点,所以在这个背景下双方达成了这次的研发合作。在AI制药公司与药企的临床前合作项目中,我们此次合作无论是从规模还是首付款都是至今最大的,可以说开创了一个先河。双方进行了很充分的沟通,复星不仅认可我们的在研项目,也认可我们端到端的药物研发平台及我们的团队,通过股权投资的形式,希望能跟我们一起成长,而复星的临床研究和后续商业化实力很强,与我们能形成优势互补。

Q:药企对AI制药的态度从谨慎转变到更大规模的合作,对行业的未来影响会是什么?

A:我们相信这对行业是很大的利好。去年以来,我们陆续看到国外的大药企与AI制药公司达成重磅合作,这代表这大药企对AI制药的态度越来越开放。相对来说,国内药企和AI制药的合作还处在试水阶段,合作规模小、项目数量少、首付款较低,药企希望看到一些里程碑进展后再扩大合作金额和规模。本次我们的合作伙伴复星医药对于创新性的药物研发有魄力和远见,例如,它也是国内第一个引进CAR-T项目的企业。我希望我们这次的合作能够对国内AI制药领域有一定的推动作用,希望大家对国内药企和AI制药公司之间的合作模式有新的思考,希望它们在AI赋能新药研发上步子迈得更大一些,合作方式的改变对新药研发行业来说也是很大的助力。

Q:英矽智能如何选定与药企的合作内容确保大家目标的一致性?

A:首先我们倾向于寻找与我们的资源优势互补的药企,比如在临床前评价、临床试验或商业化上有优势的企业,我们能很好地展开互补协作。第二,我们希望选择双方都感兴趣的合作项目,这样可以保证项目的持续推进,不会因为一方的中途退出导致项目搁浅。第三,我们也希望能研究一些真正能解决未满足的临床需求的项目,而非纯粹拼速度的项目,避免不必要的竞争,把资源集中用到真正需要的地方。

Q:我们有端到端的AI药物研发平台,其研发链条中所训练数据的标准化程度现在发展到哪了?

A:现在标准化还并不成熟,因为不同实验室或是不同的公司数据标准化程度都不一样,这就为我们用大数据去训练AI模型造成了一定挑战。当然我们有自己的解决方案,比如我们通过转录组学的公开数据库来训练靶点发现平台。我们的生物信息团队会把我们认为能用、好用的数据进行过滤和标准化处理转化成机器可读的格式,来进行机器学习。

在转录组学数据处理过程中我们不能把来源不同的数据直接整合到一起,而是分成了不同模块的数据,避免数据之间的相互污染。虽然数据总量很大,但我们是通过小块学习来训练我们的模型的,否则容易出问题。这也是一种联邦学习的方法。

Q:现在AI算法迭代的频率有变化了吗?

A:我们认为反而不是“迭代”这个词,而是“淘汰”这个词。以我们的Chemistry42平台为例,我们自己从2016年开始做化学方面的算法,刚开始我们发展了170多种算法去产生小分子化合物,我们基本上把当时能想到的算法都包括了。后面我们通过自研项目和对外合作,发现在170多种算法里有140多种没有产生过所需要的小分子化合物,于是我们将它们淘汰掉,留下约30种算法,它们持续帮我们产生有用的化合物。可能再过几年,算法会继续缩减,这样命中率也会越来越高,因为产生不理想结果的算法被淘汰掉了。另一方面,我认为所谓迭代,很难去加入新的算法,虽然我们也在尝试加入,但这些新算法还是要通过试验来证明它是好是坏,这又需要三四年的时间。总结来看,这是以不断验证为前提,留下或淘汰算法的过程。

Q:经过验证的时间本身也是我们的一种竞争的壁垒。

A:是的,理论上AI公司用的都是公开数据,底层算法也没有专利保护,大家都能做数据的训练,这方面壁垒很小,但我们有的更多是know-how的壁垒,我们的算法从170种浓缩到30种,但这个过程是难以复制的,大家的命中率就产生了差别。

另一点还是数据的壁垒。我们刚讨论的转录组学数据虽然是公开的,但我们生物信息团队花了将近7年时间完成可用数据的筛选和一些标准化的过程。虽然大家都想做这样的处理,但都是需要投资时间、精力和财力的。

Q:我们的新靶点、疑难靶点发现方面,如何基于优势立项管线?

A:我们是AI赋能的新药研发公司,所以潜在项目首先是要我们的靶点发现平台能够赋能的靶点,具体来说我们可以利用患者的转录组学数据来寻找新的靶点。我们选择的靶点中百分之70-80%是有临床I期或II期试验结果的靶点,20%左右是全新靶点,这样可以平衡我们的风险和收益。在这百分之70-80%的靶点里,我们通过自己的数据处理,识别出它目前在临床阶段的化合物哪些有缺陷,然后我们会针对有缺陷的化合物进行改造,以此来确定要选择的靶点。

Q:中国的AI制药在人才、资金上都比以前到位了,现在决定AI企业进步速度的是什么?未来会有马太效应吗?

A:马太效应是会有的,相对头部的公司规模更大的话有利于它吸引人才和资金。但另一方面,AI还是个新事物,到目前为止没有任何一家AI制药公司可以百分之百证明它的算法是最好的,是完全正确的,所以后来者也有机会去赶超。虽然有的公司是近两年才成立的,但它有可能因此避免掉很多更早的AI公司所走过的弯路。而且算法更新的永远是更好的,一家独大的机会在这个领域不容易出现。暂时领先的公司需要通过不断优化自己的算法去保持竞争上的优势,而后来者如果专注于它所擅长的领域,有可能它的算法能变成某一领域最好的。

而且再往后发展,AI公司的竞争会从单纯的算法、项目层面的竞争进化为数据之间的竞争,我们可以看到很多AI公司已经开始想办法收集自己独有的数据,也就是按照自己的算法需求处理的数据,保证自己数据的独特性,比如我们自己的转录组学数据。

Q:除了公开数据,我们与药企合作时使用的数据会帮助我们提升算法吗?

A:这种数据分享情况很少,因为通常我们与药企的协议有很强的排他性,也就是说我们不能把这一次合作中的数据应用在其他的任何项目中。

Q:薛定谔等物理计算的AI企业也有自己的商业模式,也获得了中国药企合作。物理计算、AI计算两种AI技术路径将分别发挥什么作用?

A:这个问题本质上是CADD和AIDD的区别。薛定谔的软件基于量子力学的计算,比如薛定谔可以把小分子和蛋白之间的能量计算得非常精确,它是把已经生成的小分子与蛋白质的结合做一些排序,属于CADD(计算机辅助药物设计)的范畴。而AIDD(AI驱动的药物设计)不涉及量子力学计算,它是对已知规律的归纳总结。

AIDD的输入端是某种化合物结构,机器学习能够总结某种结构对应某种活性并演绎出来,所以计算的产出就是帮助我们设计出更好的小分子化合物。比如针对一个蛋白,我们的Chemistry42能产生上百到上千个能跟其结合的小分子化合物,但是它们的结合能力有多强,可以由CADD的方法对这上千个的化合物进行排序。

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

人工智能 猎头职位 更多
文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号