|PROFILE

团队名称:GeminiMol团队

名次:一等奖

紧张成员:王世航、王林、周泳锜、杨皓、田思源

上科大年夜团队带来双子座模型AI筛选药物若何实现集百家之长

上海科技大学

GeminiMol团队

“在药物设计中,我们常日有两种紧张策略:一种是基于靶标构造来设计与其适配并强结合的分子,即基于构造的药物设计。
另一种是基于以确定有药效活性的分子设计构造类似且具备附近药效活性的分子,也便是基于配体的药物设计。
”上海科技大学白芳课题组硕士研究生、2023上海国际打算生物学创新大赛GeminiMol团队队长王世航向先容道,“GeminiMol团队的名字源自于我们课题组开拓的一个名为GeminiMol的AI模型,它可以用于基于配体的药物创造在内的多种药物设计任务,这也是我们团队参赛的‘核心武器’。

Gemini意为“双子座”,

Mol则代表分子表征模型,

AI筛选药物技能路线百花齐放,

这一“双子座”模型会带来哪些新特性?

GeminiMol团队在打算生物学大赛中,

做了一场实验→

1

基于已有配体来开拓新分子,

药效会更好吗?

GeminiMol由上科大白芳课题组2024届博士毕业生、现苏州系统医学研究所博士后王林博士在导师的辅导下开拓完成,该模型基于分子间构象空间相似性比拟学习来进行演习,能够表征药物小分子的构象空间特色,全面反应与分子构造干系的分子属性、潜在药效性子等,进而在包括基于配体的虚拟筛选、靶标鉴定、分子属性预测等多种药物创造任务上表现出均衡的优秀性能。
近日,该模型干系论文“Conformational Space Profiling Enhances Generic Molecular Representation for AI-powered Ligand-based Drug Discovery”已发布于国际期刊Advanced Science杂志。

“构象空间是我们GeminiMol的一大亮点。
”王林向先容道,一个小分子在溶液里会有动态、灵巧的三维构象变革,而药物分子在不同靶标上发挥药效时也可能是多种不同的三维构象,“我们在演习模型的时候就考虑到了这种动态构象变革,从而使得我们的模型能够更好捕捉到分子的动态性子。
”也正由于构象空间的引入,该模型能够识别2D构造不相似,但3D构象相似的潜在活性分子,有助于创造具有新颖构造的先导化合物。

据透露,这也是首次在AI模型中大规模采取小分子的构象空间信息进行演习,“在初期,团队花费了大量韶光进行构象采样,但模型演习完成后,构象空间信息已被充分映射并隐含在模型中。
因此,在后续的高通量筛选中,打算速率非常快。
以本次比赛为例,1800万个化合物分子,我们的模型仅仅用了不到1个小时的韶光就完成了筛选评价。

除了创新性地引入构象空间信息外,GeminiMol还采取了基于分子间相似性的比拟学习策略,显著提高了分子表征的预演习效率。
这使得模型能够在一个小型分子集上进行演习,并在涉及数百万个分子的zero-shot任务和QSAR任务中实现广泛推广,同时在性能上优于现有的公开药物筛选方法。

一方面,一个初始的“苗头分子”本身也须要进行改造,“我们不能确保比原有的更好,但是它能有相称的活性,从药物研发角度来讲,我们也是要在苗头分子有一定的活性的根本下,再进行多轮的优化和改造,才可以向真正的药物去推广。

而另一方面,AI大模型在筛选过程中可以“集百家之长”。
“我们实际上做的时候,不是只基于一个分子来参考的,可能同时借鉴了活性均较佳的两三个构造不同的分子,那么在这种情形下,很可能我们得到的新分子就能兼具两个活性分子的药效特色或者构造信息,依次类推,如有更多的先验活性分子,我们可能会有更多样化的候选分子。

2

打算生物学,

互助与交叉同样主要

GeminiMol团队成员5人均为白芳课题组研究生。
他们的专业教诲背景、研究方向各不相同:基于AI的分子性子建模,分子动力学,蛋白互作抑制剂设计……在他们的导师、上海科技大学生命科学与技能学院/免疫化学研究所研究员白芳看来,实在团队中的五位同学,都具有各自独当一壁的能力,而这也正是要让他们以团队形式参赛的缘故原由。

“我们团队成员的背景多样,有药学、生物学以及打算机科学的。
除了每个人须要节制跨学科的知识外,在打算生物学领域,互助实在是非常主要的。
通过扬长避短,密切互助,我们能够取得更好的成果。
”团队成员周泳锜这样说道。

事实上,团队成员在比赛期间的项目操作过程中,也碰着了一些客不雅观的困难。
“主理方供应了大规模的化合物数据库,我们在打算分子相似性前,须要先提取分子的GeminiMol特色。
在这一过程中,面临了打算资源紧张的问题,在利用我们自己的打算集群推演过程中,程序几分钟就超负荷崩溃了。
”王世航向说道,不过团队并没有因此被打倒,而是通过任务切割、并行打算,来优化操作工艺,使得准备事情能够在同等质量下完成。

3

打算生物学不同路线百花齐放

比赛赛题证明模型普适性

本届大赛聚焦药物筛选AI算法,以NMDA(n-methyl-d-aspartate,n-甲基-d-天冬氨酸)受体为靶标的药物虚拟筛选为赛题场景。

“由于机制的繁芜性,离子通道一贯被认为是药物创造中颇具寻衅的一类靶标。
我们团队此前在离子通道方面的药物研发上并没有什么履历,”白芳总结道,“不过在这次比赛中,我们的方法在这一极具寻衅性的靶标上表现也相称不错,这证明了我们的方法具有很强的普适性”。

当前,打算生物学领域中,各种方法或技能路线正百花齐放。
“现在还没有哪种方法是百分之百完美的。
很大程度上,采取何种方法取决于它的运用体系本身的特点和背后的科学问题,”白芳向先容道,“根据详细的科学问题,对方法进行重新组装或优化,乃至调度底层算法,这些都是可能的”。

有趣的是,白芳辅导的学生中共有三支军队参赛,并且都顺利通过了初赛,个中两支军队进入了前五。
白芳向坦言,这三支军队的技能路线不同,分别为:纯AI队、AI与物理模型领悟队以及物理模型队。
个中,GeminiMol团队定位为纯AI队。

“这是一场有趣的实验,我们想要通过这个比赛来探索:当下AI在药物研发中,到底能发挥多大的浸染?”白芳阐明道,“我们一贯强调,药物研发是一个非常繁芜的过程,AI不能办理所有问题,传统的CADD(打算机赞助药物设计)也仍旧有很主要的代价。

据透露,GeminiMol团队终极确定6个靶向NAM位点的分子,5个靶向LBD位点的分子,1个靶向TMD位点的分子。
终极,2个化合物在初评中表现出活性,个中的一个化合物进入了复审阶段。

对付参赛成果的后续转化,白芳表示,“希望能够进一步与实验验证团队协作,共同推进未来的开拓事情。
但从药物研发的角度来看,这目前只是一个初步的苗头分子,离真正的药物还有很远的路要走,还须要更多的投入和韶光”。

企业及专家不雅观点不代表官方态度

↓分享

↓点赞

↓在看

特殊声明:本文经上不雅观新闻客户真个“上不雅观号”入驻单位授权发布,仅代表该入驻单位不雅观点,“上不雅观新闻”仅为信息发布平台,如您认为发布内容陵犯您的干系权柄,请联系删除!