作者丨苏北佛楼蜜

题图丨视觉中国

近日,科学打破奖基金会宣告了2023科学打破奖(Breakthrough Prize)获奖名单。
科学打破奖有“科学界的奥斯卡”之称,它旨在表彰在生命科学、根本物理学和数学方面的打破性造诣。

谷歌DeepMind科学家因开拓人工智能 (AI) 系统而得到了300万美元的奖金,该系统预测了险些所有已知蛋白质如何折叠成3D形状。

AI在蛋白折叠里再一次战胜人类

研究职员利用AlphaFold程序实现了这一壮举,该程序于2018岁首年月次开拓并于2021年7月对外公开拓布。
开源程序可以根据构成蛋白质的氨基酸序列预测蛋白质的3D构造
蛋白质的构造决定了它的功能,因此AlphaFold识别2亿个蛋白质构造的能力让自己成为了帮助识别人类可以利用新蛋白质的主力军。

早在发布之初,中国生物构造学领军人物、西湖大学校长施一公就曾评价称:“依我之见,这是人工智能对科学领域最大的一次贡献,也是人类在 21 世纪取得的最主要的科学打破之一。

有名药企Dewpoint Therapeutics董事会成员兼计策顾问、Relay Therapeutics联合创始人Mark Murcko也认为,AlphaFold已经打开了一个工具箱,并向全天下展示了可能的东西。

“现在我们将有几十个实验室,每个实验室都在思考略有不同的问题集,包括蛋白质-配体构造的预测、变构口袋的成药性、蛋白质-蛋白质相互浸染和RNA靶标,以及疫苗免疫原和从头治疗性蛋白质的设计。
”Mark Murcko在曾采访中表示。

从正式发布到这次的得奖已经由去了4年韶光,业内有关AlphaFold的谈论始终更没有终止,从最开始科学界的为之振奋到现阶段更多运用的展开,如今,4岁的AlphaFold也给科学家带来了新的惊喜。

成功预测蛋白质构造为什么如此主要,新技能又能给人类社会带来哪些便益?

生物“骨架”

蛋白质是组成人体所有细胞和组织的主要身分。
在我们体内,险些所有主要组成部分都有蛋白质的影子。
此外,蛋白质是生命的物质根本,没有蛋白质就没有生命,它还是构成细胞的最基本的有机物,担当着生命活动承担者的角色。

在蛋白质中,氨基酸为最基本的组成单位,它是将生命和其他各种样式的生命活动联系在一起的基本物质。
人体内的蛋白质分为很多种类型,它们的浸染、性子各不相同,但所有蛋白质都是由20种氨基酸按照不同的比例相互组合而成的,并且在体内不断进行着更新和代谢。

他们就像眇小的、难以理解的谜题,存在于细菌、植物、动物各种生物体中,当它们被制造出来时,会在几毫秒内折叠起来,但其构造非常繁芜,试图预测它们会变成什么形状险些是不可能的。

蛋白质的基本机构

在构造上,蛋白质分子中的肽链并不是直链形状,而是按照其内在规律发生卷曲或者是折叠,从而形成特定的空间构造,这便是蛋白质的二级构造。

在二级构造的根本上,蛋白质肽链还会按照一定的空间构造,发展形成比二级构造更为繁芜的三级构造。
具有三级构造的肽链按照特定的空间排列顺序组合在一起,形成的聚拢体构培养是蛋白质的四级构造。
由于构成蛋白质的氨基酸种类繁多,氨基酸的排列顺序种类繁多,以是,虽然只有20种氨基酸,但蛋白质的种类却特殊多。

蛋白质的各级构造

美国分子生物学家赛勒斯·莱文塔尔(Cyrus Levinthal)在1969年的一篇论文中指出了一个悖论,即只管蛋白质具有大量可能存在构型,但仍能快速而精确地折叠身分歧的构像。
据估计,给定的蛋白质可能有 10^300 种终极构造。

因此,如果人们试图通过逐个考试测验来得到精确的蛋白质形状,那么得到精确答案所须要的韶光将比宇宙存在的韶光更长。

此前,科学家们有办法可视化蛋白质并剖析它们的构造,但这是一项缓慢而艰巨的事情。
据《自然》杂志宣布,最常见的蛋白质成像方法是利用X射线晶体学,通过在蛋白质的固体晶体上发射X射线,并丈量这些射线是如何衍射,以确定蛋白质的排列办法。
据DeepMind称,这项实验事情已经确定了大约190,000个蛋白质的形状,这一技能也让冷冻电镜在过去十年中成为许多构造生物学实验室的首选工具。

长期以来,科学家们一贯想知道蛋白质的组成部分——一串不同的氨基酸是如何描述出其终极形状。
研究职员表示,在1980年代和1990年代,早期利用打算机预测蛋白质构造的的结果并不理想。
当科学家将其运用于不同蛋白质时,自己已揭橥论文中的结论每每会被反复推翻瓦解。

去年,DeepMind 发布了人体和20个研究物种中每种蛋白质的蛋白质形状预测。
如今,他们已经将这些预测扩展到基本上所有的蛋白质。

DeepMind的AlphaFold创建的蛋白质构造3D 图像(图片来源:DeepMind)

DeepMind在一份声明中说: “如今算法包含植物、细菌、动物和其他生物的预测构造,为浩瀚主要问题的办理供应了许多新机会,包括可持续性发展、粮食不屈安和被忽略的疾病等方面。

开源程序根据蛋白质的氨基酸序列或构成蛋白质的分子单元进行预测。
这些单独的单元连接成一条长链,然后“折叠”成3D形状。
蛋白质的3D构造决定了该蛋白质可以做什么,因此能够从其氨基酸序列推断蛋白质的形状这一功能显得十分强大。

AlphaFold在试图阐明蛋白质构造时,紧张功过积累有关氨基酸序列和相互浸染的事理。
该算法现在可以在几分钟内预测蛋白质的形状,并精确到原子级别。

这一功能也让AlphaFold一经发布,就收成了大量关注及叫好,曾经的轰动并未消散,它的影响仍在连续蔓延。

从靶点到成药的一场变革

2022年,挪威生命科学大学研究员Vilde Leipart 利用 AlphaFold 揭示了卵黄蛋白的构造——卵黄蛋白是一种由所有产卵动物制造的生殖和免疫蛋白,这一创造可能会带来新的方法来保护蜜蜂和鱼类等主要的产卵动物免受疾病侵害。
不止于此,AlphaFold的速率和准确性正在加速药物创造过程,能够让药企更快地为患者供应新药。

就像基因编辑工具CRISPR彻底改变了人类疾病研究和遗传缺点疾病的药物设计方向,AlphaFold的正在从根本上改变新药的发明办法。

X射线检测的蛋白质晶体

想要研发药物,常日须要第一韶光锁定导致疾病的干系蛋白质或基因。
然后对症下药,探求成功“击中”目标的分子或化合物。
这一事情的代价是巨大的,药物创造均匀须要 10 年以上的韶光,每种药物开拓经费可达28亿美元。

例如,冠状病毒上的刺突蛋白被便是针对COVID-19的靶标,针对这一目标,我们创造了可以粘附在刺突上并中和刺突的疫苗及单克隆抗体。

但是,大多数疾病不像COVID-19一样平常,有一个大而明确的目标,可以用众所周知的武器(如抗体)来“攻击”它。
不同的疾病可能有成千上万的潜在药物,这是一个反复试验的过程。

人工智能已成为加速药物创造的一种办法。
演习有素的系统可以查看治疗目标,然后从选项库中识别有希望成功的候选药物,这比实验室中的科学家人工研发的速率要快得多。
不仅仅勾留在Alphabet所依赖的理论,我们已经看到了更多实际的运用例子。

2022年8月,英国Exscientia公司开拓的人工智能系统创造了一种抗癌分子,该分子现在正进入临床试验,这一过程仅用了短短的八个月。
如果没有人工智能,这一创造可能须要4到5年的韶光。

如今,大多数治疗癌症和其他疾病的新药都是通过靶向体内特定的蛋白质来发挥浸染的。
空想情形下,我们希望设计小分子药物以非常精确地结合到全体靶蛋白的一个眇小区域,从而改变其功能。
药归天学家总是更喜好拥有准确的3D蛋白质构造,以便他们可以基于构造来设计药物。

乃至在药物创造阶段开始之前,3D蛋白质构培养可以帮助药物研发团队评估目标蛋白的成药性,以便让研究职员能够理解哪些目标成药相对大略,哪些将带来重大寻衅,

根据伦敦癌症研究发布的,在其开展的多个药物创造项目中,明晰靶蛋白的3D构造发挥了主要浸染。
预测准确3D蛋白质构造的能力常日对药物创造非常有代价,在设计化学探针以评估目标在生物学和疾病病理学中的浸染时也是如此。
例如,更好地预测有用的药物靶点、翻译疾病预测细胞和动物模型,以及预测人类的早期检测毒理学。

除此之外,蛋白质机构预测还能改进抗生素的抗药性难题。
根据CDC估计,2019年,抗微生物药物耐药性每年给美国经济造成550亿美元的丢失,个中包括200亿美元的医疗保健本钱及350亿美元的生产力丢失,抗生素耐药性也助长了“超级细菌”的涌现。

今年玄月,科罗拉多大学博尔德分校的Marcelo Sousa和Megan Mitchell教授利用AlphaFold研究与抗生素耐药性有关的蛋白质,并确定了蛋白质构造,科学家可以在大约30分钟内识别出一种细菌蛋白质构造,在没有人工智能的干预下,这一动作可能会花费十年韶光。

毫无疑问,AI技能正在潜移默化的影响着医疗行业,DeepMind仅仅是一个成功的开端,而这条路没有终点。

正在改变与想要改变天下的人,都在 虎嗅APP