这项生物物理领域人工智能运用主要研究,由中国科学院自动化所多模态人工智能系统实验室杨戈研究员团队、中国科学院生物物理所蛋白质科学研究平台生物成像中央孙飞研究员团队共同完成,成果论文近日在国际学术期刊《自然-通讯》(Nature Communications)揭橥。
DeepETPicker 软件用户图形界面。中国科学院自动化所/供图
研究团队先容说,生物大分子(如蛋白质)的构造与功能会随着细胞生理状态的变革不断进行动态调度。原位构造生物学是在靠近自然生理状态下研究生物大分子构造和功能的科学,而原位冷冻电镜技能以其高分辨率和在靠近生理条件下不雅观察样品的特点,成为原位构造生物学研究中的关键手段。原位冷冻电镜的技能流程涉及样品制备、数据采集、电子断层重修、颗粒挑选、粒子均匀等多个步骤,生物大分子的颗粒挑选即定位识别,是个中一个关键环节。
受限于原位冷冻电镜技能图像的极低信噪比和重修伪影等成分,成千上万个目标颗粒的手动挑选极为耗时费力,现有自动挑选方法的运用受到人工标注量高、打算本钱高和颗粒质量不理想等多方面限定。
利用 DeepETPicker 从冷冻电子断层扫描图像中挑选颗粒的整体事情流程。中国科学院自动化所/供图
针对这一难题,研究团队最新研发提出DeepETPicker,其仅须要少量人工标注颗粒进行演习即可实现快速准确三维颗粒自动挑选。为降落对人工标注量的需求,DeepETPicker优选简化标签来替代真实标签,并采取更高效的模型架构、更丰富的数据增强技能和重叠分区策略来提升小演习集时模型的性能;为提高颗粒定位的速率,DeepETPicker采取图形处理器(GPU)加速的均匀池化-非极大值抑制后处理操作,与现有的聚类后处理方法比较提升挑选速率数十倍。同时,为方便用户利用,研究团队还推出操作简洁、界面友好的开源软件,以赞助用户完成图像预处理、颗粒标注、模型演习与推理等操作。
利用DeepETPicker从冷冻电子断层扫描图像中挑选颗粒的整体事情流程包括演习数据阶段和模型推理阶段。在演习数据阶段,研究团队优选了弱标签来代替真实掩模以减轻人工标注包袱,并在模型架构设计方面,引入坐标卷积和图像金字塔到3D-ResUNet的分割架构中以提高定位的准确性。在模型推理阶段,DeepETPicker采取重叠断层图分区策略,避免了由于边缘体素分割精度不佳而产生的负面影响,进而结合均匀池化-非极大值抑制操作加速颗粒中央定位过程。
随后,研究团队将DeepETPicker与目前性能最优的颗粒挑选方法在多种冷冻电子断层扫描数据集上进行性能评估比拟,采取精确率-召回率、F1-分数、对数似然概率贡献度、最大值概率、RH分辨率、全局分辨率6个定量指标全面评价颗粒挑选的质量,结果表明,DeepETPicker在仿真与真实数据集上均可实现快速准确的颗粒挑选,其综合性能明显优于现有的其他方法,生物大分子构造重修达到的分辨率也达到采取专家人工挑选颗粒进行构造重修同样的水平。
采取定量指标评估DeepETPicker在EMPIAR-10045实验数据集上的粒子挑选性能。中国科学院自动化所/供图
研究团队表示,这进一步表示出DeepETPicker在原位高分辨率构造解析中的实用代价,也充分表明该快速准确定位识别生物大分子的新方法,将为采取原位冷冻电镜技能的原位构造生物学研究供应有力支持。(完)