图片来自:Science官网

2021年8月29日,由NEJM集团(《新英格兰医学杂志》出版方)和嘉会医学研究和教诲集团(J-MED,《NEJM医学前沿》出品方)联合主理的医学AI研讨会首场秀——“AI+医疗:守正创新,智造未来”在上海成功举办。

NEJM主编Eric Rubin教授、NEJM副主编和《NEJM医学前沿》实行主编肖瑞平教授、复旦大学附属中山医院院长樊嘉院士、山东大学讲席教授陈子江院士、复旦大学附属中山医院心内科主任葛均波院士、上海市糖尿病研究所所长贾伟平教授等25位中外医疗、科研和企业界的AI领军人物齐聚,共同磋商医疗AI的热点话题。

图:陈子江院士(左三),葛均波院士(左四),樊嘉院士(右四),贾伟平教授(右三),澳门科技大学张康教授(右二),与主理方J-Med团队合影

AIMS 2021  据说AI可以帮临床年夜夫写SCI了

AI系统的开拓,离不开大数据的支持。
除了上面所提到的,AI还能给我们的医疗带来哪些助力?会议中,来自悉尼大学医学与康健学院、生物医学信息学和数字康健系主任Adam Dunn教授与我们分享了一个AI的运用前景——助力临床试验,以下是Adam Dunn教授讲课内容的整理。

Adam Dunn教授

悉尼大学医学与康健学院,生物医学信息学和数字康健系主任

临床数据与AI自然措辞处理(NLP)

自然措辞处理(NLP)是AI的主要组成部分,它一方面基于规则,另一方面会学习、理解数据,个中也包括文本数据。
例如,患者的病例、已揭橥的医学论文、生物医学数据等。
有时,从不同格式的文本中提取有代价的信息是有困难的。

近十年,科技发生了重大的变革。
例如,让机器来学习图像的处理,让机器学习文档的解读等,它的准确率不错,乃至可以达到专家级。
目前,基于文本数据,AI可被用于支持临床的决策。
以下是来自谷歌团队揭橥的论文,通过提取电子病历的原始格式,利用神经网络进行演习,帮助我们找到个中的规律,总结有代价的内容和信息。

补充资料:谷歌团队揭橥的论文

补充资料论文择要部分内容:基于电子康健记录(EHR)数据,来建立预测模型,并进行深度学习。
我们利用了来自两个美国医疗中央的EHR数据,包括216 221名、住院超过24小时的成年患者,将这些数据汇总成46 864 534 945个数据点,包括临床记录。
深度学习模型在预测住院去世亡率、30天内操持外再入院、延长住院韶光、以及所有患者终极出院诊断等方面,均取得了较高的准确性。
并且,这种模型在所有情形下均优于传统的临床预测模型。

从临床试验到临床决策,AI如何助力?

上面所提到的谷歌团队揭橥的论文,它并不是一个临床试验。
临床试验中,我们对受试者有更密切的监测。
如果把每一个来到医院的患者,入组到AI临床试验干系的数据库中,是不是会更加有效。
下图是一个从临床试验到临床决策的过程。

个中,灰色部分为保密部分,赤色部分为公开部分。
A:临床试验设计,常日公众不可获知。
B:通过临床试验网络受试者的干系信息。
C:临床试验报告,最初因此PDF的形式涌现,研究论文经期刊审阅,常日在临床试验结束后数年才能揭橥。
D:纳入综述或Meta剖析中,成为数据库的一部分。
E:后续可能会影响到临床决策,例如纳入指南。

图片来自于Adam G. Dunn教授的演讲PPT

我们关注到这些系统性综述产生所须要的漫上进程,须要筛选很多临床文献,从中找到具有干系性的部分。
我们希望,可以把这种筛选过程半自动化,不论是信息的搜索,还是机器的学习,都是希望帮助人们能够更快速的找到须要的文章。

在进行系统性综述的过程中,会花费大量的韶光和精力,去评估每一项临床试验的合格性,从而决定是否可以被纳入综述。
因此,须要制订一个好的纳入或打消标准。
我们可以让AI去学习这个“标准”,打消不适宜的文献,不须要人工去打消。
这种“纳入和打消”的自动化,就像会自动弹奏的钢琴一样,我们剖析了每一个合格的、可以被纳入的文献,建立了一个“标准”,机器就会自动重复这个“标准”了。

一项好的系统性综述,须要包括全面且无偏倚的临床研究、清晰的纳入和打消标准、清晰并统一展示每个研究的数据、合理的研究结果异质性等。
我们曾经利用AI赞助系统剖析了环球几千个已经揭橥的系统性综述。
结果创造,有部分系统性综述的质量并不理想。

并不是用AI“撰写”文章,而是数据的高效处理

如何通过利用AI,更快速、更高效的把临床试验的数据领悟到当下的临床实践以及指南的书写当中?我们当时利用了一个临床试验数据库,包括很多注册临床试验,有临床试验的人群特点、治疗方法、研究终点等试验干系数据。
很多时候,信息和临床试验报告都埋没在恒河沙数的PDF格式文件中,如何把它们变成可打算的数据形式。
目前,我们也在做一些自然措辞处理(NLP)的运用,把数据库信息进行提取,然后把这些信息真正的反应成构造化的数据。

图:以“人造的综述”为例,Adam G. Dunn教授谈论AI尚存在的不敷之处

利用NLP,我们从数据库中映射出一篇综述,也包括了研究目的、方法、结果和结论。
当然,这是人造的综述。
我们用措辞模型让它去学习之前的注册临床试验以及终极揭橥文章之间的映射关系,这样的映射关系出来后,就产生了一个人造的综述或者择要。
仔细去阅读这个人造的综述,实在第一句便是缺点的,“纳入6个康健患者,年事在64~65岁,进行随机化”,实在机器对年事没有一个很好的理解和把握。

运用AI,并不是用它来进行手稿的撰写,是否能够用AI模型来找到一些已经揭橥文件的缺失落数据,或者临床试验的相似性,或者本该当纳入综述、却没有纳入综述的临床试验,这才是我们要做的事情。

我们通过数据库进行数据的网络,关注哪些临床试验该当被纳入到系统性综述当中。
目前的希望能够实现实时Meta剖析,即数据产生后,立时可以通过AI系统整合到Meta剖析中,不用等多年往后,这样就可以更好的来改进医疗实践。
并且,还可以把不同医疗系统的电子病历,以互通的办法连接,这样所有的临床试验结果都会急速可见。
2012年,Adam教授团队已经揭橥了类似的文献,实在这已经不是一个新鲜事了。

补充资料:Adam G. Dunn教授在2012年揭橥的关于公开临床试验数据的文献

总结

如何以AI的办法来更好的展示临床试验的数据呢?有了AI的进步,我们对文本数据和构造性数据有一个更好的整合剖析方法。
相信在未来,AI的运用不仅仅是会仿照人类的决策行为,不仅仅是说像人一样去弹钢琴,它能够做的是变革全体系统。
终极,临床年夜夫可以基于所有的干系临床试验以及所有的患者数据,来做出更好的临床决策。