您的位置:首页 >行业动态 >

研究人员为数字病理学定制人工智能工具

导读 韦尔康奈尔医学院和波士顿丹娜法伯癌症研究所的科学家开发并测试了针对数字病理学的新型人工智能 (AI) 工具。数字病理学是一个快速发展的

韦尔康奈尔医学院和波士顿丹娜法伯癌症研究所的科学家开发并测试了针对数字病理学的新型人工智能 (AI) 工具。数字病理学是一个快速发展的领域,它使用由组织样本创建的高分辨率数字图像来帮助诊断疾病和指导治疗。

他们的 论文于 7 月 9 日发表在《柳叶刀数字健康》上,展示了 ChatGPT(一种为理解和生成文本而开发的 AI 语言模型)可以进行定制,以准确回答有关数字病理学的问题并汇编详细的结果。作者还发现,ChatGPT 可以帮助没有丰富编码经验的病理学家使用分析组织样本的复杂软件,从而帮助弥合病理学和数字病理学技能之间的差距。

ChatGPT 是一个大型语言模型 (LLM),这意味着它使用大量数据生成有关广泛主题的文本。“LLM 适用于一般任务,但它们并不是获取专业领域有用信息的最佳工具,”该研究的主要作者、 病理学和实验室医学研究助理教授、 威尔康奈尔医学院 计算和系统病理学部成员Mohamed Omar 博士说。病理学和实验室医学副教授、计算和系统病理学部主任Luigi Marchionni 博士也是这项研究的合著者。

为了创建能够提高数字病理学所需的细致决策所需的效率和准确性的人工智能工具,通讯作者、 丹娜—法伯癌症研究所信息学与分析部人工智能运营与数据科学服务主任Renato Umeton 博士带头致力于定制 ChatGPT。

提高病理学人工智能的准确性

“普通法学硕士有两个主要问题。首先,它们通常提供冗长的通用答案,不包含有用的信息,”奥马尔博士说。“其次,这些模型可能会产生幻觉,凭空捏造一些东西,包括文献引用。例如,这在数字病理学和癌症生物学等专业领域尤其糟糕。”

为了解决这些问题,Umeton 博士首先从丹娜—法伯癌症研究所 (Dana-Farber Cancer Institute) 实施的安全、私密且可靠的 ChatGPT 版本 (GPT4DFCI) 开始。研究人员对 GPT4DFCI 进行了扩充,使其能够访问数字病理学最新发展的综合且精选的数据库,该数据库包含 2022 年以后的 650 篇出版物,增加了 10,000 多页文献。

“我们可以要求这个新系统让我们了解数字病理学中的许多特定主题或技术,并在几秒钟内获得结果,其细节、深度和总结程度是当前科学文献工具或搜索引擎所不具备的,”Umeton 博士说。

他们使用了一种称为检索增强生成 (RAG) 的技术,使 GPT4DFCI 能够从这个专门的数据库访问相关文档或信息,并对用户关于数字病理学的提示生成准确的响应,但不会产生超出该范围的任何内容。

Omar 博士和他的同事将 GTP4DFCI 的回答与更通用的 GPT-4 模型提供的回答进行了比较。通过要求 GTP4DFCI 提供它用来生成回答的具体出版物的链接,他们确定答案是准确且有根据的。改进后的模型比 GPT-4 提供了更精确、更相关的答案,而且一次也没有产生幻觉。

“我希望这将成为其他医学或医学研究领域中更多领域特定工具的催化剂,”奥马尔博士说。

人工智能助力编码

该团队开发的第二个 AI 程序可帮助病理学家使用 PathML,这是一个专门的软件库,需要熟悉编程语言 Python 才能分析庞大而复杂的组织病理学图像数据集。“没有编码经验的病理学家或科学家通常会发现 PathML 很难用于图像分析任务,”Omar 博士说。

研究人员将 PathML 与 ChatGPT 集成,让用户只需输入有关使用 PathML 进行组织病理学分析的问题即可。然后,该工具会提供分步、准确的样本编码说明。

“我们的研究表明,当与适当的信息检索技术相结合时,ChatGPT 和受保护的 AI 工具(如 GPT4DFCI)可以非常有效地支持基础研究人员,”Umeton 博士说。“这些工具甚至对需要极其精确答案的非常复杂的主题(如数字病理学)也很有帮助。”

免责声明:本文由用户上传,如有侵权请联系删除!