新技术提高大型语言模型的推理能力
2024-06-17 17:14:10
•
来源:
导读 像 ChatGPT 所支持的大型语言模型在起草法律摘要、分析客户评论的情绪或将文档翻译成不同语言等任务上表现出色。这些机器学习模型通常只
像 ChatGPT 所支持的大型语言模型在起草法律摘要、分析客户评论的情绪或将文档翻译成不同语言等任务上表现出色。
这些机器学习模型通常只使用自然语言来处理信息和回答查询,这使得它们难以执行需要数字或符号推理的任务。
例如,大型语言模型可能能够记住并背诵最近美国总统及其生日的列表,但如果问这个题目,“1950 年后当选的哪些美国总统出生在星期三?”,该模型可能会失败(答案是吉米·卡特。)
麻省理工学院等机构的研究人员提出了一项新技术,该技术使大型语言模型能够通过生成程序来解决自然语言、数学和数据分析以及符号推理任务。该研究发表在arXiv预印本服务器上。
他们的方法称为自然语言嵌入式程序 (NLEP),涉及提示语言模型创建和执行 Python 程序来解决用户的查询,然后将解决方案输出为自然语言。
他们发现,NLEP 使大型语言模型能够在各种推理任务上实现更高的准确率。这种方法也是可推广的,这意味着一个 NLEP 提示可以重复用于多个任务。
NLEP 还提高了透明度,因为用户可以检查程序以准确了解模型如何推理查询,并在模型给出错误答案时修复程序。
“我们希望人工智能能够以透明和值得信赖的方式进行复杂的推理。虽然还有很长的路要走,但我们已经证明,在大型语言模型中结合编程和自然语言的能力,是迈向未来人们能够完全理解和信任人工智能模型内部发生的事情的一个非常好的潜在第一步,”麻省理工学院博士后、NLEP 论文的共同主要作者 Hongyin Luo 博士说。
该研究将在计算语言学协会北美分会的年会上发表。
免责声明:本文由用户上传,如有侵权请联系删除!