可令AI自我判断输出内容正确性,谷歌公布模型训练框架ASPIRE

2024-01-23每日热点

  IT之家 1 月 23 日消息,谷歌日前发布新闻稿,介绍了一款专为大语言模型设计的 ASPIRE 训练框架,该框架号称可以增强 AI 模型的选择性预测能力。

  

可令AI自我判断输出内容正确性,谷歌公布模型训练框架ASPIRE

  

谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要应用于高风险决策类场合依然不妥。这是由于模型预测具有不确定性及“幻觉”可能,因此谷歌开发了一款 ASPIRE 训练框架,为系列模型引入了“可信度”机制,即 —— 模型会输出一系列答案,每个答案都会具有正确概率评分。

  

图源

  

图源 谷歌新闻稿(下同)

  

在技术层面,IT之家注意到该训练框架主要分为三阶段,分别为“特定任务调整”、“答案采样”和“自我评估学习”。

  其中“特定任务调整”阶段是对已接受过基础训练的大型语言模型进行深入训练,专注于强化模型的预测能力。研究人员主要为模型引入一系列可调参数,在特定任务的训练数据集上微调预训练语言模型,从而提升模型预测性能,让模型能够更好地解决特定问题。

  

可令AI自我判断输出内容正确性,谷歌公布模型训练框架ASPIRE

  第二阶段为“答案采样”,经过特定微调后,模型可以利用先前学习到的可调参数,为每个训练问题生成不同的答案,并创建用于自我评估学习的数据集,生成一系列可信度较高的答案。研究人员同时使用 “集束搜索(Beam Search)”方法及 Rouge-L 算法来评估答案的质量,并将生成的答案及评分重新输入给模型开启第三阶段。

  

可令AI自我判断输出内容正确性,谷歌公布模型训练框架ASPIRE

  

而在第三阶段“自我评估学习”中,研究人员为模型添加一组可调参数,专门用于提升模型自我评估能力。该阶段的目标是让模型学会“自己判断输出的答案准确性”,从而让大语言模型在生成答案时,还会附上答案的正确概率评分。

  谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果,据称“经过 ASPIRE 调整的 OPT-2.7B 小模型,表现远超更大的 OPT-30B 模型”。而这项实验结果也同时表明,只要经过适当的调整,即使是小语言模型,在部分场景下也可以超越大语言模型。

  

可令AI自我判断输出内容正确性,谷歌公布模型训练框架ASPIRE

  研究人员总结称,ASPIRE 框架训练能够显著提升大语言模型输出准确率,即使是较小的模型,也可以在经过微调后进行“准确且有自信”的预测。

标签: 今日热榜

“可令AI自我判断输出内容正确性,谷歌公布模型训练框架ASPIRE” 的相关文章

阿里旗下土耳其电商平台Trendyol或进军乌克兰市场

阿里旗下土耳其电商平台Trendyol或进军乌克兰市场

  AMZDH 2月4日消息,阿里巴巴旗下土耳其电商Trendyol总裁Caglayan Cetin本周在乌克兰与乌第一副总理Yulia Svyrydenko、战略工业部部长Oleksan...

罗永浩逃过一劫

罗永浩逃过一劫

     作者 | 李松月   01...

英特尔代工业务,斩获大客户

英特尔代工业务,斩获大客户

  人工智能系统对商业前景的吸引力不会很快减弱,科技公司需要越来越多的 GPU 和专用芯片来正确处理这些机器学习算法。英伟达正在从台积电采购人工智能芯片,但这家代工厂可...

外媒:小鹏汽车2024年将招聘4000人,并投资人工智能

外媒:小鹏汽车2024年将招聘4000人,并投资人工智能

  凤凰网科技讯 北京时间2月19日,据外媒消息,小鹏汽汽公司表示,为应对全球激烈的汽车市场竞争现状,公司将在2024年招聘4000名员工,并将在人工智能方面投资数百万美元。...

Yuzu模拟器成“绝唱”:开发商向任天堂赔款240万美元、交出域名、永久停止开发

Yuzu模拟器成“绝唱”:开发商向任天堂赔款240万美元、交出域名、永久停止开发

  IT之家 3 月 5 日消息,任天堂于一周前以“助长盗版肆虐”为由起诉 Tropic Haze 公司,也就是任天堂 Switch 模拟器 Yuzu 的开发商。   该...

王健林又一次被逼到墙角

王健林又一次被逼到墙角

  万达商管上市没有着落,让年近70岁的王健林再次面临难关。   日前据澎湃新闻从知情人士处获悉,珠海万达商管的投资者,拒绝延期支付300亿元及年底到...