关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11383人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

制作粗糙,观众齐刷退钱,成本仅800万,谢孟伟新片首映冲上第一

靠谱电影君 浏览 10666

一起划水!东契奇10中3得7分7板7助 约基奇8中6得13分4板9助2断

直播吧 浏览 12501

专场招聘、优化政策……各地为毕业生就业创业保驾护航

环球网资讯 浏览 15377

渤海海峡黄海北部将执行军事任务

央广军事 浏览 12724

统一企业中国提500亿大目标,可食品业务没顶住

斑马消费 浏览 14567

耗资3000万,9小时票房仅2.1万,《731》把古天乐这部新片打惨了

靠谱电影君 浏览 1575

全球首创!西安造创新医疗器械获批上市

上游新闻 浏览 1002

大厂高P跳槽中小企业,为何不欢而散?

Tech星球 浏览 16797

上班穿搭没灵感?参考这些优雅通勤风模板

潮范儿 浏览 16928

即将重新服役的俄军航母 正面临"更严酷的挑战"

枢密院十号 浏览 19060

百度再战高德,还拉来了两大“帮手”

螺旋实验室 浏览 1017

经济日报:加大分红回购 激发市场活力

经济日报 浏览 12879

卫冕悬了?瓜帅确认丁丁伤势严重考虑手术,将缺席数月

我爱英超 浏览 15368

李春生、张福生等四"虎"同时被点名 都和一个问题有关

政知新媒体 浏览 95778

60岁妈妈和女儿的穿搭 女人的美从不分年纪

小西的穿搭日记 浏览 16918

合伙圈钱:174元发行,超募30亿,股价暴跌72%?

资本百科 浏览 12404

马克龙将再次会见马斯克 谈论特斯拉在法国投资的可能性

IT之家 浏览 16077

上半年对欧新能源汽车出口近35万辆:比亚迪、蔚来等并不理想

21世纪经济报道 浏览 14281

50+女人别穿得“老气横秋”!掌握3个穿搭密码,减龄又优雅

静儿时尚达人 浏览 349

工业设计软件逆势活跃 华大九天等创年内新高

第一财经资讯 浏览 1023

理想基地获评2025汽车制造超级工厂 AI驱动智造新范式

智车情报局 浏览 62
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1