关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4511人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

关键时刻又崩!许利民发布会罕见发怒,却甩锅球员态度与球员能力

篮球资讯达人 浏览 3684

英媒:梅努担心能否参加世界杯,热刺和纽卡在考虑签下他

懂球帝 浏览 4575

理查兹:道曼和萨卡位置重叠,为球员未来发展应该将他外租

懂球帝 浏览 4336

女人过了40岁穿衣别老气横秋,看看这些日系穿搭,得体又显瘦

静儿时尚达人 浏览 4338

林依晨二胎喜讯背后:被造谣7年生吃青蛙的十年婚变史

Yuki女人故事 浏览 6746

安东尼奥:难以置信的比赛,球员们真是不可思议

懂球帝 浏览 3513

让“死嘴”会说多说,不太好听又如何

时尚COSMO 浏览 4334

黄晓明:肉白增了

娱乐圈笔娱君 浏览 4384

印度稀土转卖丑闻曝光,伪造文件骗取稀土转卖老美

大国观察眼 浏览 3247

领英平台新型钓鱼骗术瞄准高净值人士,微软账号安全受威胁

IT之家 浏览 4571

特朗普拿错剧本了?刚扬言要禁中国“地沟油”,就遭美媒啪啪打脸

北向财经 浏览 4545

红色不流行了?今年最火的穿搭居然是它

LinkFashion 浏览 3846

斯洛特:尽管我们取得四连胜,但球队的表现并不完美

懂球帝 浏览 3794

国乒第一女神芦璐:嫁给刘国正

李橑在北漂 浏览 3029

马斯克回应争议:没有见过任何由Grok生成的未成年人裸照

IT之家 浏览 3545

白电三巨头最新财报出炉!小米高管:友商越急,我们越稳!

互联网那些事 浏览 4432

羊绒专场 || 被大家问了无数次的经典款,终于回来了!

黎贝卡的异想世界 浏览 4077

曹德旺辞去福耀玻璃董事长职务,儿子曹晖接任

红星资本局 浏览 4540

今年秋天最流行的4件卫衣,减龄又时髦!

LinkFashion 浏览 6840

消息称三星Galaxy S26系列手机将首次提供2400万像素切换开关

IT之家 浏览 3620

HuggingFace发布实战指南,从决策到落地手把手教你训练大模型

机器之心Pro 浏览 3561
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1