关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3311人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

直瀑式格栅/3种座椅布局 第三代豪越L正式亮相

网易汽车 浏览 3106

《双轨》空降逻辑混乱,赛车泰拳伪骨科叠加,虞书欣演技难撑人设

不八卦会死星人 浏览 2706

TA:维尼修斯认为自己在球队整体表现不佳的情况下被区别对待

懂球帝 浏览 2658

克媒:托利奇加盟浙江已达协议,等待替代者加盟就将前往中国

懂球帝 浏览 2064

半导体封测第一股,进击汽车电子!

飞鲸投研 浏览 2239

马卡:塞尔塔公布本赛季5名队长人选及顺位 阿斯帕斯仍是第一队长

直播吧 浏览 4211

西汉姆联助理教练帕科·赫梅斯澄清与努诺·埃斯皮里托·桑托的场边争执

绿茵情报局 浏览 2155

疯狂推新,营收大涨27%!小熊电器“翻身”

侃见财经 浏览 3436

北京79-73战胜浙江 球员评价:2人优秀,4人及格,4人低迷

篮球资讯达人 浏览 2249

前曼城助教:08年曼城曾为梅西报价3000万镑,这惹怒了巴萨

懂球帝 浏览 2709

大张伟和老婆腻歪,当一个42岁叛逆“小娇夫”

凌风的世界观 浏览 2684

“双引擎”再提速:中国资本市场改革释放创新红利

财经众议院 浏览 3105

年仅46岁!“量子通信第一股”董事长在办公室去世,5月才上任

财通社 浏览 2719

产品力全面提升 问界M7新老款车型对比

车质网 浏览 3267

2025最流行的摩卡慕斯色,配牛仔蓝太好看了!

LinkFashion 浏览 4088

俄乌突现转机?泽连斯基与普京“停火”对话

浏览 7215

特斯拉涉嫌虚假宣传驾驶辅助,或被禁售30天

汽车公社 浏览 2537

“勃肯鞋”今年冬天爆火!这几双怎么搭都好看

LinkFashion 浏览 2496

以数字化锻造发展引擎!财信证券书写“五篇大文章”

券商中国 浏览 3503

陈思诚新作《10间敢死队》定档五一

南方都市报 浏览 686

养乐多卖不动了?

斑马消费 浏览 3388
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1