关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2349人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“1元买壳”10个月后,北大医药新老板徐晰人突遭刑拘!

野马财经 浏览 3317

雷军“悔棋”背后,存储市场的涨价潮也是窗口期

北京商报 浏览 3278

49岁梁咏琪拼命吸金,打扮朴素逛超市

秋枫凋零 浏览 2509

警方通报于朦胧坠亡,3位造谣者被处罚,调取监控排除刑事嫌疑

扒虾侃娱 浏览 4157

“这条裙子”今年冬天火出圈,全世界的时髦女人都在穿

LinkFashion 浏览 2296

珍珠专场|| 无论18岁还是80岁,总是会为它再一次心动

黎贝卡的异想世界 浏览 2425

跟队:纽卡vs巴萨赛前发布会上加泰记者很放松,还有人接电话

懂球帝 浏览 1521

E句话|李雨桐又来锤薛之谦了?

仙女事件簿 浏览 1625

环球:日本导弹距中国台湾仅110公里 此动向极其危险

环球时报新闻 浏览 15107

张雨绮被抵制成功!辽视春晚已将她除名

萌神木木 浏览 2180

海信CES发布全新一代RGB-Mini LED电视,搭载“玲珑4芯”真彩背光

IT之家 浏览 2408

伊朗局势趋紧 美国从黎巴嫩撤人

澎湃新闻 浏览 1701

鹈鹕创队史纪录大胜独行侠 状元PK锡安27分弗拉格21+7+8

醉卧浮生 浏览 1327

1746个螺母被认定为枪支散件 五金厂老板获刑四年

黄河新闻网吕梁频道 浏览 8823

为什么山系火锅不排队了?

互联网那些事 浏览 2402

币圈大佬的重生:特朗普特赦赵长鹏

节点财经 浏览 3334

美对委军事打击造成至少40人死亡

界面新闻 浏览 2384

在这场战争中特朗普的致命弱点是什么?

智本社 浏览 1599

香港上市公司董事薪酬榜:李想6.8亿港元居首,布鲁可创始人朱伟松排第六

红星资本局 浏览 3662

谁在重塑中国财富格局?AI前十强企业合计价值超1.8万亿,暴涨207%

时代周报 浏览 2265

郭磊:如何认识最新的出口数据和出口形势

首席经济学家论坛 浏览 3498
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1