关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2685人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《阿凡达3》一言难尽,好看不好吃,顶级特效盖不住影迷吐槽剧情

最爱酷影视 浏览 2954

帮助中国人撤离的伊朗民众:我们走不了的

南方都市报 浏览 1952

亚冠精英实时积分榜:申花升至第6跻身晋级区,成都第9,海港垫底

懂球帝 浏览 3670

跨年档、抓总统、何晴、南京博物院、斩杀线等

电影最TOP 浏览 2335

将提升极端场景识别度 小米汽车召回超11万台SU7标准版

网易汽车 浏览 4551

拜仁官方:后卫斯塔尼希奇今日回归合练

懂球帝 浏览 3682

CBA唯一11战全败!四川最多落后31分惨负山西 原帅17分引6人上双

醉卧浮生 浏览 2682

45岁潘玮柏好福气!34岁老婆宣云温柔又独立

体育小柚 浏览 3348

我们为什么需要节日穿搭?

时尚COSMO 浏览 2194

牛弹琴:美印突然和好 一个与俄方有关的细节很不寻常

现代快报 浏览 5957

上汽大众首款“9系旗舰” ID. ERA 9X实车曝光

网易汽车 浏览 2654

国家医保局:职工医保个人账户跨省共济今年全国覆盖

商业观察杂志社 浏览 1946

2026手帐来了,因为它我实现了好多心愿

黎贝卡的异想世界 浏览 3731

防晒专场|| 几十块到手,回购一年多才来推荐

黎贝卡的异想世界 浏览 1043

MIT最新发现:这十年,算法进步被高估了

机器之心Pro 浏览 2994

谁在重塑中国财富格局?AI前十强企业合计价值超1.8万亿,暴涨207%

时代周报 浏览 2570

东南欧小国选举 俄罗斯、乌克兰和欧盟"异常罕见"关注

上观新闻 浏览 36723

东南大学突破:AI学会情境化拒绝能力

科技行者 浏览 3706

伊朗"蚊子舰队"披露:被美方视为霍尔木兹海峡的主要威胁

扬子晚报 浏览 715

达利欧警告:美伊在霍尔木兹海峡的"决战"将改变世界

财联社 浏览 116747

弗里克:来巴萨后我变了,我也不希望孙子看到爷爷是这样的

懂球帝 浏览 3509
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1