关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2345人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

世界田联公布最佳田赛运动员候选:杜普兰蒂斯在列

懂球帝 浏览 3386

券商三季度660亿持仓出炉!香农芯创等35股持股市值超3亿元!

私募排排网 浏览 3304

香港上市公司董事薪酬榜:李想6.8亿港元居首,布鲁可创始人朱伟松排第六

红星资本局 浏览 3657

杭州,居然是一个巨大的真人寻宝游戏!

时尚COSMO 浏览 4026

Word再见!华为和WPS联手攻克难题:一句话生成PPT、PDF/Excel大文件秒开

快科技 浏览 2108

鲁尼:萨拉赫应该回撤参与协防;范戴克的进球应该算作有效

懂球帝 浏览 3077

伊萨克遭范德芬剪刀脚,伤病分析师:前者很大可能伤缺8-10周

懂球帝 浏览 2584

朱松玮27+4&曾凌铉三分9中9,北控战福建国内球员双双爆发

懂球帝 浏览 2313

韩国防部给出核潜艇下水时间点 此前韩国已向中方保证

澎湃新闻 浏览 15839

天津外援阿代米谈胜利:现在要做的是忘掉这一场比赛,准备下一场

直播吧 浏览 4093

俄副外长警告:北约敌对行为可能导致核大国间直接冲突

环球网资讯 浏览 3272

《秋雪漫过的冬天》首播,不如原版韩剧好看

马庆云的影音娱 浏览 2420

芯迈半导体二度递表,专利超300项!获国家级资本加持|港E声

时代周报 浏览 2433

委内瑞拉外长会见美外交使团团长

环球网资讯 浏览 2087

开普勒人形机器人实现全球首例“人机协作”高空焊接作业

IT之家 浏览 2290

奔驰/宝马/奥迪销量集体下滑,谁也逃不过以价换量

郑谊 浏览 2287

裤子+靴子:今年冬天最经典搭配,松弛又时髦!

LinkFashion 浏览 2069

笑掉大牙!日票房仅199万,黄晓明的新片,被“小李子”打懵了

温柔娱公子 浏览 3310

高市早苗当选首相 日本史上首名"第一先生"信息披露

环球网资讯 浏览 7370

民事诉讼牵出5年纠纷!迅雷再诉前CEO陈磊损害公司利益,知情人:追索金额达2亿元

红星资本局 浏览 2278

白人女子被美国特工当街射杀 死前对峙说"我不生你气"

环球网资讯 浏览 7511
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1