关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2168人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国否决加沙停火决议草案后 以美代表亲切握手

看看新闻Knews 浏览 4036

3月5日将上市 比亚迪海豹07EV有望搭载闪充技术

网易汽车 浏览 1631

StereoAdapter:北大首提自监督,适配水下双目深度估计

新智元 浏览 3379

高市早苗:若执政党阵营在选举中未过半数 将即刻辞职

界面新闻 浏览 6576

对话亿纬锂能陈翔:AI的尽头是能源,算力驱动储能增长

贝壳财经 浏览 707

赵文卓夫妇送女儿上学,18岁赵子仪卷出高水准

凌风的世界观 浏览 2644

冬天“半身裙”最丑的3种穿法!

Yuki女人故事 浏览 2911

CBA唯一11战全败!四川最多落后31分惨负山西 原帅17分引6人上双

醉卧浮生 浏览 2393

被许家印坑得最惨的大佬,资产清零了

大猫财经Pro 浏览 2589

钉钉和AI抢时间

虎嗅APP 浏览 2555

伊朗驻华大使:美国若敢动伊朗 影响将远超各方控制

中国日报网 浏览 12765

莱切足球:福法纳加盟,恩戈姆也即将到来

绿茵情报局 浏览 2271

页岩油超级并购来了?Coterra考虑联姻Devon Energy,股价一度涨超10%

华尔街见闻官方 浏览 2290

泽连斯基:俄对乌发动大规模空袭 发射近300架无人机

极目新闻 浏览 2206

87家央企"一把手"薪酬信息披露:年薪90万元以上19人

大风新闻 浏览 11496

巴黎人报:出于保险,恩里克半场就换下了努诺-门德斯

懂球帝 浏览 2919

洪九果品响退市警报,“榴莲大王”梦断资本路

斑马消费 浏览 3519

这些才是最适合普通人的造型!不用穿大牌、不老套,真实自然

静儿时尚达人 浏览 307

医院人满为患 加沙患者焦急等待救治

国际在线 浏览 3069

时间的“相对论”:为什么我们总觉得时间越跑越快?『心灵加油站』(271)

我们的太空 浏览 2648

马杜罗:愿在相互尊重基础上同美国进行对话

澎湃新闻 浏览 2554
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1