关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2206人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

解放军举行围台军演 郑丽文:赖清德把自己的路走绝了

海峡导报社 浏览 24029

豆包手机最高被炒至1.29万元 日租费高达1600元

极目新闻 浏览 33028

“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄

封面新闻 浏览 3191

白宫黑手伸进委总统卧室!一场践踏国际规则的“黑夜绑架”

国是直通车 浏览 2497

特朗普:加沙停火协议已“接近达成”

新京报 浏览 3883

小米新车曝光!雷军的致命子弹,射向李想和余承东

象视汽车 浏览 3353

俄大使:美袭击时 委防空系统远程预警站通信出问题

参考消息 浏览 2261

这不是危言耸听:最快明年,比亚迪的插混和纯电,就没有区别了

小李车评李建红 浏览 3385

轰-6k在黄岩岛战备警巡示意图公布

央视新闻客户端 浏览 2159

海信发布两款颠覆级激光显示新品,显示产业形态创新迈向关键拐点

IT之家 浏览 4039

新年第一顶帽子,就要不基础

时尚COSMO 浏览 1911

辽宁88-61山东迎3喜1忧!原帅付豪成支柱,对阵广东内线引担忧!

篮球资讯达人 浏览 3109

马斯克暗示 SpaceX明年IPO?

北京商报 浏览 2771

奥迪A5L Sportback限定版上市 售33.49万元

车质网 浏览 2131

“双11”本地之战|淘宝便利店剑指美团腹地 电商巨头激战线下“最后一公里”

北京商报 浏览 3240

全智贤风波升级,雪花秘扇时期表现被审判,此前曾多次翻车

扒虾侃娱 浏览 4194

中年返贫,一场无声的凌迟

识局 浏览 3269

斯坦福MLE-Smith:自动生成机器学习竞赛题目

科技行者 浏览 3243

西蒙尼:要变得更强,朱利亚诺必须努力、谦虚并保持当前状态

懂球帝 浏览 3213

智元精灵G2新一代工业级交互式具身作业机器人发布

IT之家 浏览 3488

报道:哈塞特势头不稳,特朗普一些亲信推举沃什当美联储主席

华尔街见闻官方 浏览 2659
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1