关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2204人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

洛杉矶高层:签下孙兴慜是一次冒险,他展现出梅西般的影响力

懂球帝 浏览 3203

中年女人的开挂指南,避开花衣服和紧身衣,把优雅感焊在身上

静儿时尚达人 浏览 3040

《罚罪2》40集:彭局弘市长判刑20年

影像温度 浏览 2352

电商助力 四川会东石榴从深山走向全国市场

封面新闻 浏览 4025

今年靴子怎么穿?这个思路可以解决一半冬日搭配

黎贝卡的异想世界 浏览 2746

陈涛:我们最后四轮赛程可以用地狱级来形容,已经没有退路了

懂球帝 浏览 3497

在普度寺,倾听BALMAIN八十年来的的呼吸

时尚COSMO 浏览 2715

杭师大受助名单照搬网络人名 大额项目明细表被删除

中国新闻周刊 浏览 31518

牛弹琴:180度转弯 和特朗普"你死我活"的狠人去了白宫

北京日报客户端 浏览 4177

泽连斯基又怂恿:中国帮忙很重要 感谢提供帮助的人

澎湃新闻 浏览 6666

建立互信和实现共赢,解读国有车企高层为何密集拜会任正非?

百姓评车 浏览 4132

解放军报:日本军国主义大有卷土重来之势

极目新闻 浏览 2759

阶段性企稳?飞天茅台价格普涨,经销商称“过节需求出货量大”

澎湃新闻 浏览 2185

宏福苑4小时内火警连升三级:单户最大面积44.9平方米

红星新闻 浏览 30188

年度最扎心电影,看得中年男女坐立难安

Yuki女人故事 浏览 2294

商竣程香港250赛再爆大冷排名狂飙95位,郑钦文官宣退出2026澳网

网球之家 浏览 2410

美军宣布再次打击"贩毒船" 致4人死亡

环球网资讯 浏览 3191

月销破2万辆 极狐年销翻番在望 摸到准一线门槛

乐逗汽车 浏览 3013

燃油+电动全都配 全新宝马4系最新消息曝光

乐选爱车 浏览 2087

芯天下弃A转港,2025年前三季度业绩扭亏,毛利率回升至18%|港E声

时代周报 浏览 2342

一年前“掐点”成立 多只基金无缘“翻倍基”

证券时报 浏览 3833
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1