关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2470人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿斯:瓜帅执教曼城已完成超70笔引援,花费金额超20亿欧

懂球帝 浏览 2505

弗赖堡vs汉堡:金特尔、格里福首发,法比奥-维埃拉、洛孔加出战

懂球帝 浏览 2644

第九届人单合一模式引领论坛举行 构建AI时代的智能交互生态

尺度商业 浏览 4580

两部门:不得变相强制网络交易平台内经营者承担退款不退货等售后责任

YOUNG财经 浏览 2661

哈啰“豪赌”Robotaxi,联手阿里和宁德能否比萝卜快跑“跑更快”?

汽扯扒谈 浏览 4397

林心如曝霍建华消费观

科学发掘 浏览 2842

埃迪-豪7次面对伯恩茅斯场均积分0.7分,仅比对阵曼城、红军更多

直播吧 浏览 4454

真有品味的中年女人,穿衣打扮都有这4个共同点,你中了吗?

静儿时尚达人 浏览 3831

售13.98万起 吉利新能源皮卡四驱山地版/高寒版同步上市

网易汽车 浏览 2870

麒麟信安与智慧眼达成战略合作 共推AI+操作系统融合应用

财闻 浏览 3862

AI的“相变”时刻:为什么我们现在的想象力都太贫乏了?

澎湃新闻 浏览 2568

花400元“过家家”,Jellycat火爆看不懂?情绪消费正带来行业新逻辑

红星资本局 浏览 3710

马竞球迷举行午餐聚会,托雷斯、比利亚和劳尔到场

懂球帝 浏览 526

猛士汽车2025全年销量10228台 同比增长387%

网易汽车 浏览 2695

向太曝郭碧婷父亲患病或时日无多,儿媳长期留台,私房钱贴补娘家

不八卦会死星人 浏览 3805

看完《阿凡达3》,心情很复杂

独立鱼 浏览 2291

何猷君为6岁儿子何广燊庆生,儿子神似赌王

王稱吃吃喝喝 浏览 3654

1000万人围观,爆红的「老辈子文学」

最人物 浏览 2969

李镇全打趣:现场听到GAI的说唱,我在场上可能多跑几百米

懂球帝 浏览 1725

父亲脑血栓瘫痪儿子正叛逆 母亲又气又痛告知儿子身世

红星新闻 浏览 28410

基米希:十年前拜仁有很多个人主义,如今队友更愿为团队奉献

懂球帝 浏览 3533
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1