关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3167人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官方:利物浦从德比郡召回23岁后卫欧文-贝克

懂球帝 浏览 2501

抵达意大利,拉斯帕多里:很高兴能回来,我很激动且充满动力

懂球帝 浏览 2262

机器人“农民”来了!智能“秒杀”杂草,不用一滴农药

上观新闻 浏览 1970

告别奥博穆时代,保时捷加速落子研发"中国棋"

网易汽车 浏览 3102

阿里云PolarDB进阶:锚定“AI就绪”,AI能力全面内化

时代周报 浏览 2256

美以对伊朗动武后 欧洲主要国家的谨慎态度引发美不满

澎湃新闻 浏览 42199

今年秋天最流行的4件卫衣,减龄又时髦!

LinkFashion 浏览 5313

郑丽文出席联合祭祖大典:盼未来中华儿女不再自相残杀

海峡导报社 浏览 17938

中美达成共识让美豆农松口气 盼望中方订单快点来

环球网资讯 浏览 14221

周定洋告别成都蓉城:人生最艰难决定!在对的时间开启新挑战

奥拜尔 浏览 2395

科技巨头AI竞赛转向表外融资,万亿债务定时炸弹成危机前兆?

华尔街见闻官方 浏览 3306

事关乌克兰 美英法德四国领导人通话

每日经济新闻 浏览 7007

OrangePi 6 Plus 开发板公布:12 核 CPU,双 M.2 SSD 双 5GbE

IT之家 浏览 3444

网飞开年第一爆剧来了,快去看

独立鱼 浏览 2267

李昀锐孟子义被曝恋情,却双双否认

霁月文娱阁 浏览 3343

格罗斯谈重返布莱顿:我有几个选项,但布莱顿一直是首选

懂球帝 浏览 2451

芯天下弃A转港,2025年前三季度业绩扭亏,毛利率回升至18%|港E声

时代周报 浏览 2342

俄罗斯:西方派往乌克兰的士兵都是"合法打击目标"

看看新闻Knews 浏览 2372

19.88万买原厂合规越野车 212 T01长风柴油版上市

网易汽车 浏览 2559

伊姐周日热推:电视剧《大生意人》;电视剧《乌蒙深处》......

伊周潮流 浏览 2418

嫂子发文承认曾和顶流在一起,还好聚好散?

仙女事件簿 浏览 1988
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1