关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者2258人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

妈妈辈如何穿出“贵气感”?4个打扮习惯,轻松提升优雅气质

静儿时尚达人 浏览 3406

以色列移交又一批巴勒斯坦被扣押人员遗体

环球网资讯 浏览 3470

盈利大考冲刺关头,千亿小鹏被指“虚假宣传”

雷达财经 浏览 2402

从胶体物理到创新药,南科大团队提出大分子药物稳定新理论

DeepTech深科技 浏览 2294

59岁无儿无女,王晶为何说张卫健一点都不惨

林雁飞 浏览 2256

用这几件单品,轻松get秋日氛围!

黎贝卡的异想世界 浏览 3419

同曦126-123双加时逆转深圳,郭昊文31+6+10,史密斯空砍44分

懂球帝 浏览 2085

杜克大学开创新型物联网控制语言,手机就能对话所有智能设备

科技行者 浏览 3257

大相径庭,维拉上赛季英超前五轮过后高居第3,本赛季仅第18

直播吧 浏览 4053

扎哈罗娃:俄罗斯保留对日本采取强硬回应的权利

环球网资讯 浏览 2841

亏损超2亿?《用武之地》票房崩塌,我感慨:这块金字招牌算砸了

靠谱电影君 浏览 2514

谈判之际擦枪走火 伊无人机冲向美航母或给美动武借口

第一军情 浏览 4517

加州大学欧文分校发明"内部监控器":让大模型自己识别胡说八道

科技行者 浏览 2015

8样回购N次宝藏零食!送礼/自己吃都合适!

Yuki女人故事 浏览 5103

西足协主席谈亚马尔:本应处理得更好,重要的是照顾好球员

懂球帝 浏览 2980

汽车破窗有店铺销量陡增 新能源汽车双层玻璃无效

快科技 浏览 3438

零跑Lafa5:一副钢炮的皮,一颗家用的心?

Autolab 浏览 3099

官方:法国后卫泰奥-佩勒纳尔加盟梅州客家,穿5号球衣

懂球帝 浏览 2152

天空:曼城想在冬窗签下一名中卫,格伊对转会曼城持开放态度

懂球帝 浏览 2286

阿莱格里:有的球员值1亿有的值100万,让1亿的上就是容易赢

懂球帝 浏览 2372

紫牛头条|“龙虾”控制微信发红包传言是玩笑,全民养“虾”让不少网友产生“AI焦虑”

扬子晚报 浏览 1506
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1