关闭广告

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者2434人阅读


当我们人类想学一项新技能时,最常见的方法就是看别人怎么做——看视频教程、观察师傅操作,然后模仿着练习。斯坦福大学的研究团队在2024年12月发表的一项研究中,成功地让机器人也掌握了这种"看视频学本领"的能力。这项名为"Dream2Flow"的研究由斯坦福大学的Karthik Dharmarajan、Wenlong Huang、Jiajun Wu、Li Fei-Fei和Ruohan Zhang等学者联合完成,论文编号为arXiv:2512.24766v1。

这个研究解决了一个令人头疼的问题:如何让机器人理解并执行那些看似简单的日常任务。比如说,当你告诉机器人"把面包放进碗里"时,它需要理解什么是面包、什么是碗,更重要的是要知道怎样抓取、移动和放置这些物品。传统的方法需要程序员为每个动作写出详细的指令,就像给机器人编写一本超级详细的操作手册。但现实世界太复杂了,物品的形状、位置、重量都千变万化,写不完的手册根本无法涵盖所有情况。

研究团队想到了一个巧妙的办法:既然现在的AI视频生成技术已经能够根据文字描述生成非常逼真的视频,那何不让机器人先"看"一段展示如何完成任务的视频,然后从中学习物体应该如何移动?这就好比你

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

TA:曼联今夏额外借贷1.05亿镑用于引援,目前总债务6.37亿镑

直播吧 浏览 4132

这些才是适合普通人的穿搭!多穿基础款和半身裙,简约又得体

静儿时尚达人 浏览 3154

一个月内两度请辞!“80后”刘鹏辞任中顺洁柔董事长、总裁,年薪514万

红星资本局 浏览 2373

深圳福田首批"政务龙虾"上线 仅有3000多行代码

红星新闻 浏览 31929

张杰院士:三步走,2045建成上海首个聚变商业电站

澎湃新闻 浏览 4273

癌症晚期男子驾车撞死婆孙2人后病亡 法院判赔超200万

台州交通广播 浏览 2264

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家 浏览 4101

AI算力需求疯狂,微软“新云”交易额超600亿美元

华尔街见闻官方 浏览 3184

81岁“中国刻蚀机之父”拟减持:已从外籍恢复为中国籍,为办理税务需要

红星资本局 浏览 2395

苏州大学突破:AI评判官能评估人工智能的记忆管理能力吗?

科技行者 浏览 2187

忘切号了?桑乔社媒发文鼓励自己后,又用自己账号留言

懂球帝 浏览 3617

格陵兰岛"任何情况下都不接受美接管"

新京报 浏览 2316

时隔34年维京队再夺挪超冠军,球迷冲入球场内疯狂庆祝

懂球帝 浏览 2817

插混车纯电续航超过210km,增程车怎么办?

汽车公社 浏览 2378

吉利汽车集团:银河品牌全系电混车型纯电续航突破200公里

IT之家 浏览 1689

铜价历史新高推动“复合集流体”量产提速,易开盖龙头“英联股份”能否成为跨界黑马?

时代周报 浏览 2679

闫学晶被多个品牌解约,儿子林傲霏“新疆班”的学历也被调查

素素娱乐 浏览 2358

芒米Pocket Max掌机:模块化设计、大容量电池与强芯片的结合

IT之家 浏览 2290

江汽集团董事长项兴初拜访华为任正非,进一步拓宽合作领域

财闻 浏览 2592

王暖暖花6年才离掉婚 男方母亲曾带女子探监和他相亲

新京报 浏览 3580

美政府"关门"将结束 民主党8人倒戈加入共和党人行列

红星新闻 浏览 34027
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1