关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者2724人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

送别聂卫平队伍长度超200米 韩国围棋名宿前来吊唁

极目新闻 浏览 6766

姚期智:我们建成了世界上最好的量子实验室之一

上观新闻 浏览 4301

加州大学圣地亚哥分校发现:AI评估基准存在滞后性

科技行者 浏览 3543

中国AI半导体加速“脱英伟达”,半导体国内自给率到2026年将提高至8成

财闻 浏览 2477

40+女人冬季穿衣,质感优先、简约配色、扬长避短,优雅高级

静儿时尚达人 浏览 2715

从实验室到生产线南阳理工学院15年磨一剑赋能汽车制造升级

大象新闻 浏览 1117

中国汽车发动机新格局丨大众、丰田不再主流,谁主沉浮?

小鹏财经 浏览 3729

又赢了!19岁国乒黑马绝杀日本后势不可挡 高情商发言存大将之风

颜小白的篮球梦 浏览 3248

长这样的外套,大骨架女孩不要买!

Yuki女人故事 浏览 3572

法尔克:皇马和切尔西将争夺于帕,签字费是他与拜仁续约障碍

懂球帝 浏览 3657

李纯马頔机场被偶遇,有说有笑画面温馨

大龄女一晓彤 浏览 3130

2025自主四强全年销量成绩单出炉

大象新闻 浏览 2717

上天的小鼠为何更瘦?这场跨年科学对话透露了很多航天趣事|科学家·马上回答

封面新闻 浏览 2831

恒瑞前董事长周云曙履新先声药业,曾在恒瑞工作超25年

YOUNG财经 浏览 2746

卡塞米罗:我离开皇马时安帅哭了;吉马良斯是巴西下一代领袖

懂球帝 浏览 304

塔帅:若顺利哈弗茨未来几天能进名单;我们想赢得重要奖杯

懂球帝 浏览 2673

韩星张元英辱华发酵!相关代言遭抵制品牌方回应,本人持续装糊涂

萌神木木 浏览 2244

挪威主帅谈晋级世界杯:这是个超现实的夜晚,我感到非常自豪

懂球帝 浏览 3352

台湾一古宅所有正房大门都向着大陆 原因让人动容

都市快报橙柿互动 浏览 9502

高效训练新标杆!华人开源原生VLM-NEO,以少数据追平顶级模型

DeepTech深科技 浏览 3791

无需多视角,单图重建可交互3D模型!南洋理工开源结构推理框架

新智元 浏览 772
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1