关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者3244人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

59天后的春晚,她必是焦点

Yuki女人故事 浏览 2665

这顶级尤物,也凉了

独立鱼 浏览 2784

知名"富二代"所创明星机器人公司突解散 研发阵容豪华

每日经济新闻 浏览 7081

路易斯:感到很失望,明年我不知道还会不会在这里

懂球帝 浏览 3236

华为 nova 14 Pro / Ultra 预计今年 12 月升级支持 AI 辅助构图

IT之家 浏览 3297

李斌被告!蔚来被指虚增收入和利润,港股闪崩13%

深蓝财经 浏览 3411

美军打击“箭在弦上” 伊朗有哪些应对手段?

澎湃新闻 浏览 2009

兹维列夫脚踝受伤遭横扫,严重肿胀紧急求医,总决赛征程蒙上阴影

网球之家 浏览 3253

王家卫持续被扒

萌神木木 浏览 3232

未婚未育男子将遗产留给外甥遗嘱却写错名字 法院判了

环球网 浏览 8833

E句话| 蔡天凤案有判决结果了?

仙女事件簿 浏览 3318

陈丽华告别仪式举办 马德华:迟重瑞心里很难过

大象新闻 浏览 59517

场内嬉笑,场外怒骂,《喜人奇葩说》第一季来了

时尚COSMO 浏览 3220

美国举起关税大棒持续施压 伊朗要给“难忘教训”

环球网资讯 浏览 2361

马斯克Grok 4.2炒股收益率夺冠

财闻 浏览 2265

戴向宇曾单方面通知家人要和陈紫函离婚

乡野小珥 浏览 3999

看完10集《太平年》,我头皮发麻,终于有人把“牵羊礼”拍出来了

娱乐圈笔娱君 浏览 2204

国产英伟达88天闯关IPO!

诗与星空 浏览 3931

委反对派领导人把自己的诺贝尔和平奖赠予特朗普

财联社 浏览 2221

年销280万辆,出口134万辆后,奇瑞的下一站在哪

智电汽车. 浏览 2314

抛弃糟糠之妻和6岁儿子,李成儒后悔吗

白面书誏 浏览 3266
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1