关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4088人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全球首个峰值速度达10m/s的全尺寸人形机器人Bolt发布

IT之家 浏览 3019

深圳“禁摩令”再续三年,至2028年

机车网 浏览 3556

博主:王子铭今天自行加练,周金辉、李明等高层现身训练基地

懂球帝 浏览 3993

零跑D19豪华旗舰SUV完成申报,预计4月上市交付

IT之家 浏览 3127

83亿港元“互持”,顺丰与极兔的双向奔赴能否实现1+1>2?

征探财经 浏览 3161

美军猛烈轰炸后 特朗普暗示或发起"踩红线"打击

界面新闻 浏览 116645

法拉利战略转型,电动跃马如何取悦中国用户

桑之未 浏览 4393

负债亏损盈利:三家央企新能源谁更胜一筹?

汽车公社 浏览 3679

五万亿的英伟达

诗与星空 浏览 4019

美国对伊朗考虑"军事选项" 中方回应

澎湃新闻 浏览 3136

比尔·盖茨被指感染性病并隐瞒 前妻首次回应

大风新闻 浏览 5059

俄乌“和平计划”磋商顿巴斯成焦点

环球网资讯 浏览 3558

特朗普威胁对欧洲8国加税:直到美"彻底购买格陵兰岛"

红星新闻 浏览 7255

租电版售价5.28万元 埃安UT系列永冲锋版上市

网易汽车 浏览 3178

机器人具身操作评估新范式来了,从此告别单一成功率指标

机器之心Pro 浏览 2986

悲喜交加,葛优出演了一部载入史册的佳作!

幕味儿 浏览 4288

西班牙U20主帅:很高兴亚马尔、库巴西、赫伊森能进成年队

懂球帝 浏览 4719

陈赫40岁生日合影惹争议?

萌神木木 浏览 3151

这个意外走红的风格,冬天穿真的很加分!

黎贝卡的异想世界 浏览 3516

上海药物所突破:AI滤波器精准筛选神经系统疾病新药

科技行者 浏览 2921

方媛生三胎后现身芜湖,摘墨镜气血不足显憔悴

小椰的奶奶 浏览 3119
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1