关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4450人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一口价15.99万起 2026款别克君越正式上市

网易汽车 浏览 5471

霍家主母显气度:一代卖船供学二代稳大局三代全颜面,四代无人及

不八卦会死星人 浏览 3484

马斯克拿万亿美元薪酬,特斯拉核心高管为何集体离职?

功夫AUTO 浏览 4328

里尔老板:乔纳森不是典型9号球员,预料到他会遇到一些困难

懂球帝 浏览 4364

33.38亿!刘永好实控的新希望拟定增募资用于数智化升级和还债

红星资本局 浏览 3538

从不看好到爱不释手:段永平举牌泡泡玛特

诗与星空 浏览 645

新一任美联储主席被任命 华尔街无法确定其"是敌是友"

环球网资讯 浏览 7895

英伟达向CoreWeave追加投资20亿美元,首推独立CPU芯片

华尔街见闻官方 浏览 3446

伊姐周六热推:电视剧《不眠日》;电视剧《照镜辞》......

伊周潮流 浏览 6925

山西老人智力受损 上海警察因撞脸改口音假扮儿子12年

封面新闻 浏览 9364

张柏芝与向太的关系彻底崩塌?

涵豆说娱 浏览 5079

美官员:已收到伊朗通过巴基斯坦转交的谈判新方案

界面新闻 浏览 1500

郭晶晶就个人发展问题最新发声

新民周刊 浏览 4536

反转才不是「惊蛰无声」的最大看点

吐槽电影院 浏览 2857

网红抓银环蛇被咬伤疑因"嫌注射血清贵不打" 好友发声

潇湘晨报 浏览 15883

高盛暂停为与芝商所事故相关的数据中心公司发售债券

华尔街见闻官方 浏览 3937

阿维塔科技:五载深耕中的坚守与进化

网易汽车 浏览 1573

全球21队已锁定2026世界杯资格,阿根廷、巴西、日本、韩国在列

懂球帝 浏览 4688

对话工程院院士王浩:我国独创的“河湖长制”值得向“全球南方”国家推广

封面新闻 浏览 4413

卧底记者给美容院"拉客" 顾客消费16190记者拿80%返利

鲁中晨报 浏览 10342

耶鲁大学AI团队突破:让机器人团队像人类团队一样相互指导学习

科技行者 浏览 3246
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1