关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者4173人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

@全球内容创作者:广东喊你来创造,政策大礼包备好了

智谷趋势 浏览 4030

推广中奖名单-更新至2026年2月3日推广

黎贝卡的异想世界 浏览 2543

宇树澄清:去年人形机器人出货量超5500台,不含其他产品

南方都市报 浏览 3102

专家:荷兰舰机行为恶劣 解放军高度克制

环球网资讯 浏览 24973

澳网前两日综述:中国选手喜忧参半,瓦林卡不负外卡!

网球之家 浏览 3225

猛龙7人上双四杀老鹰:巴恩斯18+8+10 杰伦13+14+7+6失误

醉卧浮生 浏览 3306

人类史上最贵打工合同,马斯克万亿薪酬方案获批!

汽车公社 浏览 3865

李金羽:冲超没那么容易,希望球员们勇敢地面对各种情况

懂球帝 浏览 4837

大S逝世一周年!S妈现身雕像揭幕,生前最后时光曝光,自曝没遗憾

萌神木木 浏览 2953

我们为什么需要节日穿搭?

时尚COSMO 浏览 2625

陈乔恩带老公和父母聚餐,Alan负责拍照

黄谋仕 浏览 3290

曾经最具知名度的播音员病逝 丈夫也是央视知名主持人

环球网 浏览 18960

泡椒凤爪“塌房”,有友食品躺枪

斑马消费 浏览 2191

彭博社:搭载 M5 芯片的新款 Vision Pro 在越南组装

威锋网 浏览 4241

香港65公斤黄金被劫价值超半亿 西九龙重案组深夜通报

极目新闻 浏览 16943

男女情爱奇招尽出,碎碎念伍迪老爷再上阵!

幕味儿 浏览 3651

2号种子险爆冷!张本智和打满5局逆转日本悍将,8强战约战勒布伦

乒谈 浏览 4109

11国做出选择后特朗普喊话"中国将服软" 高市处境堪忧

胥言 浏览 8766

日本企业搞出“玫瑰香轮胎”

轮胎报官方 浏览 3415

斯帕莱蒂抵达尤文总部,受到球迷夹道欢迎

懂球帝 浏览 4023

卡拉格:如果枪手本赛季夺冠,拉亚一定是最关键的因素之一

懂球帝 浏览 2166
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1