关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者804人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美论坛:为什么中国明知很容易被摧毁 仍在南海建基地

博览历史 浏览 4173

这么惊悚的首饰 竟然是维多利亚女王的珍爱之物

潮范儿 浏览 16752

俄常驻联合国代表:现在对乌的和平条件将与去年不同

环球网资讯 浏览 91293

夏天试试这些裙子和裤子 舒适自然又显气质

Yuki时尚酱 浏览 15932

蓉城海港连败0进球!为中超争冠大轮换,媒体人:亚冠毫无吸引力

奥拜尔 浏览 898

内娱白月光,毁于潜规则?

阿淫记录生活日常 浏览 953

朱珠带娃看画展 1岁女儿帮拎4万元包包

娱絮 浏览 15733

李雪琴买咖啡被认成杨幂杨幂对李雪琴说杨幂你好

趣看热点 浏览 26701

希罗赛季首秀24+7热火险胜独行侠夺5连胜 状元14中5华盛顿27+8

醉卧浮生 浏览 397

万项:距离理想中的球员还差很多;最后两场比赛不会放松

懂球帝 浏览 357

胜者为王!德卡大战让法网提前进入狂欢模式,德约和阿卡你挺谁?

网球之家 浏览 16683

经济日报:加大分红回购 激发市场活力

经济日报 浏览 12876

拒绝身材焦虑 Clean Fit风格绝配普通人!

她暖 浏览 16791

百花奖被骂上热搜!网友爆笑吐槽提名:张译调剂了,王宝强转专业

萌神木木 浏览 10734

小S长女获韩国舞蹈大赛冠军 动作不齐未卡点遭嘲讽

娱絮 浏览 16720

纯电续航325km 小鹏P7+增程版申报信息曝光

车质网 浏览 663

华为相关人士:“进军ERP市场”系误读,仅供内部使用

上海证券报 浏览 19147

要害单位夫妻成英方间谍 曾有人为英国偷17份国家秘密

极目新闻 浏览 67749

中国起重机在美当“木马”?外交部:草木皆兵

环球网资讯 浏览 18926

存储芯片超级周期来袭!江波龙股价两个月涨超200%!超85亿存货在手

时代周报 浏览 721

安世中国:已建立充足成品与在制品库存,能稳定持续满足客户订单需求

澎湃新闻 浏览 753
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1