关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3230人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

针对其父可能被“身边人”出卖的传言 马杜罗之子回应

上观新闻 浏览 3234

韩素希再谈与柳俊烈李惠利争议:还能怎么办呢

韩小娱 浏览 3120

澳网官方推出预测活动,男女任一签表结果全对可得1000万澳元奖金

懂球帝 浏览 3207

看了这些日系穿搭才知道,还是西装和衬衫最靠谱,舒适大方

静儿时尚达人 浏览 4016

空客天津第二条总装线投产,称产能提高需联合各方构建更具韧性的供应链

澎湃新闻 浏览 4257

深耕专业 以赛促评 2025寰球汽车年度车测评收官

网易汽车 浏览 3401

贷款炒金的"黄金赌徒"后悔了:有人3天亏掉2个月工资

第一财经资讯 浏览 9449

三年半亏掉62亿,244亿大模型巨头剑指港股

雷达财经 浏览 3352

我国2025全年词元累计调用量约21100万亿

IT之家 浏览 1119

冬天的毛衣,越“大”越好看!

LinkFashion 浏览 2963

年内暴涨540%!比存储芯片更猛的大牛股爆了

财经锐眼 浏览 900

球迷态度:颜王刘三人均已34+,李昊今年能否接班国足一门?

懂球帝 浏览 3183

笔在手中,镜头是新墨水

上观新闻 浏览 3215

足球报:J联赛改为跨年赛制,将对降雪地区俱乐部补贴50亿

懂球帝 浏览 4222

佘诗曼《新闻女王2》首波口碑出炉了!现场观众的评价一针见血

娱乐圈笔娱君 浏览 3964

电车购置税补贴减半在即,这场兜底之战谁敢不打?

汽车公社 浏览 4090

冯小刚携徐朵亮相芭莎盛典,21岁养女气质蜕变

露珠聊影视 浏览 3247

微软CEO纳德拉:能源成本将决定哪些国家能在人工智能竞赛中胜出

IT之家 浏览 3091

有图无真相?沙特空中球场网传渲染图与官方图片不一致

懂球帝 浏览 4083

迪拜多地发生爆炸起火 当地停工停课

极目新闻 浏览 2429

玩家用PS5手柄意外获得6700台大疆扫地机器人控制权:实时视频流泄露 官方回应

快科技 浏览 2591
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1