关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2682人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

物资极端短缺 加沙人被迫步行5公里买几张饼

北青网-北京青年报 浏览 3560

辽宁晋级四强发布会!杨鸣满意全队专注,展望四强不留余力拼广东

篮球资讯达人 浏览 3364

汪小菲接俩娃回北京过春节!玥儿和奶奶逛公园

地理三体说 浏览 2505

吉利陈奇:L3全场景普及仍需时间,安全与成本平衡是行业关键

网易汽车 浏览 3495

从宗馥莉到王思聪 为何企二代陷"接班困局"?

BT财经 浏览 3741

雷军回应内部会议将玄戒O1读成01:鬼使神差念错了

IT之家 浏览 2650

纯电版奥迪A6亮相!外观很动感,配800V架构+5块大屏,续航785Km

小史谈车 浏览 3085

哈马斯高层在多哈遇袭后首次现身

政知新媒体 浏览 4233

古巨基官宣二胎!妻子57岁高龄产子挑战生育极限,网友质疑代孕

萌神木木 浏览 2792

户外品牌除了炸山就没有出路了吗?

诗与星空 浏览 3605

美政府"关门"将结束 民主党8人倒戈加入共和党人行列

红星新闻 浏览 34350

新增双色特别涂装 全新宝马X7将2027年上市

车质网 浏览 2379

章若楠妹妹大婚

观察鉴娱 浏览 3620

连打工人出差都住不起亚朵了?日益昂贵的亚朵该咋看?

江瀚视野 浏览 4482

“精准”归来:戴尔正式宣布推出"Pro Precision"工作站产品线

IT之家 浏览 1711

哈马斯称将把加沙地带行政控制权移交临时委员会

环球网资讯 浏览 3508

互黑式宣发:赵丽颖、黄晓明互动

孟一宜 浏览 2917

都体:加拉塔萨雷对弗拉泰西开始犹豫,认为他防守属性不够强

懂球帝 浏览 2722

媒体:被美国逼着“朝中国开枪” 韩国玩得起吗

澎湃新闻 浏览 3801

悉尼枪手父亲被击毙儿子被制服 愤怒民众猛踩头部

潇湘晨报 浏览 8310

音频实证日本有意滋扰中方训练

玉渊谭天 浏览 2111
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1