关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3603人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

尼克斯大胜送黄蜂7连败 布伦森33分首发五人组狂轰111分

醉卧浮生 浏览 4204

小伙去理发被店家弄到VIP房间后脸白了 联系父母要钱

1818黄金眼 浏览 13345

猪肉消费大变革!爱尔兰猪肉抢占新赛道

餐饮老板内参 浏览 3554

电池都能紧急弹射了,什么时候整拦截技术?

汽车公社 浏览 4853

十五运会开幕式收视出炉!最高破3.9%,刘德华上场涨出小高峰

萌神木木 浏览 3541

53岁蔡少芬累到虚脱 15岁就开始为母还债 好辛苦

疯说时尚 浏览 4143

理解了这轮“金铜铝牛市”的底层逻辑,也就理解了中国经济的未来

锦缎研究院 浏览 3859

张艺谋审美真牛!《玉茗茶骨》从娜扎到程潇,都不及张慧雯古典

温柔娱公子 浏览 2910

全球首个飞行汽车量产工厂试产,何小鹏官宣:期望在2026年量产机器人

商用车头条 浏览 4375

将于6月上市 上汽大众途观L ePro谍照曝光

车质网 浏览 3418

斯卢茨基:最后时刻丢球难以接受,争冠主动权已不在我们手中

懂球帝 浏览 5247

通过民间借贷获取大额回报,利用职务便利低买高卖房产......农行冯建龙被开除党籍

财通社 浏览 3413

何赛飞年初二下海岛拜年,圈外老公罕出镜

小徐讲八卦 浏览 3051

深圳“AI+政务”方案重磅发布:以后办业务,一句话的事!

南方都市报 浏览 2809

一句话,干掉586亿

深蓝财经 浏览 5392

张萌携老公现身演唱会,被拍后导演紧急切屏

泠泠说史 浏览 5157

科幻神作首度来袭,苏州跨年放映今日开票!

幕味儿 浏览 3149

伊姐周日热推:电视剧《重影》;电视剧《山河枕》......

伊周潮流 浏览 3782

冬天衣服别只选一个颜色!还可以试试这几种色彩,好看又高级

静儿时尚达人 浏览 3373

E句话| 这对邪门CP又是哪里来的?

仙女事件簿 浏览 3530

美军机沿伊朗边界飞行 伊朗寻求外交支持

新华社 浏览 3639
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1