关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2461人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

直瀑式格栅/3种座椅布局 第三代豪越L正式亮相

网易汽车 浏览 3407

高芙输球后更衣室摔拍遭外界批评,萨巴一句女人比男人耐热惹争议

网球之家 浏览 2493

四个月内两高管遭留置 富森美称与上市公司无关

中国经营报 浏览 3258

Altman放话:2028年,超级智能将超越人类

钛媒体APP 浏览 1997

澳足协批准米兰来战,亚足联

体坛周报 浏览 3595

特朗普被指一边喊一边咒骂 让乌方把顿巴斯地区给俄方

红星新闻 浏览 9339

俄称挫败乌军空降行动

上观新闻 浏览 2839

游戏规则变了,Stellantis或用中国技术再造Jeep

禾颜阅车 浏览 3589

ST路通内斗激化!“资本大佬”吴世春“抄底”遭遇绊脚石

野马财经 浏览 3536

刘涛为95花作配,国民女星的资源降级还是新机遇?

八卦三缺一 浏览 4399

马英九首度"自嘲"回应赖清德:我还要救援几次

台海网 浏览 18082

星光伴我心,不朽迷影佳作今晚点亮大银幕!

幕味儿 浏览 2946

福建舰全体官兵列阵 送上硬核祝福

央视军事 浏览 1992

隔空互撂狠话后白宫相见,佩特罗给特朗普提了一个建议

国是直通车 浏览 2387

勇士不敌湖人!波杰统领攻守,替补2将齐爆,库明加格林失误多!

篮球资讯达人 浏览 3768

智谱正式发布并开源混合思考模型GLM-4.7-Flash,供免费调用

财闻 浏览 2508

哈工大发现漫画思维:让AI像看连环画一样做数学题

科技行者 浏览 2430

"特朗普级"战列舰造价公布:高达220亿美元

极目新闻 浏览 2592

媒体:华盛顿一声枪响后 美英两个老人握手较劲八秒

新民周刊 浏览 31687

浙江大学StaMo实现静态图像生成机器人动作

科技行者 浏览 3396

孙红雷和妻子王骏迪逛街,比老婆矮显娇小

八怪娱 浏览 2723
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1