关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3366人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

视频丨俄称战场进展迅速 乌称面临严峻挑战

国际在线 浏览 3861

无显示屏、靠Siri控场?苹果首款眼镜核心功能全曝光

环球网资讯 浏览 3951

美政府"停摆"破纪录 英伟达市值一夜蒸发1.4万亿元

每日经济新闻 浏览 9528

美联储的“十字路口”

21世纪经济报道 浏览 5248

新华社权威快报|“中国天眼”揭示快速射电暴双星起源关键证据

新华社 浏览 3519

喊球迷别卖票自己却缺阵?76人0-2落后,大帝G3出战成疑

仰卧撑FTUer 浏览 1338

普京:美版和平方案与普特会讨论一致

新华社 浏览 4196

欧洲11国及欧盟领导人联合声明:承诺为乌提供安全保障

环球网资讯 浏览 20855

特朗普否认美军将领“反对与伊朗开战”

上观新闻 浏览 2952

ELLE风尚盛典秒变菜市场,有人摔倒、有人调侃内涵,状况百出

Yuki女人故事 浏览 3626

摄影比赛第一名被指是AI生成图片 被取消成绩

封面新闻 浏览 8147

博主:此前杨瀚森屡屡被DNP时,很多当地球迷都要求退季票

懂球帝 浏览 3826

多只明星基金减仓茅台,为啥茅台不被资本欢迎了?

江瀚视野 浏览 1350

又一部国产剧,靠「擦边」火出圈了

独立鱼 浏览 3359

44岁李小璐参加公开活动!怼脸拍真实状态曝光,网友态度两极分化

萌神木木 浏览 4597

记忆大模型MemoraX AI完成千万美金种子轮融资,L2F光源创业者基金、钟鼎资本联合领投 | 融资速递

钛媒体APP 浏览 1548

广汽启动自主品牌BU改革 昊铂埃安渠道统筹运营

网易汽车 浏览 3797

OPPO Find X9 系列实拍:定位“旅拍神器”,口袋里的哈苏相机

IT之家 浏览 4473

男子花3万请网红带货:下599单仅成交4单收入700元

环球网资讯 浏览 14466

佘智江获利达1.5亿元:曾逼美貌女性卖淫 或供"玩乐"

新京报 浏览 18590

被章若楠、秦岚带火的鞋子竟然是它?春天这样穿又美又气质!

LinkFashion 浏览 2995
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1