关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2970人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国产自主研发喷气式飞行背包进入小批量生产阶段

IT之家 浏览 3892

美联储报告:政策不确定性成头号金融稳定风险,央行独立性首次被点名,关注金融杠杆

华尔街见闻官方 浏览 3957

U23亚洲杯身价榜:中国第三力压日韩,沙特居首伊朗次席

懂球帝 浏览 3252

知情人士:特朗普政府拒绝与伊朗启动停火谈判

国际在线 浏览 2138

书记戴的AI眼镜全网刷屏!今年东博会这个含量“爆表”

国是直通车 浏览 4857

脑机接口再迎政策利好,50只核心概念股“抢跑”

览富财经网 浏览 3023

央视披露解放军实战演练"斩首"行动画面

北京日报 浏览 2841

俄军中将在汽车炸弹爆炸中身亡 现场画面披露

央视新闻客户端 浏览 3449

大车要做大,小车更加要——工信部第399批新车热评

吴佩频道 浏览 4107

美国否决加沙停火决议草案后 以美代表亲切握手

看看新闻Knews 浏览 4858

一塌再塌!36岁檀健次与大二女生谈恋爱,他的高跟鞋就是锤

严肃八卦 浏览 3353

ByteDance最新发布:一个能从任意数量图像重建3D世界的神奇模型

科技行者 浏览 3158

伊朗方面披露美军在伊南部海域兵力布防

新京报 浏览 2901

年报收官 现金分红成估值重估重要变量

北京商报 浏览 929

沉默的荣耀大结局前瞻,最惨角色出炉,果然不幸的人各有各的不幸

娱乐圈笔娱君 浏览 4267

“黑色大衣”今年冬天又火了,怎么搭都高级时髦

LinkFashion 浏览 2994

俄大使披露:美军控制马杜罗时 没打算让任何人活下来

扬子晚报 浏览 7641

“合肥系”国资出手,投入超29亿元现金,要拿下显示屏巨头控制权!

每日经济新闻 浏览 4077

英媒:由于伊萨克受伤,利物浦预计不会在冬窗放走萨拉赫

懂球帝 浏览 3549

三年打入越南Top 5,这家纸巾厂的出海秘诀是什么?

虎嗅APP 浏览 4243

在韩国创特斯拉最低价 "廉价版"特斯拉亚洲开售

电动知家 浏览 3065
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1