关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2479人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

王心凌吴克群被偶遇,曾多次合体同游逛街,被扒出多个同款饰品

扒虾侃娱 浏览 3315

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

IT之家 浏览 3517

贝克汉姆率领一家7口亮相,唯独大儿子布鲁克林和妮可拉缺席

素素娱乐 浏览 2405

迟蓬:65岁,我不急

时尚COSMO 浏览 5687

长安林肯航海家燃油 SUV 新增“启航版”上市,24.59 万元

IT之家 浏览 4205

德国联邦统计局数据显示:今年前8月,中国再成德最大贸易国

环球网资讯 浏览 3736

海昌智能IPO:“母子”共同“闯关”,重大关联交易或成拦路虎

览富财经网 浏览 2606

西媒:巴萨2019年违规接触格子,可能构成管理不善和账目造假罪

懂球帝 浏览 3742

美防长:战事不会“没完没了”

环球网资讯 浏览 463

重回“ABB”,一汽奥迪逆势突破背后的“价值竞争”

桑之未 浏览 2556

委内瑞拉空军基地遭美袭击后 导弹碎片四散

极目新闻 浏览 2665

三年半亏掉62亿,244亿大模型巨头剑指港股

雷达财经 浏览 2851

徐彬:邵指导是第一个想让我出去踢球的;拿手菜有把子肉

懂球帝 浏览 2427

聚焦AI+畜牧,刘松柏攻破鸡味密码,打造终身学习广东样本

南方都市报 浏览 1986

董秘也“打短工”?道通科技董秘上任5个月即离任

华夏时报 浏览 3614

来自天南地北的春日穿搭和美景,都太美了吧!

黎贝卡的异想世界 浏览 1712

官宣!这座“一线”省份,继续力挺省会

西部城市 浏览 3597

国内首个开放式机器人租赁平台在沪发布,已触达50个重点城市

澎湃新闻 浏览 2889

斯基拉:萨索洛换帅考虑米兰旧将阿巴特

懂球帝 浏览 737

与抖音退货服务“分手”,1300亿王卫有何打算?

雷达财经 浏览 2955

蔡康永发文缅怀大S,说大S应该被好好疼爱的

素素娱乐 浏览 2444
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1