关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2972人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这次结果如何?切尔西上次在1月换帅后拿了欧冠

懂球帝 浏览 3311

硅谷投资人盛赞特斯拉人形机器人:将令人忘掉特斯拉造过车

澎湃新闻 浏览 3140

月薪涨150被骂抠门?宁德时代宣布涨薪,回应来了;小米汽车将开放「现车选购」,预计年底前可提;字节联手中兴打造首款豆包助手手机

雷峰网 浏览 3671

勇士124-106鹈鹕 球员评价:穆迪满分,5人良好,3人低迷

篮球资讯达人 浏览 3923

天空:曼联在关注雷恩中卫雅凯,他冬窗不太可能加盟

懂球帝 浏览 3300

郑钦文排名跌至世界第24!年终确定跌出前20 不影响澳网种子席位

风过乡 浏览 4230

今秋最撩的“薄外套+裙子”,谁穿谁美!

Yuki女人故事 浏览 6209

理查兹:道曼和萨卡位置重叠,为球员未来发展应该将他外租

懂球帝 浏览 3984

进化是否足够?法拉利Amalfi首测:新名字,旧传统

ams车评网 浏览 3264

甩掉包袱 保时捷宣布2026年起逐步关停自建充电网络,转向公共充电矩阵

封面新闻 浏览 3383

斯洛特:尽管我们取得四连胜,但球队的表现并不完美

懂球帝 浏览 3436

专访陶一伟:离开特斯拉,用300美元“开源手”挑战老东家

蓝鲸新闻 浏览 4117

乌代表团“换将”赴美 佩斯科夫:俄方只和美国谈

每日经济新闻 浏览 3677

遭拒绝后,派拉蒙仍坚持以30美元/股收购华纳兄弟

财闻 浏览 3190

体系决胜 长安汽车从300万辆进击全球TOP10的"增长逻辑"

网易汽车 浏览 1167

中国最北端宜家即将闭店 东三省仅剩辽宁有宜家可逛

极目新闻 浏览 9039

聚焦进博|一个巴西律师的“新上海故事”

国际金融报 浏览 3939

穿了10年还在火,这件外套买得真值!

黎贝卡的异想世界 浏览 3118

乌国家科学院人口研究所:乌人口规模或将下降三成

红星新闻 浏览 3547

港科大突破:代码本技术提升AI医学图像分析稳定性

科技行者 浏览 2998

保安打人赔35万结案13年后15人被公诉 被害人从未控告

澎湃新闻 浏览 10179
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1