关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者792人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

与美主持人激烈辨论后被闭麦 万斯怒了

环球网资讯 浏览 5023

被这些70后女人美到了!注重配色、配饰、穿衣舒适度,简约大方

静儿时尚达人 浏览 13068

300353,重大资产重组!明日复牌

中国基金报 浏览 713

美军泄密案21岁嫌犯:负责网络通信 有最高机密权限

环球网资讯 浏览 19382

五门版悦也官图发布,命名“宝骏悦也PLUS”

天天汽车 浏览 12416

《大江大河3》结局:看到最后,这个男人竟成了小雷家最大的赢家

肆季娱乐 浏览 12869

官媒揭开70岁潘虹的真实现状,董卿说的一点没错

手工制作阿歼 浏览 732

印媒:通过双航母军演 印度向外界表明自己在变强

参考消息 浏览 16174

通航城市超260个 我国四大世界级机场群建设初具规模

央视财经 浏览 947

爱马仕女骑士无需披甲,却最为强大

时尚COSMO 浏览 990

为何林心如被誉为国内演艺界无可挑剔的典范?

小椰的奶奶 浏览 351

"台独"分子沈伯洋十分担忧求助台陆委会:不敢离开台湾

看看新闻Knews 浏览 11628

免费换电、服务无忧被迫缩水,蔚来赌“人性”,输得一塌糊涂

小李车评李建红 浏览 12339

球王马拉多纳心脏骤停去世阿根廷全国哀悼三天,梅西、C罗等发文缅怀

趣看热点 浏览 25845

对话钦培吉:77岁的莲花,不做六边形战士

网易汽车 浏览 1424

美媒:中国近半年没买过美国一粒大豆 豆农心急如焚

CCTV4 浏览 15592

Shams:太阳预计杜兰特能够在3月底&4月初回归

直播吧 浏览 19648

近两个月13家券商收罚单 投行、经纪业务是重灾区

证券时报 浏览 554

2023最流行的4款单品,时髦炸了!

仙爷种草机 浏览 19897

赞比亚总统:没在北京反美也没在华盛顿反华 求别脱钩

澎湃新闻 浏览 13694

你看不起的零跑,终于打响第一枪!

象视汽车 浏览 829
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1