关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者4004人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奥迪“掀桌了”!德味纯电A6L续航815km+华为智驾赋能

有车以后 浏览 1372

随着阿森纳1-0领先,曼城0-1落后,英超最新积分榜:利物浦4连败

侃球熊弟 浏览 4173

这些韩系穿搭最适合普通人!多穿深色、衣服基础,简洁耐看

静儿时尚达人 浏览 3026

陈奕迅回应患焦虑症:仍在服药看医生,但已好转大半

大象新闻 浏览 4186

韩素希再谈与柳俊烈李惠利争议:还能怎么办呢

韩小娱 浏览 3123

秋天穿衣真的很简单,看看这些造型就有灵感,舒适简约又自然

静儿时尚达人 浏览 4015

京沪高铁:一道复杂的算术题

锦缎研究院 浏览 3373

两女生称花90多元入住成都民宿 在空调管道发现摄像头

极目新闻 浏览 106657

大盘五连涨!今年3次五连涨后发生了什么?

每日经济新闻 浏览 3435

OpenAI推出GPT-5.5 Instant:更可靠、更智能、向全体用户开放

华尔街见闻官方 浏览 989

球报总监:穆帅执教切尔西和皇马时不这样,带曼联之后就变了

懂球帝 浏览 2976

理想i6“涨价”:现金减免从1万元调整为5000元

电动知家 浏览 4148

牛弹琴:英国"动真格"了 王子被"大义灭亲"剥夺头衔

上游新闻 浏览 14935

俄方:乌克兰袭击赫尔松地区目标致超20人死亡

环球网资讯 浏览 3315

大S离世一周年,S Hotel酒店大门被木板封住

素素娱乐 浏览 2877

国债被"抛售"债市遭暴击 日本或在未来面临金融风暴

红星新闻 浏览 35876

CBA常规赛第一阶段排名:广厦第一,上海第二,四川23连败垫底

懂球帝 浏览 2919

里沙利松:踢日本要展现出与踢韩国一样的强度

懂球帝 浏览 4318

乐摩科技八成设备“躺”在影院

北京商报 浏览 3752

咸阳7亿多投资重点项目"未批先建" 当地:情况属实

大风新闻 浏览 8563

苏超,明年有新变化!省政府再做部署!

国是直通车 浏览 3999
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1