关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者3964人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

DO:热刺若降级,绝大多数球员薪资将被削减约50%

懂球帝 浏览 2462

曾炒到1600元/粒的"中药茅"大跌价 公司市值蒸发1800亿

每日经济新闻 浏览 9826

敷尔佳:定价过高、盟友倒戈,重营销模式难掩发展困境|ESG案例

网易财经ESG 浏览 3294

普京与特朗普通电话 讨论伊朗局势

环球网资讯 浏览 2248

胡塞武装:以军空袭萨那致9死174伤 包括大量妇女儿童

极目新闻 浏览 4795

脱口秀演员杨笠清空社交账号 她到底经历了什么?

代军哥哥谈娱乐 浏览 3990

圣保利vs霍芬海姆:季维加瓦、藤田让瑠奇马首发,克拉马里奇、曹法尔出战

懂球帝 浏览 4189

单日6只大规模基金成立!主动权益基金四大指标,超去年全年

券商中国 浏览 263

大疆突然降价有的便宜近1500元 有人傻眼:刚买没几天

大象新闻 浏览 19051

最好看的羽绒服,都满足这几点

Yuki女人故事 浏览 2969

诺伊尔说希望自己看上去没有马特乌斯那么老,随后赶紧纠正

懂球帝 浏览 4989

1-8月酒饮料茶行业利润增速19.9%,白酒行业迎来困境反转了吗?

郭施亮 浏览 4795

光伏巨头通威、隆基预亏近百亿,行业深度调整未见拐点

华尔街见闻官方 浏览 3186

迟蓬:65岁,我不急

时尚COSMO 浏览 6348

美2027财年国防预算恐创纪录 五角大楼查女兵"有效性"

红星新闻 浏览 13907

一年中最不能错过的推送,超适合过年看!

黎贝卡的异想世界 浏览 2554

登顶全球第一后,这家中国公司把“具身大脑”开源了!

华尔街见闻官方 浏览 3161

Altman放话:2028年,超级智能将超越人类

钛媒体APP 浏览 2525

专家:自民党与公明党谈崩了 给高市早苗当头一记闷棍

澎湃新闻 浏览 4743

高盛顶级交易员:美股临近CTA卖盘触发位,市场企稳看政府开门

华尔街见闻官方 浏览 3960

碰瓷营销还是真有实力 创维汽车的“生存者游戏”

网易汽车 浏览 2146
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1