关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者3453人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

冬天的毛衣,越“大”越好看!

LinkFashion 浏览 2560

蔚来乐道汽车迎 11 万台新车交付,距离 10 万台里程碑仅 13 天

IT之家 浏览 3501

荣耀“既Pro又Air”新机设计线稿首曝

IT之家 浏览 2720

魏牌再换CEO,哈弗一把手赵永坡兼任!长城冲击高端化需要更多牌?

时代周报 浏览 2928

孙颖莎脚踝伤势或不严重!行走自如+下蹲轻松 回京养伤坐等乒超?

颜小白的篮球梦 浏览 3038

尼斯和巴黎FC的比赛中看台响起恐同口号,导致比赛中断几分钟

懂球帝 浏览 4251

OpenAI与亚马逊签署380亿美元算力采购协议,减少对微软依赖

IT之家 浏览 3494

美日印澳4国大使北京会谈 不到24小时印度向中国示好

南宫一二 浏览 17890

潍坊一水库水现石油色承包人称死鱼超3万斤 当地回应

澎湃新闻 浏览 8838

电车销量涨不动?油车打响“销量保卫战”

少数派报告Report 浏览 2883

黄金有关税收新政落地首周,市场各方反应如何?

中国商报 浏览 3493

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者 浏览 3649

王心凌吴克群被偶遇,曾多次合体同游逛街,被扒出多个同款饰品

扒虾侃娱 浏览 3318

"震荡"之后中美传来好消息 李成钢的表态意味深长

中国新闻周刊 浏览 8982

50+女人别穿得“老气横秋”!掌握3个穿搭密码,减龄又优雅

静儿时尚达人 浏览 3145

于晓光做梦没想到,李在明访华秋瓷炫竟火出圈

草莓解说体育 浏览 2589

香港男子在宏福苑大火中失去母亲和弟弟:撑不下去了

极目新闻 浏览 34821

吊打内娱的阴湿女王,回来了

独立鱼 浏览 3617

普京会见伊朗最高领袖顾问:正密切关注伊朗局势

上观新闻 浏览 2354

国米客战那不勒斯:劳塔罗搭档博尼,德布劳内、巴雷拉出战

懂球帝 浏览 3570

贝克汉姆家闹出大瓜!豪门大戏再添新章

观察鉴娱 浏览 4202
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1