关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2451人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿维塔第21万辆正式下线

三言科技 浏览 2989

日本联合28国在联合国接连围攻中国 中方当场"报仇"

归史 浏览 31649

穆勒:我认为这场美职联决赛非常棒;再次见到梅西他们很开心

懂球帝 浏览 3057

德容:理解巴萨曾想卖了我,当时财政困难

懂球帝 浏览 3682

26款奔驰“小S级”售价亲民,外观豪华,车长超5米,搭载2.0T轻混

小史谈车 浏览 2076

岚图泰山Ultra测试车曝光 华为四激光L3级SUV将首量产

林林Go 浏览 2648

阿隆索:我们在安菲尔德跑动太少?不能凭一场比赛下结论

懂球帝 浏览 3540

特斯拉在欧洲加速推广FSD!新增试驾体验,产品进入全新国家

车东西 浏览 2512

冬季羽绒服是最“受捧”的单品,这样选款和搭配,舒适耐看

静儿时尚达人 浏览 2048

拉什福德渴望永久转会愿大幅降薪!暗讽曼联,称巴萨让他重获新生

罗米的曼联博客 浏览 3725

原来他们是夫妻,恩爱27年无绯闻.现是影协主席

冷紫葉 浏览 4116

112名“中国留学生”被韩国调查

中国新闻周刊 浏览 32726

离婚2个月,54岁的李亚鹏再迎“噩耗”

洲洲影视娱评 浏览 2700

杭州巨准斥资超8亿入主华是科技,能否力挽狂澜?

览富财经网 浏览 2534

贝壳豪掷23亿美元回购,董事长彭永东“花公司钱为自己股票护盘”

财经众议院 浏览 3353

Unity 中国官宣与零跑汽车合作,打造下一代智能座舱交互体验

IT之家 浏览 3470

潍坊一水库水现石油色承包人称死鱼超3万斤 当地回应

澎湃新闻 浏览 8829

区委书记别硬演,黄晓明拿腔捏调,好出戏,有人却演成了干部本尊

娱乐圈笔娱君 浏览 2581

陈凯歌做梦也没想到,竟有一天会因儿子陈飞宇,实现口碑暴增

温柔娱公子 浏览 3522

乌在黑海海域击沉一艘俄“影子舰队”油轮

上观新闻 浏览 2360

斯塔默:中国已崛起 英国需要承认这种现实的对华政策

环球时报 浏览 21815
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1