关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12430人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

浙江挖笋失联村民已无生命体征 被指没带厚衣服和食物

极目新闻 浏览 81054

明星最新穿搭欣赏 你最pick谁

明星时尚穿搭解析 浏览 19834

向太声称女生不要下嫁,网友质疑何超莲窦骁离婚

草莓解说体育 浏览 977

河北16岁高中生离家失联14天 所骑电动车在湖边被发现

极目新闻 浏览 76069

OpenAI向所有用户开放ChatGPT“自定义指令”功能

网易科技报道 浏览 14789

端午节消费回暖,预示经济呈复苏迹象

开伟思考 浏览 15625

武汉女子遭遇APP投资骗局:起诉被驳回 警方又不立案

上游新闻 浏览 6709

一位基金经理的真情告白

金石杂谈 浏览 12573

女人50岁衣服不要买多 建议准备好这四件单品

虎哥说衣不二 浏览 15152

中规中矩!范弗利特全场出战42分钟 19中7贡献20分6板10助

直播吧 浏览 12434

官方披露歼-20可"轻易达到超音速巡航" 引发外媒关注

环球网资讯 浏览 10987

适合微胖女人“不显胖”的穿搭,保暖不臃肿

静儿时尚达人 浏览 13040

Unity 中国官宣与零跑汽车合作,打造下一代智能座舱交互体验

IT之家 浏览 777

美官方称空袭效果好 美媒称胡塞武装未受重创

国际在线 浏览 12875

NBA全明星正赛全场数据:东部飚中42记三分,命中率为43.3%

懂球帝 浏览 12204

雷军在京喊话:共同抵制网络水军、黑公关

大象新闻 浏览 974

中东壕客下单:先订600台!飞行汽车海外最大订单来了

南方都市报 浏览 1022

敷尔佳:定价过高、盟友倒戈,重营销模式难掩发展困境|ESG案例

网易财经ESG 浏览 685

现场视频:美英空袭也门胡塞武装

CCTV国际时讯 浏览 12400

今年TVB已有7位老戏骨离世

萌神木木 浏览 790

官宣:vivo成为杭州亚运会官方手机

网易科技报道 浏览 16494
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1