关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3610人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

看来看去还是这些穿搭最高级,不老套、不死板,舒适又显气质

静儿时尚达人 浏览 2722

默茨将率庞大商务团访华 被指"从未如此精心准备出访"

环球网资讯 浏览 39690

市场震荡下均衡配置成“关键手”,资金为何青睐中证500指数?

时代周报 浏览 4703

投机永不眠!加密货币失宠 币圈玩家转战预测市场

智通财经 浏览 3335

尼帕病毒疫情扰动全球神经,A股病毒防治板块逆势拉升

览富财经网 浏览 3426

小鹏旗下又一公司秘密提交IPO

电动知家 浏览 3730

还得是她!杀疯了,也杀爽了!

吐槽电影院 浏览 2941

台陆军运输群车队两辆军用卡车相撞 画面披露

环球网资讯 浏览 4351

网坛名宿预测德约在澳网后退役,被六千名塞尔维亚球迷围攻

网球之家 浏览 4457

S家洗白失败!韩国综艺锤了小S忽视姐姐病情,推卸责任甩锅给大S

萌神木木 浏览 3420

时隔23年,国米和罗马再次在意甲至少10轮过后同分领跑

懂球帝 浏览 4279

贾永婕说小S越来越像大S,两人早已融为一体,过度消费大S惹争议

萌神木木 浏览 4457

美国要求乌单方面撤军 泽连斯基回应

每日经济新闻 浏览 9683

一场战事 三重短缺冲击全球经济

上观新闻 浏览 1677

中国军舰大片震撼上新:雷达一开 周围都是透明的

环球网资讯 浏览 34843

外交部:奉劝包括巴拉圭在内的极个别国家政府认清形势

环球网资讯 浏览 9259

推广|| 每天10分钟状态真的回来了,双11这笔投资好值

黎贝卡的异想世界 浏览 4618

厂补叠加国补,长安启源全新Q05仅6.6万元起

豆哥不卖车 浏览 3744

工银安盛一年赚了25亿,三款“鑫如意”产品退保却达28亿

独角金融 浏览 2755

闫学晶风波后首现身!面无表情状态疲惫,林傲霏新疆同学名单曝光

萌神木木 浏览 3513

卡什:阿卡辛纳这样“双马竞争”对网坛来说不是健康的事

网球之家 浏览 3612
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1