关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3211人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

澳网总监:女子赛事若采用五盘三胜,或将在2027年实施

懂球帝 浏览 2905

世界杯期间,纽约将免费开放五个官方球迷区

懂球帝 浏览 1197

佩德里:我们没参与抗议,开场也静默15秒是出于对同行的尊重

懂球帝 浏览 4335

联合国官员:加沙惨状如末日电影

上观新闻 浏览 3294

德国总理首次访华时间被指敲定 高级经济代表团将跟随

澎湃新闻 浏览 7539

普京:俄罗斯将在战场解放故土 欧洲"猪猡"将下台

参考消息 浏览 3505

真正的独立女性,从不在深夜委屈自己

她刊 浏览 2305

特朗普:将在"适当时机"结束对伊朗军事行动

界面新闻 浏览 2295

同样被网友玩梗,李湘给张纪中“上了一课”?

深析古今 浏览 3309

周末利好刷屏!中美元首通话、国常会重磅,下周一重磅发布会

看财经show 浏览 4919

足总杯117年最大冷门!卫冕冠军首战出局,被业余球队淘汰

奥拜尔 浏览 3233

世体:马竞不会轻易放走拉斯帕多里,未来几天罗马将加大攻势

懂球帝 浏览 3384

闫学晶首现身再传噩耗,这回真洗不白了

草莓解说体育 浏览 3142

中美达成共识让美豆农松口气 盼望中方订单快点来

环球网资讯 浏览 15110

《寒战1994》票房大爆,四位演员被赞,演技才是真正的颜值滤镜

娱乐圈笔娱君 浏览 937

车企“灵魂论”彻底“失声”?

盖世汽车 浏览 4814

中国军舰大片震撼上新:雷达一开 周围都是透明的

环球网资讯 浏览 34425

牛弹琴:2025年最后1个月大戏上演 印度迎最重要客人

北京日报客户端 浏览 35547

湖北武汉加速构建人形机器人产业发展生态

新华社 浏览 4065

清华大学团队发明"聪明偷懒"的AI:让人工智能只在难题上深度思考

科技行者 浏览 3151

美媒:特朗普发帖"禁止"以轰炸黎 内塔尼亚胡感震惊

新华社 浏览 1286
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1