关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2700人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:美方28点计划引全球哗然 泽连斯基将背负骂名

经济观察报 浏览 15263

一个长城战略下,哈弗重塑命名体系

帮宁工作室 浏览 3636

限时售9.29万起 第五代瑞虎8正式上市

网易汽车 浏览 3413

颜丙燕公开恋情 男友小她20岁,被误认成“儿子”

韩小娱 浏览 3739

马塞利诺:虽然很困难,但我们想要击败尤文图斯

懂球帝 浏览 4321

智己汽车2025全年销售81,017台 创历史新高

网易汽车 浏览 2949

北京大学联合多所知名高校突破机器人视角转换技术

科技行者 浏览 3461

俄黑海港口设施遭袭,乌军证实实施火力打击

潇湘晨报 浏览 3441

17岁日乒一姐状态堪忧:亚锦赛再败苦主 近五战最远8强各种被逆转

颜小白的篮球梦 浏览 3798

穆尼奥斯:队员们的努力配得上这场比赛,只是结果没达到预期

懂球帝 浏览 4422

林俊杰疑似回应恋情:无需多言

粵語经典歌單 浏览 3136

美国宣布针对伊朗实施新一轮制裁

上观新闻 浏览 2427

伊姐周六热推:电视剧《方圆八百米》;电视剧《金关》......

伊周潮流 浏览 520

OpenAI更新ChatGPT使用政策,禁止提供专业医疗、法律和财务建议

IT之家 浏览 3424

欧尔班:欧盟正讨论迫使俄赔偿乌方 从而偿还欧盟贷款

大风新闻 浏览 7065

WTT重庆冠军赛:莫雷加德3-0横扫丹麦猛将,即将迎战国乒温瑞博

乒谈 浏览 1799

男子取170万元现金 在银行门口遭抢劫致重伤左眼失明

扬子晚报 浏览 17452

看起来很好亲的唇,能养出来?

时尚COSMO 浏览 2737

女人不管多大都可以这样穿衣搭配,不花哨、不臃肿,优雅舒适

静儿时尚达人 浏览 3287

18亿大并购,光模块独角兽,打响量产第一枪!

飞鲸投研 浏览 1033

女子应聘疑遭老板性暗示 涉事企业法人:出于工作需要

极目新闻 浏览 8873
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1