关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者629人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

普京指挥俄军战略核力量综合演习

环球网资讯 浏览 904

SpaceX称识别并切断缅甸电诈园区周边逾2500台“星链”设备

澎湃新闻 浏览 909

李云迪风波升级!司晓迪否认嫖娼关系,爆料男方擅长用小号聊女生

萌神木木 浏览 778

世体:拉菲尼亚将坐在替补席额外座位上,为球队提供支持

懂球帝 浏览 867

黄仁勋亲赴台积电“讨要更多芯片” 回应存储短缺、涨价等问题

财联社 浏览 631

余承东:华为没有必要自己下场造车,不会涉及20万价位以下市场

界面新闻 浏览 19420

全球首个太空AI诞生,H100在轨炼出!马斯克爆赞

新智元 浏览 93

没钱也要发奖金?FF宣布员工激励计划:奖励现金或股权

手机中国 浏览 14296

欧洲高官频频访乌许援助 俄方回应:口头承诺

环球网资讯 浏览 12259

"网红罗大美遇害案"新进展:三名被告人均提出上诉

扬子晚报 浏览 7123

杨采钰新恋情曝光,离开刘亦菲“干爹”资源降级

不八卦会死星人 浏览 13123

世体:霍安-加西亚恢复顺利,不排除入选本周末联赛大名单

懂球帝 浏览 839

米体:普利希奇将接受医疗检查,阿莱格里和米兰对美国队不满

懂球帝 浏览 991

计划3年完成200个AI项目 川影联动人工智能协会打造“AI影视工业梦工厂”

封面新闻 浏览 1067

普京:要继续增加俄罗斯军队现代化武器供应

新京报 浏览 10895

05后星二代“四大顶流”,为什么是她们?

仙女事件簿 浏览 1020

浦发银行APP弹窗“不投股市”?真相:只是一只纯债基广告,近期权益基金发行占比已有回升

财联社 浏览 12938

免疫调节原研药赛能缺货致价格翻倍!已有药店限购,相关企业回应:涨价是市场行为

红星资本局 浏览 804

记者:詹姆斯复出后将湖人的快攻水平从倒数后5提升到正数前5

懂球帝 浏览 380

中企派2000名工人赴欧洲建厂 英媒还在存心挑拨

澎湃新闻 浏览 1853

AI信任危机加剧:Sora视频“以假乱真”,国内灰产3元“洗白”水印

蓝鲸新闻 浏览 976
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1