关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者4034人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

辞旧迎新,元旦档电影满意度发布!

幕味儿 浏览 3128

女子1天接五六通催收电话崩溃:欠钱的是不熟的前同事

环球网资讯 浏览 37495

加沙"狗线":巴勒斯坦人越线即遭射杀 尸体被狗啃食

澎湃新闻 浏览 12988

推广中奖名单-更新至2025年12月15日推广

黎贝卡的异想世界 浏览 3371

冲击330万目标!尹同跃再“吹牛”:AI追赶特斯拉,推17款AI车

明镜pro 浏览 3081

号称追星不用背相机:OPPO官宣哈苏专业影像套装,含增距镜、手柄

IT之家 浏览 4352

被Meta点醒,苹果砍掉廉价头显,押注智能眼镜

网易科技报道 浏览 4298

Intel大小核根本停不下来!甚至要做“统一核心”

快科技 浏览 2515

多哈相杀后转眼迪拜“相爱”,“梅西”就是一直嗑不完的CP!

网球之家 浏览 2574

律所主任疑"借款"9亿失联 客户有上百人最年长者88岁

界面新闻 浏览 7579

钟欣潼前夫被曝婚变,第三任妻子删光合照

树娃 浏览 4069

二排座椅配按摩 新款领克09四驱探索版限时价19.88万起

网易汽车 浏览 4319

香港中文大学团队突破:让AI有了"超级记忆",多步推理能力飙升!

科技行者 浏览 3256

阿尔伯塔大学新突破:让AI学会自我检查错误,准确率远超人工审核

科技行者 浏览 3219

智能化升级 新款卡罗拉锐放限时售9.68万起

网易汽车 浏览 3682

诺和诺德再现高层震荡!董事长等7名高管将集体离职,近一年市值蒸发超千亿美元

时代周报 浏览 4120

美政府停摆15天白宫放话要裁1万人 女法官颁令叫停

红星新闻 浏览 9381

美称对“占领”委内瑞拉保留选择权

南方都市报 浏览 2630

900万粉丝网红到一村庄办杀猪宴:村民收场地费还分肉

极目新闻 浏览 20963

刚亮完核杀器 俄罗斯"末日电台"发出6字神秘信号

参考消息网 浏览 15159

顶流小花反被“恶婆婆”抢了风头?网友:贵气!

Yuki女人故事 浏览 4169
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1