关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者689人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

胡塞到底打中美航母了吗?俄罗斯可以放心干!

浏览 10814

西方再送"大礼" 各方都在豪赌乌克兰大反攻结果

新民晚报 浏览 16327

美国政府新规下,特斯拉车型续航里程普遍下调

IT之家 浏览 12598

茅台,泸州老窖,开始像房地产“去库存”

说财猫 浏览 10606

马斯克宣布首例人类大脑芯片植入,为什么是里程碑事件?

都市快报橙柿互动 浏览 12485

拉什福德社媒鼓励球队:这是马拉松不是短跑,我们会继续战斗

懂球帝 浏览 782

冬天少不了一顶帽子!“贝雷帽”保暖又能凹造型

静儿时尚达人 浏览 13103

最有种的女明星

江湖人称艾掌门 浏览 749

生物育种领域测序高成本何解?分子育种平台华智生物与华大智造共建实验室

澎湃新闻 浏览 10703

夏尔巴向导证实两男子为救人放弃登顶 未要求救援酬金

上观新闻 浏览 92077

俄海军“神盾舰”首次远航 到访土耳其海军基地

环球网 浏览 25915

孟晚舟最近两次公开发言均与它有关 华为在下盘怎样大棋

时代周报 浏览 16524

急诊救命、省钱增效,AI如何改变诊疗?|全民健康大讲堂

澎湃新闻 浏览 210

翁青雅被官媒点名,言辞直戳其肺管子

娱乐圈笔娱君 浏览 731

CBS:错过梅西,利雅得新月准备4500万欧报价内马尔&提供2亿年薪

直播吧 浏览 16639

大坝才被毁 世界最长液氨管道又被炸:剧毒气体外泄

上游新闻 浏览 16233

全锦赛:江苏女篮40分狂胜山东晋级决赛 马文20分罗欣棫14+7

醉卧浮生 浏览 1021

从狂飙到猛踩刹车,动力电池行业洗牌加剧

第一财经资讯 浏览 19110

开启新赛季,迈阿密国际全队启程前往萨尔瓦多参加首场热身赛

懂球帝 浏览 12540

自2020年帽子戏法次数榜:哈兰德12次居首,莱万10次&姆巴佩9次

直播吧 浏览 19177

越涨越卖?英伟达市值冲破5万亿,黄仁勋半年套现10亿美元

华尔街见闻官方 浏览 765
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1