关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者4157人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国家,给人工智能定了新调子

米筐投资 浏览 3905

336万年薪请来的CEO,上任两个月就“失联”,高鑫零售的转型阵痛期

红星资本局 浏览 2936

伊姐周日热推:电视剧《声渊》;电视剧《绝境通缉令》......

伊周潮流 浏览 3200

中企在拉美花22个月建成的铜矿无法投产:总统换人了

每日经济新闻 浏览 10603

环球圆桌对话:G7打造“稀土联盟”更像是政治表演

环球网资讯 浏览 4227

马德里竞技,贝蒂斯国王杯四分之一决赛对手

绿茵情报局 浏览 3121

曝涉案俱乐部罚分不降级 国安名宿上禁足名单 苏宁名将或就此退役

我爱英超 浏览 3042

REDMI K90 Pro Max 可与 iPhone / 小米 17 Pro Max 通用钢化膜

IT之家 浏览 4138

以军空袭也门首都萨那 以色列多地拉响防空警报

上观新闻 浏览 4668

音乐人袁惟仁去世享年57岁 此前曾摔倒成植物人数年

极目新闻 浏览 9129

不是谁弱谁有理,何美延只是说的好听

小椰的奶奶 浏览 2989

修杰楷承认造假!逃役失败因贾静雯怀孕提前退伍,面临牢狱之灾

萌神木木 浏览 3406

泽连斯基新年致辞:不要"乌克兰的终结"

中国经济网 浏览 3328

库克将正式卸任苹果CEO:创造4万亿帝国 访华达20次

澎湃新闻 浏览 30920

预测票房26亿!除了中文配音拉胯,《疯狂动物城2》没任何毛病

最爱酷影视 浏览 3802

出场时间创新低,记者:马刺有意交易索汉来换更强的轮换球员

懂球帝 浏览 3440

专家解读:“最后期限”前 美国伊朗如何出牌

新华社 浏览 2976

霍家主母显气度:一代卖船供学二代稳大局三代全颜面,四代无人及

不八卦会死星人 浏览 3068

AI春节大战 阿里30亿元跟进:要流量更要消费生态

北京商报 浏览 2988

于正怒了!状告百万网红大V索赔50万

裕丰娱间说 浏览 3660

中国游客称在瑞士看到峨眉山石 官方证实:已落户10年

封面新闻 浏览 11588
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1