关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者3704人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泽连斯基宣布:或购买150架"鹰狮"战斗机 已签意向书

环球网资讯 浏览 8793

法拉第未来 Super One 迈入批量试制及生产阶段

IT之家 浏览 3537

伊姐十一热推:电影《江南:在爱开始的地方等你》;电视剧《围猎》......

伊周潮流 浏览 3147

王楚然172cm真实感,有谁不爱

蕾爸退休日记 浏览 2860

37岁白人女子送娃上学被执法人员枪杀 特朗普:是自卫

每日经济新闻 浏览 7895

WTT总决赛男单决赛前,张本智和接受采访时引用高市早苗言论

懂球帝 浏览 2991

杨洋传遇上缅北剧组 开机就离开剧组?

陌上桃花开的 浏览 2043

马竞新援奥贝德:我完全服从教练的战术安排;偶像是格列兹曼

懂球帝 浏览 2391

林子祥和学生结婚,78岁开演唱会,依然一票难求

犀利辣椒 浏览 3532

你有没有发现 保时捷越来越像大众了?

网易汽车 浏览 3546

媒体:爱泼斯坦案2000段视频公布 震碎三观突破下限

北京日报客户端 浏览 6994

18.99万起,智享大六座旗舰SUV风云T11上市,又要卖爆?

电车通 浏览 3152

@全球内容创作者:广东喊你来创造,政策大礼包备好了

智谷趋势 浏览 3511

韩国强硬批驳高市"独岛"言论 韩媒:其触碰两国间雷区

环球网资讯 浏览 8011

特朗普急于将爱泼斯坦案翻篇 仍有250万页文件未公布

极目新闻 浏览 95743

脱口秀演员王越确诊甲状腺癌 手术后晒照报平安

红星新闻 浏览 7071

增长神话暂停,理想“尖子生”光环失效?

Tech星球 浏览 3010

‍曼联向韦伯投诉裁判误判!曝阿莫林将用442,赛季成败在此一举

罗米的曼联博客 浏览 3076

缅甸政府将拆除KK园区148栋建筑,其中包括KTV、医院和SPA会所,已拆除101栋

红星新闻 浏览 3360

德甲欧战,还是只能靠拜仁、多特撑着

体坛周报 浏览 3546

长安马自达EZ-60马年版上市 售价13.99万起

网易汽车 浏览 742
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1