爆点资讯

由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队，最近在人工智能领域取得了一项重要突破。这项研究发表于2025年，论文编号为arXiv:2509.23371v1，提出了一种名为MetaAPO（Meta-Weighted Adaptive Preference Optimization）的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性，我们先来看一个生活中的例子。假设你正在教孩子学习做饭，你有两种教学资源：一套经典的家传菜谱（就像AI训练中的离线数据），还有让孩子实际动手练习的机会（就像在线生成的数据）。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习，而东南大学团队的新方法则像是配备了一位智慧的厨艺老师，这位老师能够根据孩子当前的水平，灵活决定什么时候该参考菜谱，什么时候该放手让孩子实践，从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战：如何让AI既能从人类已有的经验中学习，又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据，导致AI无法适应新情况；要么完全

东南大学突破：AI学会情境化拒绝能力

落地为王：谁...

盲打！快船和...

18平米校园...

本轮矿业大周...

泽连斯基：前...

12306又...

温峥嵘回应卖面膜争议，已报警刑事立案

离婚7个月，霸总杨子又给内娱上了一课

蔡磊进入渐冻症晚期：研发的药物对病友起效对他没用

吉利汽车集团：银河品牌全系电混车型纯电续航突破200公里

U23亚洲杯身价榜：中国第三力压日韩，沙特居首伊朗次席

这些年轻科学家不再满足于“追赶美国”

乌外长公布无人机从匈牙利进入路线匈外长否认

创业者要做到“四个不要”

《数据周报88》：70大中城市房价全线下跌

拒绝被逆转，曼联本赛季英超领先后保持不败

拉比奥：我在米兰很好地融入了球队，我和迈尼昂的关系很亲近

长城汽车正式取消＂大小周＂老员工泪目：盼了30年

俄美乌三方首轮会谈细节披露

2025年利润在4%徘徊，车圈是从从容容还是连滚带爬‌？

我用1秒成为陈妍希梦女，你也来试试吧

乌克兰全境频遭空袭中使馆发布重要提醒

《小城大事》：那么宏大，却又那么儿戏，我还是弃剧了

Agent的发展趋势，CB insights深度剖析了170家公司后给出了答案

无名花丨诗一首

上海AI实验室推出ATLAS：让AI在科学推理中＂败下阵来＂的超级考场

冬季穿衣没想象中那么难，看看这些穿搭就有灵感，保暖又好看

印度稀土转卖丑闻曝光，伪造文件骗取稀土转卖老美

官方：不莱梅免签勒阿弗尔19岁前锋奎坦特

给黑洞拍“CT”，新方法有望筛选出最准确的宇宙引力法则