关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4246人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德约拒谈退役计划,强调还不退役不仅仅为了成绩;大威报名奥克兰

网球之家 浏览 4107

千岸科技合规与税务双承压:股东借离婚还原股权代持,海外累计被罚近百万元|读懂IPO

时代周报 浏览 1582

国米球员身价变更:图拉姆下跌1500万欧,博尼上涨1200万欧

懂球帝 浏览 3483

小鹏汽车出海新动态:小鹏 MONA 正式发往中东非

IT之家 浏览 3754

英国教授来中国考察被震撼:堪称人类史上最伟大功绩

环球时报国际 浏览 13149

关税预期与矿山停产“共振”,伦铜首次突破1.2万美元再创历史新高

华尔街见闻官方 浏览 3532

高市早苗4天上3次新闻联播:玩火者必自焚

看看新闻Knews 浏览 46455

喜报!识局助力一家机器人企业落户西南某地!

识局 浏览 3981

护肤品牌菲洛嘉宣布关闭天猫旗舰店,公司经营策略调整,化妆品市场正快速变化

红星资本局 浏览 3223

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者 浏览 3236

沃尔沃中国未来姓沃还是姓吉?

禾颜阅车 浏览 4376

八位堂推出“任天堂 NES 游戏机 40 周年”主体限定外设硬件

IT之家 浏览 4329

代旭:十六年配角生涯,凭霸总“杀”出重围

八卦三缺一 浏览 3103

辽宁88-61山东迎3喜1忧!原帅付豪成支柱,对阵广东内线引担忧!

篮球资讯达人 浏览 3965

针对“美式讹诈”:中国为何率先发动反制?

浏览 7841

CDS复兴?“AI发债潮”重燃了市场的“次贷回忆”

华尔街见闻官方 浏览 3980

量产型Atlas进步巨大,但波士顿动力前途依旧黯淡

汽车公社 浏览 3125

美国"全面封锁"受制裁油轮 一艘油轮狂发75次求救信号

红星新闻 浏览 30706

“霸凌”周迅的奚美娟,现在付出代价了?

除夕烟火灿烂 浏览 3615

民事诉讼牵出5年纠纷!迅雷再诉前CEO陈磊损害公司利益,知情人:追索金额达2亿元

红星资本局 浏览 3101

售19.98万元起 方程豹钛7 EV闪充版上市

网易汽车 浏览 1007
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1