关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4410人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普自己亲口承认 中国送来的反制清单让他失去理智

头条爆料007 浏览 9377

从小鹏的“物理AI”,看中国智能化的下一步

观察者网 浏览 3384

演完《与凤行》演《逍遥》,她减肥50斤

失宠的小野猪 浏览 2701

万科开启了第二笔中票展期

国际金融报 浏览 3001

欧盟考虑强制中企转让技术 彭博社:可能引发强烈反弹

环球网资讯 浏览 7692

18岁松岛握拳怒吼!2连冠后豪言洛奥成主力 张本一哥席位摇摇欲坠

颜小白的篮球梦 浏览 2549

以军称打死哈马斯高级指挥 哈马斯发声

每日经济新闻 浏览 2938

Nuralogix智能镜亮相CES,可看脸提供“长寿评分”

IT之家 浏览 2762

哥伦比亚挫败一起针对军方设施的未遂袭击

国际在线 浏览 3352

特朗普涉俄乌冲突再次表态:有时候必须让他们打到底

鲁中晨报 浏览 8522

融资1111亿元,估值近8750亿元,全球最贵自动驾驶独角兽诞生

红星资本局 浏览 2404

配激光雷达+磁悬浮底盘,深蓝L06将于11月18日上市

隔壁说车老王 浏览 3455

预计年内发布 小米增程SUV最新谍照曝光

车质网 浏览 204

AI改变金融系统,周小川、肖远企发声

中国基金报 浏览 3542

重马一跑者倒地去世 跑友:他在跑圈被称为"破三大神"

红星新闻 浏览 12414

74岁张纪中与年轻妻子结婚,真的过得幸福吗

丹妮观 浏览 3668

阿森纳本赛季3次单场通过角球打进至少2球,同期英超球队最多

懂球帝 浏览 2681

解码长盈精密的财务忍耐期:利润下滑20%,机器人收入却狂飙8倍,激进扩张能否开花结果?

时代周报 浏览 3034

“Mag 7”过时了?华尔街想要AI!

华尔街见闻官方 浏览 4138

颜骏凌:和范德萨交换了联系方式,在儿时偶像面前踢球是圆梦

懂球帝 浏览 3558

百度发放开工红包:最高可得2026元

三言科技 浏览 2041
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1