关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4898人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奥尼尔谈文班亚马:两年后他会和约基奇并肩成为联盟最佳内线

懂球帝 浏览 1160

外媒:克宫称普京愿与马克龙就俄乌冲突对话

环球网资讯 浏览 3355

SRM理工学院发布:文本到视频生成技术演进图谱

科技行者 浏览 3893

4岁走失女童找到 参与救援的派出所所长在孩子旁边哭

极目新闻 浏览 10096

告别卡粉斑驳!保姆级遮瑕教程,手把手教你黑眼圈痘印全隐形

Yuki女人故事 浏览 3083

鲁媒:苏超决赛变成青训对决,别被所谓“草根”赛事蒙蔽双眼

懂球帝 浏览 4188

“电池车”全面压过“发动机”一头?油车时代的辉煌,被彻底终结

少数派报告Report 浏览 3663

四川舰海试中方捷报频传 美破防咬定中国有8艘"航母"

空天力量 浏览 33907

墨尔本新王者, 阿尔卡拉斯拍摄澳网冠军写真

懂球帝 浏览 2988

何超莲窦骁,婚变风波后首次同框

喜欢历史的阿繁 浏览 4020

这些年轻科学家不再满足于“追赶美国”

知识分子 浏览 4660

德国又给高市早苗上了一堂课 两国被指形成鲜明反差

新华社 浏览 35555

伦纳德:我对保罗一事毫不知情,我们之间的沟通没有问题

懂球帝 浏览 3538

《喜人奇妙夜2》即将收官,给你的戒断加点料

时尚COSMO 浏览 3557

财经早餐:多地明确取消35岁考编限制;商务部回应美方威胁加征100%关税

网易财经 浏览 4326

媒体:高市早苗想见中国领导人 也未必是特别难的事

新民周刊 浏览 16053

妻子家中枉死丈夫被疑雇凶杀人 27年后真凶浮出水面

环球网资讯 浏览 9553

广西百色多个村屯被洪水浸泡逾20日 多个村屯成孤岛

南方都市报 浏览 9169

东南亚出海速递 腾势泰国交付突破3000辆

车质网 浏览 3932

中国天眼再升级!FAST将建成巨型综合孔径阵列

环球网资讯 浏览 3129

独家|我们与淘宝闪购管理层聊了聊增长的持续性问题

虎嗅APP 浏览 4152
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1