关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4900人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“纸质书+VR”开启科普新形态 《寻梦天宫:中国空间站建设纪实》在京发布

封面新闻 浏览 3345

盈利大考冲刺关头,千亿小鹏被指“虚假宣传”

雷达财经 浏览 3248

媒体:鲁比奥在高温中"长话短说" 意外点破美印间尴尬

中国新闻周刊 浏览 102

造人形机器人的公司自己先泼冷水:行业存在过度炒作现象

IT之家 浏览 3409

超千万元罚单屡见不鲜!第三方支付机构这些“坑”别再踩了

国际金融报 浏览 3230

遭美政府和科技企业联合施压 欧盟扛不住了又打算屈服

澎湃新闻 浏览 8062

曾遭遇心脏骤停,洛克耶跟随老东家布里斯托尔流浪者训练

懂球帝 浏览 4117

雷恩vs欧塞尔:恩博洛、塞科-福法纳首发,西纳约科、易卜拉欣-奥斯曼出战

懂球帝 浏览 4238

9岁女孩在埃及飚英语维权:8个月起就跟爸爸"浪迹天涯"

潇湘晨报 浏览 31519

2025蔚来日在杭州成功举办

财经无忌 浏览 4958

中邮基金换帅!权益规模下降,中邮核心成长混合为何业绩垫底?

Daily每日财报 浏览 3493

世体:因身体轻微不适,巴萨新援帕西菲科首秀将推迟

懂球帝 浏览 2919

年底盈利即将兑现 蔚来Q3财报公布

网易汽车 浏览 3742

一场意外的形象崩塌却让他更红了!

伊周潮流 浏览 4153

冬天还是“羽绒服”最保暖!看看这些穿搭,简单舒适又不老气

静儿时尚达人 浏览 2995

小S的第3个女儿发自拍照,14岁就很漂亮,外形完成惊艳蜕变

素素娱乐 浏览 2599

温峥嵘回应卖面膜争议,已报警刑事立案

扒虾侃娱 浏览 3541

刘亦菲慷慨捐款150万助力香港,助力灾后重建与心理支持

茶韵浮生 浏览 3664

越遮越高级,搞穿搭原来真不看脸?

时尚COSMO 浏览 3215

进苏超决赛,泰州主帅:队伍分工明确,三个臭皮匠顶个诸葛亮

懂球帝 浏览 4102

消失1年,王子异自称得了抑郁症

失宠的小野猪 浏览 3343
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1