关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4101人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

军报评何卫东、苗华等被开除党籍军籍:没有"铁帽子王"

北京日报客户端 浏览 9489

“去雄竞”的《大叔罗曼史》,凭什么三榜第一?

仙女事件簿 浏览 2287

NASA阿耳忒弥斯3号SLS火箭芯级启运,为明年发射铺路

IT之家 浏览 352

北汽新能源与小马智行达成全面深化战略合作

观察者网 浏览 2362

4月21日上市 2026款乐道L90官图发布

车质网 浏览 349

再遭失利,内马尔不满自己被换下并直接返回更衣室

懂球帝 浏览 3094

章泽天播客翻车删帖,网友怒斥怕批评就别出门

萌神木木 浏览 2285

迪丽热巴:从流量到实力,她还能走多远?

伊周潮流 浏览 2761

继弯刀裤,阔腿裤之后,“围裹式长裤”突然大火!

LinkFashion 浏览 375

冰雪穿越理念 宾利添越Concept X官图发布

车质网 浏览 2143

维蒂尼亚晒自己和伊涅斯塔合影:终极榜样,我太幸运了

懂球帝 浏览 2582

配1.5T增程/猎鹰700辅助驾驶 星途ET5预售15.99万起

网易汽车 浏览 3082

明天会更一部灵异类电影,那就找几张鬼里鬼气的壁纸,大家收图

电影最TOP 浏览 2730

900V架构打造 莲花ForMe将于3月29日上市

车质网 浏览 1458

两人涉嫌切割小区23部电梯钢绳被拘 原物管称被迫退场

红星新闻 浏览 6561

中国天眼新成果发布 揭示快速射电暴双星起源关键证据

环球网资讯 浏览 2309

美被指向以色列通报对伊朗行动准备进展

每日经济新闻 浏览 2168

被央媒怒批!目不识丁、脑子空空

东方不败然多多 浏览 3449

一个手机壳卖200,这家深圳公司靠什么掏空老外钱包?

花朵财经 浏览 2227

海报荐读|AI产品情绪价值开始“分化”;无障碍出租车为何预约难

上观新闻 浏览 2661

鸿蒙智行享界 S9T 商品车将同步发运,全国各城市陆续开启交付

IT之家 浏览 4215
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1