关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4416人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

宗馥莉辞职41天后 有经销商收通知:明年继续卖娃哈哈

每日经济新闻 浏览 6735

王家卫持续被扒!《东邪西毒》事件推锅临时工

boss外传 浏览 3427

布拉格队长:下半场我们想踢得更具威胁,但阿森纳太强了

懂球帝 浏览 3488

携程迎来监管风暴

华尔街见闻官方 浏览 2670

"女首相梦"悬了的高市公开支持赖清德 日本亲华派翻脸

梁讯 浏览 7523

高市早苗:若执政党阵营在选举中未过半数 将即刻辞职

界面新闻 浏览 6856

砸1亿元跨界,百亿巨头老板电器杀入机器人赛道

尺度商业 浏览 2561

抢滩“双11”,浙江跨境商家为速卖通备货10万棵圣诞树

财闻 浏览 3983

李娜×新狮铂拓界:源于价值理念的同频共振

网易汽车 浏览 3234

大众帕萨特裸车价11.85万起!网友:这还考虑啥?

汽车网评 浏览 2938

戚薇夫妻现身机场!李承铉穿泰迪熊大衣一头白发

料峭春寒洞 浏览 2427

热巴近照好肿!状态变化被质疑生过娃,狗仔曾曝孩子属兔三岁了

萌神木木 浏览 286

波切蒂诺爆料:姆巴佩和梅西在巴黎踢不到一块去

体坛周报 浏览 306

比尔·盖茨被指感染性病并隐瞒 前妻首次回应

大风新闻 浏览 4503

4月21日上市 2026款乐道L90官图发布

车质网 浏览 829

今年双11,搞出了点新意思

虎嗅APP 浏览 3469

马筱梅晒定制红包,把婆婆张兰放感谢第一位

大中国 浏览 2040

成龙满嘴谎话?却被兄弟公开指责吝啬人品差?

小娱乐悠悠 浏览 3769

美特使被指教俄外交官"吹捧"特朗普 美媒披露通话记录

澎湃新闻 浏览 32822

伊姐周日热推:电视剧《超感迷宫》;电视剧《风与潮》......

伊周潮流 浏览 2409

杨紫胡歌“以命换命”,《生命树》到底讲了什么?

仙女事件簿 浏览 2356
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1