关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4098人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蔚来艰难求盈利

北京商报 浏览 2804

电商助力 四川会东石榴从深山走向全国市场

封面新闻 浏览 4021

熊园:9月财政有喜有忧,今年预算能完成吗?

首席经济学家论坛 浏览 3422

蔚来全新ES8正式上市,起售价40.68万元

财经无忌 浏览 4191

讲解员回忆杨振宁95岁来访两弹城:他说这个时代特别需要“两弹一星”精神

封面新闻 浏览 3425

美媒:特朗普羡慕中国 华盛顿正在模仿北京

观察者网 浏览 6300

围巾,女人气质的延伸

Yuki女人故事 浏览 3002

火箭惨遭雷霆双杀!杜兰特23中7申京两双 亚历山大连续112场20+分

罗说NBA 浏览 2279

DiDi联手香港科大首创自动旅行规划AI

科技行者 浏览 3187

距离仅10到15米 飞行员驾驶歼-16倒飞驱离外军战机

环球网资讯 浏览 3427

美称空袭叙利亚西北部 打死一名与“基地”组织关联头目

新华社 浏览 2350

2025蔚来日在杭州成功举办

财经无忌 浏览 4125

四川阿坝红旗桥垮塌:系山体变形加剧滑塌造成

新京报 浏览 31699

媒体:特朗普"急踩刹车"与伊朗停火 以方声明流露不满

新民晚报 浏览 57412

美国新提议:把加沙一分为二 先重建以色列控制区

澎湃新闻 浏览 3277

媒体:日本或让美F-35战机带核炸弹部署 以"威慑中国"

枢密院十号 浏览 43485

AI再次降维打击人类 仅用1小时破译500年未解的"天书"

上观新闻 浏览 7442

郭爸曝郭碧婷家庭花销全靠她,嫁入"假豪门"?

代军哥哥谈娱乐 浏览 3450

A股年内上会数量将破百

北京商报 浏览 2663

巴基斯坦夜袭阿富汗边境地区 打死至少70名武装人员

新华社 浏览 3466

美国微软公司:10月14日起Windows 10将“停服”

财闻 浏览 3390
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1