关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者2624人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

汇源官方旗舰店及多个电商平台空无一物 客服回应

大风新闻 浏览 22654

闪电快讯 | 享界S9T售价30.98万元起 上市24小时大定超过7500辆

电厂 浏览 4452

社交神器?赛博宠物?Vbot维他机器狗开售,价格不过万

南方都市报 浏览 3097

奥迪A8L和雷克萨斯LS或无后续全尺寸轿车接班!

凡兮说 浏览 3491

AI成核心方向 银行启动博士后招聘

北京商报 浏览 3269

小米手表5灰度OS3.0.152.0版本,带来表端独立微信版本更新等

IT之家 浏览 2629

三种版本可选 吉利银河星耀7续航信息曝光

车质网 浏览 3404

镰田大地:日本需要加强防守,踢巴拉圭远未达我们的平均水准

懂球帝 浏览 3724

山西宣布废除烟花爆竹"禁放令" 网友:年味回来了

每日经济新闻 浏览 14100

韩华航空航天公司与挪威签署9.22亿美元火箭发射器供应合同

财闻 浏览 2436

比亚迪第一/零跑新势力销冠 2025年主流车企全年销量汇总

太平洋汽车 浏览 2720

你敢变重6公斤吗?

时尚COSMO 浏览 226

限时售9.29万起 第五代瑞虎8正式上市

网易汽车 浏览 3407

像颜如晶这样坚持,做什么都会成功吧!

时尚COSMO 浏览 3084

六旬女子做痔疮手术9天后突然去世 当地卫健委介入

极目新闻 浏览 8226

先锋来袭 丰田卡罗拉概念车新车图解

车质网 浏览 1957

泽连斯基宣布:或购买150架"鹰狮"战斗机 已签意向书

环球网资讯 浏览 8801

杭州一区拟推出“养龙虾”十条!支持OpenClaw&OPC-STC发展

都市快报橙柿互动 浏览 1830

陈奕迅回应患焦虑症:仍在服药看医生,但已好转大半

大象新闻 浏览 3669

千亿减肥药市场打响“地板价”争夺战

中国商报 浏览 2877

CBA再无全胜球队!广东31分惨败北京,最新积分榜:卫冕冠军登顶

侃球熊弟 浏览 2927
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1