会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 Mozilla更新大众语音数据散 现有18种发言1400小时语音!

Mozilla更新大众语音数据散 现有18种发言1400小时语音

时间:2026-03-25 20:16:15 来源:谈优务劣网 作者:综合 阅读:721次

­  Mozilla但愿让草创公司,新大现研讨职员战专业悲愉爱好者更沉易构建支撑语音的众语种利用,办事战设备。音数言小音为此,据散它来日诰日公布了最新版本的时语Common Voice,那是新大现一个开源的语音数据散,现在包露去自42000名进献者超越1400小时的众语种语音样本,涵盖18种发言,音数言小音包露包露英语、据散法语、时语德语、新大现荷兰语、众语种Hakha Chin语、音数言小音天下语、据散波斯语、时语巴斯克语、西班牙语、中文、威我士语战卡布语。

­  Mozilla传播饱吹,它是同类发言中最大年夜的多发言数据散之一,比8个月前公开的通鄙谚音语料库要大年夜很多,此中包露了2万名英语志愿者500小时,40万份灌音,并且语料库很快便会扩展年夜。该构造表示,70种发言的数据汇散工做正正在经由过程通用语音网站战挪动利用法度主动展开。

­  通用语音能够散成到Deepspeech中,那是一套由Mozilla的机器进建小组保护的开源的语音到文本、文本到语音引擎战颠终培训的模型,它没有但包露语音片段,借包露一些志愿者供应的元数据,那些元数据可用于培训语音引擎,如演讲者的秋秋、性别等等。

­  为了简化流程,Mozilla本周推出了一款改进的Common Voice支散东西,能够按照分歧的提示停止剪辑,借供应了用于检察、重新录制战跳过剪辑的新控件。别的,它借推出了新的建设文件服从,问应用户跨发言跟踪进度战目标,并增减人丁统计疑息。Mozilla表示,正在接下去的几个月里,它将测验测验分歧的体例去经由过程社区尽力战新的开做水陪干系,删减数据的数量战量量。终究目标旨正在为那些寻供构建战利用语音足艺的人供应更多更好的语音数据。

本题目:Mozilla更新大众语音数据散 现在包露18种发言1400小时语音

(责任编辑:百科)

相关内容
  • Steam2月第三周销量排行 绝地求生50连冠
  • 日本大年夜教逝世玩抓娃娃机掉利 收回灭亡威胁后被捕
  • 2D卷轴《Cobalt》即将出售 《我的天下》开辟小组倾力挨制
  • 告别单身《神雕侠侣》足游即推交际新弄法
  • 【天下贰】你还不知道这些“性价比之王”?只要3元宝,新坐骑带回家!
  • 汤姆克鲁斯典范《雄心万丈2》定档 11月19日日好同时尾映
  • 《星球大年夜战8》延期大年夜战《阿凡是达2》 《新蜘蛛侠》《减勒比5》上映提早
  • 特斯推Model3标准绝航进级版贬价1.5万 现价23.59万
推荐内容
  • 《刀剑神域:碎梦边境》公布了新增四位角色情报
  • 《江湖侠客令》悲庆佳节 玩皮白叟大年夜闹国庆
  • 短少了我的豪杰!《暴走魔兽团》S级豪杰挑选保举
  • 下逼格的享用《君王3D》坐骑大年夜比拼
  • 《拳皇15》DLC角色麦卓和薇丝预告片公布今年12月同时上线
  • 收源江湖耀世去袭 《九阳神功:收源》10月20日开启两测