Mozilla与NVIDIA合作实现语音技术多元化

英伟达(NVIDIA)向通用语音识别数据库项目( Mozilla Common Voice )投资150万美元,用于在语音识别领域寻求改变和进步。

未来十年内,语音将成为人类同计算机、智能机器的之间的主要交互方式。但当今大多数人还无法使用语音同设备之间进行交流,因为大多数设备无法解决和区分世界上各国家和地区的语言、口音和语音模式问题。

为了确保绝大数人都能够从未来的人机交互模式变化中受益,Mozilla 和 NVIDIA展开了合作,英伟达将向通用语音识别数据库项目( Mozilla Common Voice )投资150万美元以帮助其在语音识别技术领域进一步创新。Mozilla Common Voice 是一项具备足够信心的开源计划,旨在使语音技术的开发更加民主化和多样化。

目前,用于训练机器学习算法的大多数语音数据都由少数几家大型公司持有。这对寻求开发高质量语音识别技术的其他人构成了挑战,同时也加剧了英语使用者与世界其他地区之间的语音识别鸿沟。

Common Voice

此项目于2017年正式推出,其目的是在减轻AI偏见的同时创造平等的竞争环境。它使得任何人都可以将自己的声音捐赠给免费、公共可用的语音数据库,使得创业公司、研究人员和开发人员可以使用这些数据库来训练具备语音交互能力的应用程序、产品和相关服务。如今,它已经代表了世界上最大的多语言公共领域语音数据集,拥有60种不同语言的9,000多个小时的语音数据,其中包括广泛使用的语言和部分较少使用的语言。截止目前,全球已有164,000多人为该项目做出了贡献。

这项投资将加快Common Voice数据库的增长和丰富进程,使更多来自社区的志愿者参与到该项目中,同时也将支持该项目聘用新的工程师。

[原文:Mozilla partners with NVIDIA to democratize and diversify voice technology]

乔客安全咨询保留著作权,发布者:Dream Nick,转载请注明出处:https://www.qiaokr.com/article/2846