Google开源人工智能可以区分语音,准确度达到92%

evan
特邀作者
文章摘要: 让机器也能像人一样分辨出语音和谁在说话

对正常人来说,分辨出某人在某时某地说过些什么是件很简单的事情。要让机器也能像人一样分辨出语音和所说过的话似乎只能在科幻电影中看到。

最近Google的人工智能研究部门似乎在这方面取得了突破性进展,一个全新的AI记录系统能将接收到的声音有效的记录下来,并与记录过的语音比对,从而识别说话的人。

该系统的核心算法在Github上开源,该算法有效的降低了错误率(DER),并在NIST SRE 2000 CALLHOME基准测试中错误率为7.6%,而谷歌之前使用的算法错误率为8.8% 。

目前该系统正处于开发阶段,将来可能会优化目前现有数据结构,开发人员希望这个系统能实现完整的人机对话过程,并提供离线解码功能。在进一步降低错误率的基础上,希望能实现对不同声音的直接解码,以便提供更高效和真实的人机对话过程。

本文地址:https://www.xinfengtv.com/1113-google-92.html

新风网文章都系原创作品,已加入百度及腾讯原创保护计划,未经授权请勿转载!!

猜你喜欢