欢迎体验标贝语音开放平台
地址:https://ai.data-baker.com/#/?source=qaz123
(注:填写邀请码hi25d7,每日免费调用量还可以翻倍)


- kaldi简介
Kaldi是当前最流行的开源的语音识别工具包,旨在提供灵活且可扩展的组件,包括多种语音信号处理,语音识别,声纹识别和深度神经网络。Kaldi的代码主要用C++编写,在此之上使用bash 和python脚本做了一些工具。
- kaldi安装和编译
kaldi由它的开发团队在github进行维护,以下介绍安装目前最新的kaldi的步骤。
(1)配置gcc版本
当前版本的kaldi需要本地服务器编译器gcc版本为5.4.0及以上。可以通过 gcc -v 命令查看编译器版本。

按照文件提示,先到tools/目录下面按照INSTALL中的说明编译,完成之后到src/目录下按照INSTALL中的说明编译即可。
至此kaldi完成编译。
我们举一个简单的例子(只是形象表述,不是真实数据和过程):
- 语音信号:pcm、wav文件等(我是机器人)
- 特征提取:提取特征向量[1 2 3 4 56 0 ...]
- 声学模型:[1 2 3 4 56 0]-> w o s i j i q i r n
- 字典:窝:w o;我:w o;是:s i;机:j i;器:q i;人:r n;级:j i;忍:r n;
- 语言模型:我:0.0786, 是:0.0546,我是:0.0898,机器:0.0967,机器人:0.6785;
- 输出文字:我是机器人;
版权声明:
本文来源网络,所有图片文章版权属于原作者,如有侵权,联系删除。
本文网址:https://www.bianchenghao6.com/h6javajc/6505.html