首页 期刊 计算机应用与软件 基于CNN-LSTM网络的声纹识别研究 【正文】

基于CNN-LSTM网络的声纹识别研究

作者:闫河; 董莺艳; 王鹏; 罗成; 李焕 重庆理工大学计算机科学与工程学院; 重庆400054; 重庆理工大学两江人工智能学院; 重庆400020
声纹识别   语谱图   时序特征  

摘要:传统声纹识别方法过程复杂,模型识别准确率低,是声纹识别应用发展的关键问题。利用深度学习具有自主特征提取及分类的特点,结合卷积神经网络(CNN)和长短期记忆网络(LSTM),提出一种结合的网络模型学习声纹识别特征及对其进行身份认证。将原始语音转换为固定长度语谱图,顺序进入CNN、LSTM,结合网络进行训练以及声纹特征学习。通过对比CNN、LSTM以及DNN网络,验证CNN-LSTM网络在声纹识别中具有较少迭代次数情况下高准确率的特性。经实验结果可以得出,语音空间特征及时序特征均是声纹识别中重要的影响因素,实验中的CNN-LSTM网络模型准确率达到95.42%,损失低值达到0.097 3。该方法有利于实际声纹识别的应用。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅