北京邮电大学学报 ›› 2023, Vol. 46 ›› Issue (2): 122-128.
基于Gammatone尺度功率规整系数谱图的语种识别
张昊阁1,邵玉斌1,龙华1,杜庆治1,周大春2
- 1. 昆明理工大学
2. 昆明理工大学(呈贡校区)
Language Identification Based on Gammatone-Scale Power-Normalized Coefficients Spectrograms
1,yubin yubinshao1, 1, 1,Da-Chun ZHOU2
- 1.
2. Kunming University of Science and Technology
摘要: 针对语种识别在噪声环境下识别率低的问题,提出一种基于Gammatone尺度功率规整系数谱图的语种识别方法。依据在功率上对噪声的抑制和Gammatone滤波器组的听觉特征提取出Gammatone尺度功率规整系数作为特征,并转化为图像获得特征谱图,然后运用暗通道先验算法与自动色阶算法对图像进行增强去噪,最后使用残差神经网络进行训练和识别。实验表明,在信噪比为0dB,噪声源分别为白噪声、车内噪声、粉红噪声、高频信道噪声、餐厅噪声、工厂噪声条件下,该方法相对于线性灰度语谱图识别率分别提升了39.1%、12.3%、19.0%、5.5%、28.2%、28.5%,且在其它信噪比下的识别率也有一定的提升。
中图分类号: