摘要: 局部区域差异会导致环境声音难以精确分类。对此,提出了一种基于精简双线性注意力网络的环境声音分类方法。首先,引入多维时频特征充分表征环境声音的特征;其次,引入随机擦除在线数据增强方法,避免因缺乏数据集而导致模型过拟合的问题,提高样本的多样性;最后,在精简双线性网络框架不变的情况下,采用密集型连接网络(DensNet-169)作为特征提取模块,并引入通道空间位置注意力模块,关注环境声音特征局部区域的差异。实验结果表明,所提方法在ESC-10和ESC-50数据集上的准确率均超过人耳识别的准确率。
中图分类号: