针对细粒度图像分类任务的长尾分布问题,提出了一种基于多尺度特征 Transformer 的细粒度图像分类方法,实现了底层与深层特征的保护并优化了长尾分布。 首先,设计了混合数据采样方法,获取用于优化表征学习、长尾分布和细粒度特征的三元组数据;然后,设计了 Transformer 多尺度特征优化方法,分别通过底层特征对比学习方法与深层特征平衡学习方法优化特征学习过程,改善类别混淆和细粒度特征的提取,在保护头部类别特征学习的同时增加对尾部类别的关注。 仿真结果表明,所提方法可以有效地改善细粒度图像分类任务中长尾分布带来的影响,优化特征分布,提高分类准确率。