摘要:深度神经网络极易遭受对抗样本的攻击, 这些对抗样本通过施加难以觉察的扰动, 便能误导模型做出错误的判断, 尽管在白盒环境下, 对抗样本的攻击成功率极高, 但在黑盒环境中其迁移性会显著下降. 为解决这一问题, 本文提出一种特征-频域双判别对抗样本迁移性增强方法. 具体而言, 特征判别器实现原始图像和对抗样本在高维特征空间的语义分离. 频域判别器利用图像的高频特征深入分析对抗样本的细微变化, 使其学会有效区分原始图像和对抗样本. 在训练过程中, 两个判别器协同工作, 共同引导生成器优化对抗样本的质量, 同时生成器对扰动进行随机像素丢弃, 以避免扰动过度集中于图像的某一特定区域. 实验结果表明, 该方法在黑盒模型上的迁移性优于VMI-FGSM、TTP、MultiANDA等方法, 证明了所提方法的有效性.