SRS对抗攻击研究与FAKEBOB方法解析

2025.10.14

SRS对抗攻击研究与FAKEBOB方法解析

1. 说话人识别系统简介

介绍说话人识别系统的基本流程:语音输入 → 特征提取 → 向量计算 → 距离或得分判定。 包括三种识别模式:开集识别(OSI)、闭集识别(CSI)与说话人验证(SV),并阐述各自的判定机制与应用场景。

2. 威胁模型与研究动机

分析攻击者目标与系统脆弱性,指出“已注册说话人”攻击下的潜在风险。 通过实验设置16种不同攻击配置,探讨攻击对模型鲁棒性的影响与防御难点。

3. FAKEBOB方法设计

提出FAKEBOB攻击框架,利用梯度估计(NES)与优化算法(BIM)联合构造对抗样本。 在OSI、CSI与SV三种识别场景下均设计目标与无目标攻击方式。 通过“阈值估计 + 分数优化”策略,实现可迁移、可执行的物理攻击样本生成。

4. FAKEBOB算法细节

5. 实验与结果分析

在多位说话人(如周杰伦、邓紫棋、王力宏、汪峰)语音数据上进行实验。 对比真实阈值与估计阈值下的攻击效果,统计 OSIER、FRR、FAR 等指标。 结果显示 FAKEBOB 在不同识别模式下均能显著提高攻击成功率,验证方法的有效性。

本次组会内容下载链接