身份保存:ArcFace 与 AdaFace
身份保存是换脸过程中最重要的质量维度。人脸嵌入网络告诉生成器“这是我们要转移的人”。两种嵌入在 2026 年生产堆栈中占主导地位:ArcFace 和 AdaFace。我们在生产换脸管道上对两者进行了基准测试。
每个嵌入优化的目的
ArcFace 在 2018 年引入了附加角度裕度损失,多年来主导着人脸识别基准。它的嵌入按身份紧密聚集——非常适合验证,对于交换时身份传输也很强大。
AdaFace (2022) 添加了质量自适应余量:它在训练过程中对低质量图像进行不同的加权,从而使嵌入对于模糊、低分辨率和困难照明更加稳健。
基准设置
- 测试集:来自保留的评估集的 1,000 对面孔,涵盖不同的角度、光照和图像质量。
- 管道:相同的 Wan 2.2 换脸生成器,仅交换了嵌入网络。
- 指标:ArcFace 余弦相似度(是的,无论生成嵌入如何,都用作评估 - 独立评估)、人类偏好评分、工件密度。
- 硬件: H100 80GB。
结果 - 高质量源图像
| 公制 | ArcFace | AdaFace |
| 身份相似度(平均值) | 0.79 | 0.78 |
| 身份相似度(p10) | 0.71 | 0.72 |
| 人类偏好 | 52% | 48% |
| 每次交换的挂钟 | 1.0×基线 | 1.05×基线 |
表>
在干净、高质量的来源上,这两种嵌入在统计上是无法区分的。按集成难易程度进行选择。
结果 - 低质量源图像
| 公制 | ArcFace | AdaFace |
| 身份相似度(平均值) | 0.62 | 0.71 |
| 身份相似度(p10) | 0.48 | 0.61 |
| 人类偏好 | 34% | 66% |
表>
在模糊、低分辨率或光线不足的光源上,AdaFace 的质量自适应余量表现出色。 p10 情况(最差十分位数输入)差距足够大,足以影响规模。
结果 - 偏角光源
两种嵌入都难以超过约 45° 的头部转动。两者都没有明显更好的意义。这里的修复是生成器端,而不是嵌入端:更好的源图像引导和姿势感知生成网络。
结果 - 跨人口统计表现
我们按源人口统计组划分测试集(人脸识别基准测试的最佳实践)。 AdaFace 缩小了但并未消除旧 ArcFace 部署所显示的人口统计性能差距。这里的根本解决方法是训练数据组合;当使用人口统计平衡数据进行训练时,这两个网络都会得到改善。
生产决策指南
- 消费者使用自行上传的照片进行换脸:AdaFace 是更好的默认设置。用户上传的照片质量差异很大。
- Studio 级工作流程和精选的高质量来源:ArcFace 很好; AdaFace 的质量提升在这里微乎其微。
- 为混合客户群体提供服务的 API:AdaFace 是更安全的默认设置 - 最坏的情况要好得多,而最好的情况在统计上是相关的。
- 延迟关键的实时:ArcFace 稍快的推理速度可能会产生影响。在您的硬件上进行测试。
混合方法
一些 2026 年生产堆栈将两者结合在一起:ArcFace 作为主要身份向量,AdaFace 作为源图像质量分数低于阈值时的质量感知后备。该集成增加了大约 5% 的延迟,最坏情况下的行为改善了 10-15%。对于普通受众的消费产品来说是值得的。
超越 ArcFace 和 AdaFace
较新的嵌入(CosFace 2.0、MagFace v2、几个专有网络)已出现在 2025 年论文中。目前尚未有任何一种技术能够取代 ArcFace/AdaFace 作为生产默认产品,这通常是因为边际收益并不能证明已建立的管道中的集成成本是合理的。观看 2026 年 NeurIPS 和 CVPR 会议,寻找可能的候选人。
评估诚实度
一个陷阱:不要使用驱动生成的相同嵌入网络来评估身份保留。该模型有效地针对嵌入的身份概念进行了优化,因此分数被夸大了。始终使用独立嵌入进行评估(我们对 ArcFace 驱动和 AdaFace 驱动的一代都使用单独训练的 ArcFace)。
DeepSwapAI 使用什么
DeepSwapAI 的生产管道使用混合体:AdaFace 作为主要身份嵌入,ArcFace 作为质量评分期间的验证检查。这为消费者细分市场提供了工作室级验证的稳健性。记录在研究方法页面中。
底线
对于消费者或混合质量输入场景,AdaFace 是 2026 年更好的嵌入。对于工作室级策划的输入,两者是并列的。混合集成以适度的成本捕获最坏情况的改进。身份保存中更大的杠杆是生成器端架构和训练数据平衡——嵌入选择是有意义的,但不是主导性的。