Préservation de l'identité dans AI Face Swap : benchmarks ArcFace vs AdaFace (2026)

Préservation de l'identité : ArcFace vs AdaFace
La préservation de l'identité est la dimension de qualité la plus importante dans l'échange de visages. Le réseau d'intégration de visages est ce qui indique au générateur "c'est la personne que nous transférons". Deux intégrations dominent les piles de production 2026 : ArcFace et AdaFace. Nous avons comparé les deux sur un pipeline de production avec échange de faces.
Pour quoi chaque intégration est optimisée
ArcFace a introduit la perte de marge angulaire additive en 2018, dominant les références en matière de reconnaissance faciale pendant des années. Ses intégrations sont étroitement regroupées par identité : excellentes pour la vérification, solides pour le transfert d'identité au moment de l'échange.
AdaFace (2022) a ajouté une marge d'adaptation à la qualité : il pondère différemment les images de mauvaise qualité pendant l'entraînement, ce qui conduit à des intégrations plus résistantes au flou, à la faible résolution et à l'éclairage difficile.
Configuration de l'analyse comparative
- Ensemble de test : 1 000 paires de visages issues d'un ensemble d'évaluation couvrant différents angles, éclairages et qualités d'image.
- Pipeline : Même générateur d'échange de visage Wan 2.2, seul le réseau d'intégration a été échangé.
- Mesures : similarité cosinus ArcFace (oui, utilisée comme évaluation indépendamment de l'intégration de la génération – évaluation indépendante), évaluation des préférences humaines, densité des artefacts.
- Matériel : H100 80 Go.
Résultats — Images sources de haute qualité
| Métrique | ArcFace | AdaFace |
|---|---|---|
| Similarité d'identité (moyenne) | 0,79 | 0,78 |
| Similarité d'identité (p10) | 0,71 | 0,72 |
| Préférence humaine | 52 % | 48 % |
| Horloge murale par échange | 1,0× ligne de base | 1,05× ligne de base |
Sur des sources propres et de haute qualité, les deux intégrations sont statistiquement impossibles à distinguer. Choisissez par facilité d'intégration.
Résultats – Images sources de mauvaise qualité
| Métrique | ArcFace | AdaFace |
|---|---|---|
| Similarité d'identité (moyenne) | 0,62 | 0,71 |
| Similarité d'identité (p10) | 0,48 | 0,61 |
| Préférence humaine | 34 % | 66 % |
Sur les sources floues, à faible résolution ou mal éclairées, la marge d'adaptation à la qualité d'AdaFace brille. L'écart dans le cas p10 (intrants du pire décile) est suffisamment grand pour avoir une importance à grande échelle.
Résultats — Source hors angle
Les deux intégrations peinent à dépasser un tour de tête d'environ 45 °. Ni l’un ni l’autre n’est significativement meilleur. Le correctif ici est côté générateur, pas côté intégration : un meilleur guidage de l'image source et des réseaux de génération prenant en compte la pose.
Résultats – Performances multidémographiques
Nous divisons l'ensemble des tests par groupe démographique source (meilleures pratiques en matière d'analyse comparative de la reconnaissance faciale). AdaFace a réduit mais n'a pas éliminé l'écart de performances démographiques montré par les anciens déploiements ArcFace. La solution fondamentale ici est la composition des données d’entraînement ; les deux réseaux s'améliorent lorsqu'ils sont formés sur des données démographiquement équilibrées.
Guide de décision de production
- Échange de visage du consommateur avec des photos auto-téléchargées : AdaFace est la meilleure valeur par défaut. La qualité des photos téléchargées par les utilisateurs varie considérablement.
- Flux de travail de qualité studio avec des sources sélectionnées de haute qualité : ArcFace convient ; le gain de qualité d'AdaFace est ici marginal.
- API destinée à des populations de clients mixtes : AdaFace est la solution par défaut la plus sûre : le pire des cas est bien meilleur, et le meilleur des cas est statistiquement lié.
- Temps réel critique en termes de latence : l'inférence légèrement plus rapide d'ArcFace peut avoir une importance marginale. Testez sur votre matériel.
Approches hybrides
Certaines piles de production 2026 regroupent les deux : ArcFace pour le vecteur d'identité principal, AdaFace comme solution de secours soucieuse de la qualité lorsque le score de qualité de l'image source est inférieur au seuil. L'ensemble ajoute environ 5 % de latence pour un comportement 10 à 15 % meilleur dans le pire des cas. Cela vaut le coup pour les produits de consommation grand public.
Au-delà d'ArcFace et d'AdaFace
De nouvelles intégrations (CosFace 2.0, MagFace v2, plusieurs réseaux propriétaires) sont apparues dans des articles de 2 025. Aucun n'a encore remplacé ArcFace/AdaFace comme solution de production par défaut, généralement parce que le gain marginal ne justifie pas le coût d'intégration dans les pipelines établis. Regardez les débats NeurIPS et CVPR 2026 pour les candidats qui le pourraient.
Honnêteté de l'évaluation
Un piège : n'évaluez pas la préservation de l'identité en utilisant le même réseau d'intégration qui a piloté la génération. Le modèle est efficacement optimisé pour la notion d'identité de cette intégration, le score est donc gonflé. Évaluez toujours avec une intégration indépendante (nous avons utilisé un ArcFace entraîné séparément pour les générations pilotées par ArcFace et AdaFace).
Ce que DeepSwapAI utilise
Le pipeline de production de DeepSwapAI utilise un hybride : AdaFace comme identité principale intégrée à ArcFace comme contrôle de vérification lors de l'évaluation de la qualité. Cela donne une robustesse au segment des consommateurs avec une vérification de qualité studio. Documenté dans la page de méthodologie de recherche.
Résultat
Pour les scénarios d'entrée grand public ou de qualité mixte, AdaFace est la meilleure intégration en 2026. Pour les entrées organisées de qualité studio, les deux sont à égalité. Les ensembles hybrides capturent les pires améliorations à un coût modeste. Le levier le plus important en matière de préservation de l'identité réside dans l'architecture côté générateur et l'équilibre des données de formation : le choix de l'intégration est significatif mais pas dominant.