Conservazione dell'identità nello scambio di volti con intelligenza artificiale: benchmark ArcFace vs AdaFace (2026)
sun d
Pubblicato il.: 4/28/2026
Preservazione dell'identità: ArcFace contro AdaFace
La preservazione dell'identità è la dimensione qualitativa più importante nello scambio di volti. La rete di incorporamento dei volti è ciò che dice al generatore "questa è la persona che stiamo trasferendo". Due incorporamenti dominano gli stack di produzione del 2026: ArcFace e AdaFace. Abbiamo confrontato entrambi su una pipeline di produzione con scambio di volti.
Per cosa viene ottimizzato ogni incorporamento
ArcFace ha introdotto la perdita additiva del margine angolare nel 2018, dominando per anni i benchmark relativi al riconoscimento facciale. I suoi incorporamenti sono strettamente raggruppati per identità: eccellenti per la verifica, efficaci per il trasferimento di identità in fase di scambio.
AdaFace (2022) ha aggiunto un margine di adattamento alla qualità: pondera le immagini di bassa qualità in modo diverso durante l'addestramento, portando a incorporamenti più resistenti alla sfocatura, alla bassa risoluzione e all'illuminazione difficile.
Impostazione benchmark
Set di test: 1.000 coppie di volti da un set di valutazione che copre vari angoli, illuminazione e qualità dell'immagine.
Pipeline: stesso generatore di scambio di volti Wan 2.2, è stata scambiata solo la rete di incorporamento.
Metriche: somiglianza coseno di ArcFace (sì, utilizzata come valutazione indipendentemente dall'incorporamento della generazione - valutazione indipendente), valutazione delle preferenze umane, densità degli artefatti.
Hardware: H100 80GB.
Risultati: immagini sorgente di alta qualità
Metrico
ArcFace
AdaFace
Somiglianza di identità (media)
0,79
0,78
Somiglianza di identità (p10)
0,71
0,72
Preferenza umana
52%
48%
Orologio da parete per scambio
1,0× linea di base
1,05× linea di base
Su fonti pulite e di alta qualità, i due incorporamenti sono statisticamente indistinguibili. Scegli in base alla facilità di integrazione.
Risultati: immagini sorgente di bassa qualità
Metrico
ArcFace
AdaFace
Somiglianza di identità (media)
0,62
0,71
Somiglianza di identità (p10)
0,48
0,61
Preferenze umane
34%
66%
Su fonti sfocate, a bassa risoluzione o scarsamente illuminate, il margine di adattamento della qualità di AdaFace brilla. Il divario del caso p10 (input del decile peggiore) è abbastanza ampio da avere importanza su larga scala.
Risultati: sorgente fuori angolo
Entrambi gli incorporamenti faticano a superare la rotazione della testa di circa 45°. Nessuno dei due è significativamente migliore. La soluzione qui riguarda il generatore, non l'incorporamento: migliore guida dell'immagine sorgente e reti di generazione in grado di riconoscere la posa.
Risultati: prestazioni interdemografiche
Abbiamo suddiviso il set di test in base al gruppo demografico di origine (best practice per il benchmarking del riconoscimento facciale). AdaFace ha ridotto ma non eliminato il divario di prestazioni demografiche mostrato dalle implementazioni ArcFace precedenti. La soluzione fondamentale qui è l'addestramento della composizione dei dati; entrambe le reti migliorano se addestrate su dati demograficamente bilanciati.
Guida alle decisioni di produzione
Scambio di volti dei consumatori con foto caricate autonomamente: AdaFace è l'impostazione predefinita migliore. Le foto caricate dagli utenti variano notevolmente in termini di qualità.
Flusso di lavoro di livello studio con fonti curate di alta qualità: ArcFace va bene; il guadagno di qualità da AdaFace è marginale qui.
API che serve popolazioni di clienti miste: AdaFace è l'impostazione predefinita più sicura: il caso peggiore è molto migliore e il caso migliore è statisticamente legato.
Tempo reale critico per la latenza: l'inferenza leggermente più veloce di ArcFace può essere importante a margine. Prova sul tuo hardware.
Approcci ibridi
Alcuni stack di produzione del 2026 li uniscono entrambi: ArcFace per il vettore di identità primario, AdaFace come fallback in grado di riconoscere la qualità quando il punteggio di qualità dell'immagine sorgente è inferiore alla soglia. L'insieme aggiunge circa il 5% di latenza per un comportamento migliore del 10-15% nel caso peggiore. Ne vale la pena per i prodotti di consumo destinati al pubblico generale.
Oltre ArcFace e AdaFace
Incorporamenti più recenti (CosFace 2.0, MagFace v2, diverse reti proprietarie) sono apparsi nei documenti del 2025. Nessuno ha finora sostituito ArcFace/AdaFace come standard di produzione, in genere perché il guadagno marginale non giustifica il costo di integrazione nelle pipeline consolidate. Guarda gli atti NeurIPS e CVPR 2026 per i candidati che potrebbero farlo.
Onestà di valutazione
Una trappola: non valutare la conservazione dell'identità utilizzando la stessa rete di incorporamento che ha guidato la generazione. Il modello è effettivamente ottimizzato per la nozione di identità di tale incorporamento, quindi il punteggio è gonfiato. Valuta sempre con un incorporamento indipendente (abbiamo utilizzato un ArcFace addestrato separatamente sia per le generazioni guidate da ArcFace che per quelle guidate da AdaFace).
Cosa utilizza DeepSwapAI
La pipeline di produzione di DeepSwapAI utilizza un ibrido: AdaFace come identità primaria incorporata con ArcFace come controllo di verifica durante il punteggio di qualità. Ciò garantisce robustezza al segmento dei consumatori con verifica a livello di studio. Documentato nella pagina sulla metodologia di ricerca.
Conclusione
Per scenari di input consumer o di qualità mista, AdaFace è l'incorporamento migliore nel 2026. Per input curati di livello professionale, entrambi sono alla pari. Gli insiemi ibridi catturano il miglioramento del caso peggiore a costi modesti. La leva più importante nella conservazione dell'identità è l'architettura lato generatore e l'equilibrio dei dati di training: la scelta di incorporamento è significativa ma non dominante.