AI 얼굴 교환의 신원 보존: ArcFace 및 AdaFace 벤치마크(2026)

신원 보존: ArcFace 대 AdaFace
신원 보존은 얼굴 교환에서 가장 중요한 품질 차원입니다. 얼굴 임베딩 네트워크는 생성기에 "이 사람이 우리가 전송하려는 사람입니다"라고 알려주는 것입니다. 두 가지 임베딩이 2026년 프로덕션 스택을 지배합니다. ArcFace 및 AdaFace. 우리는 프로덕션 페이스 스왑 파이프라인에서 두 가지를 모두 벤치마킹했습니다.
각 임베딩의 최적화 대상
ArcFace는 2018년에 추가 각도 마진 손실을 도입하여 수년간 얼굴 인식 벤치마크를 장악했습니다. 임베딩은 ID별로 긴밀하게 클러스터되어 있어 검증에 탁월하고 스왑 시간 ID 전송에 강력합니다.
AdaFace(2022)는 품질 적응 마진을 추가했습니다. 학습 중에 저품질 이미지에 다르게 가중치를 부여하여 블러, 낮은 해상도, 어려운 조명에 대한 임베딩을 더욱 강력하게 만듭니다.
벤치마크 설정
- 테스트 세트: 다양한 각도, 조명 및 이미지 품질을 다루는 보류 평가 세트의 얼굴 쌍 1,000개.
- 파이프라인: 동일한 Wan 2.2 페이스 스왑 생성기, 임베딩 네트워크만 스왑됨.
- 측정항목: ArcFace 코사인 유사성(예, 세대 임베딩에 관계없이 평가로 사용됨 - 독립적인 평가), 인간 선호도 등급, 아티팩트 밀도.
- 하드웨어: H100 80GB.
결과 - 고품질 소스 이미지
| 미터법 | ArcFace | AdaFace |
|---|---|---|
| 신원 유사성(평균) | 0.79 | 0.78 |
| 신원 유사성(p10) | 0.71 | 0.72 |
| 인간 선호도 | 52% | 48% |
| 스왑당 벽시계 | 1.0× 기준선 | 1.05× 기준선 |
깨끗한 고품질 소스에서는 두 임베딩이 통계적으로 구별되지 않습니다. 통합 용이성을 기준으로 선택하세요.
결과 — 저품질 소스 이미지
| 미터법 | ArcFace | AdaFace |
|---|---|---|
| 신원 유사성(평균) | 0.62 | 0.71 |
| 신원 유사성(p10) | 0.48 | 0.61 |
| 인간 선호도 | 34% | 66% |
흐릿하거나 해상도가 낮거나 조명이 어두운 소스에서는 AdaFace의 품질 적응 마진이 빛을 발합니다. p10 사례(최악 10분위 입력) 격차는 대규모로 문제가 될 만큼 충분히 큽니다.
결과 — 오프앵글 소스
두 임베딩 모두 약 45° 머리 회전을 넘기는 데 어려움을 겪고 있습니다. 둘 다 의미있게 더 나은 것은 아닙니다. 여기서 해결 방법은 임베딩 측이 아닌 생성기 측입니다. 더 나은 소스 이미지 안내 및 포즈 인식 생성 네트워크입니다.
결과 — 인구통계학적 성과
테스트 세트를 소스 인구통계 그룹별로 분할했습니다(얼굴 인식 벤치마킹 모범 사례). AdaFace는 범위를 좁혔지만 이전 ArcFace 배포에서 나타난 인구통계학적 성능 격차를 제거하지는 못했습니다. 여기서 근본적인 수정은 훈련 데이터 구성입니다. 두 네트워크 모두 인구 통계학적으로 균형 잡힌 데이터를 학습하면 향상됩니다.
제작 결정 가이드
- 직접 업로드한 사진으로 소비자 얼굴 교환: AdaFace가 더 나은 기본값입니다. 사용자가 업로드한 사진의 품질은 매우 다양합니다.
- 선별된 고품질 소스를 갖춘 스튜디오급 워크플로: ArcFace는 괜찮습니다. 여기서 AdaFace의 품질 향상은 미미합니다.
- 혼합된 고객 집단에 서비스를 제공하는 API: AdaFace가 더 안전한 기본값입니다. 최악의 경우가 훨씬 낫고 최상의 경우는 통계적으로 동일합니다.
- 지연 시간이 중요한 실시간: ArcFace의 약간 더 빠른 추론은 한계가 있을 수 있습니다. 하드웨어를 테스트해 보세요.
하이브리드 접근 방식
일부 2026년 프로덕션 스택 앙상블은 기본 ID 벡터용 ArcFace와 소스 이미지 품질 점수가 임계값 미만일 때 품질 인식 폴백으로 사용되는 AdaFace입니다. 앙상블은 최악의 경우 동작을 10~15% 개선하기 위해 최대 5%의 대기 시간을 추가합니다. 일반 소비자용 소비자 제품으로는 가치가 있습니다.
ArcFace와 AdaFace를 넘어서
최신 임베딩(CosFace 2.0, MagFace v2, 여러 독점 네트워크)이 2025년 논문에 나타났습니다. 아직 ArcFace/AdaFace를 생산 기본값으로 대체한 제품은 없습니다. 일반적으로 한계 이득이 기존 파이프라인의 통합 비용을 정당화하지 못하기 때문입니다. 2026년 NeurIPS 및 CVPR 진행 과정에서 후보자를 찾아보세요.
평가의 정직성
한 가지 함정: 생성을 주도한 동일한 임베딩 네트워크를 사용하여 ID 보존을 평가하지 마세요. 해당 임베딩의 ID 개념에 맞게 모델이 효과적으로 최적화되었으므로 점수가 부풀려집니다. 항상 독립적인 임베딩으로 평가합니다(ArcFace 기반 세대와 AdaFace 기반 세대 모두에 대해 별도로 훈련된 ArcFace를 사용했습니다).
DeepSwapAI가 사용하는 것
DeepSwapAI의 프로덕션 파이프라인은 AdaFace를 품질 평가 중 검증 확인으로 ArcFace에 내장된 기본 ID로 사용합니다. 이는 스튜디오급 검증을 통해 소비자 부문의 견고성을 제공합니다. 연구 방법론 페이지에 문서화되어 있습니다.
최종
소비자 또는 혼합 품질 입력 시나리오의 경우 2026년에는 AdaFace가 더 나은 임베딩입니다. 스튜디오 수준으로 선별된 입력의 경우 둘 다 연결되어 있습니다. 하이브리드 앙상블은 적당한 비용으로 최악의 개선 사항을 포착합니다. ID 보존의 더 큰 수단은 생성기 측 아키텍처와 훈련 데이터 균형입니다. 임베딩 선택은 의미가 있지만 지배적이지는 않습니다.