AI フェイススワップにおけるアイデンティティの保持: ArcFace と AdaFace のベンチマーク (2026)

アイデンティティの保持: ArcFace と AdaFace

アイデンティティの保持は、顔交換における最も重要な品質の側面です。顔埋め込みネットワークは、ジェネレータに「この人が転送している人です」と伝えるものです。 2026 年の運用スタックでは、ArcFace と AdaFace。私たちは両方のベンチマークを実稼働フェイススワップパイプラインで実行しました。

各埋め込みの最適化対象

ArcFace は 2018 年に追加の角度マージン損失を導入し、長年にわたり顔認識ベンチマークを支配しました。その埋め込みは ID ごとに密にクラスター化されており、検証に優れ、スワップ時の ID 転送に優れています。

AdaFace (2022) は、品質適応マージンを追加しました。トレーニング中に低品質の画像に異なる重みを付け、ぼやけ、低解像度、困難な照明に対してより堅牢なエンベディングを実現します。

ベンチマークの設定

テストセット: さまざまな角度、照明、画質をカバーする、保持された評価セットからの 1,000 の顔のペア
パイプライン: 同じ Wan 2.2 フェイススワップジェネレーター。埋め込みネットワークのみがスワップされます。
指標: ArcFace コサイン類似度 (はい、世代の埋め込みに関係なく評価として使用されます - 独立した評価)、人間の好みの評価、アーティファクト密度
ハードウェア: H100 80GB。

結果 — 高品質のソース画像

クリーンで高品質のソースでは、2 つのエンベディングは統計的に区別できません。統合の容易さに基づいて選択してください。

結果 — 低品質のソース画像

メトリック	ArcFace	AdaFace
アイデンティティ類似度 (平均)	0.79	0.78
アイデンティティ類似性 (p10)	0.71	0.72
人間の好み	52%	48%
スワップあたりの実時間	ベースラインの 1.0 倍	ベースラインの 1.05 倍

ぼやけたソース、低解像度のソース、または照明が不十分なソースでは、AdaFace の品質適応マージンが威力を発揮します。 p10 ケース (最悪十分位入力) のギャップは、大規模な場合に問題となるほど十分に大きいです。

結果 — オフアングルソース

どちらのエンベディングも、ヘッドターンが約 45 度を超えると苦戦します。どちらが意味的に優れているというわけではありません。ここでの修正は、埋め込み側ではなくジェネレーター側です。ソース画像のガイダンスとポーズを意識した生成ネットワークが改善されています。

結果 — 複数の人口統計にまたがるパフォーマンス

テストセットをソース人口統計グループごとに分割しました (顔認識ベンチマークのベストプラクティス)。 AdaFace は縮小しましたが、古い ArcFace 導入で示されていた人口統計上のパフォーマンスのギャップは解消されませんでした。ここでの根本的な修正はトレーニングデータの構成です。どちらのネットワークも、人口統計的にバランスの取れたデータでトレーニングすると改善されます。

制作決定ガイド

消費者が自分でアップロードした写真と顔を交換する: AdaFace がより良いデフォルトです。ユーザーがアップロードした写真の品質は大きく異なります。
厳選された高品質のソースを使用したスタジオグレードのワークフロー: ArcFace は問題ありません。ここでは、AdaFace による品質の向上はわずかです。
混合顧客集団にサービスを提供する API: AdaFace がより安全なデフォルトです。最悪の場合の方がはるかに優れており、最良の場合は統計的に同程度です。
遅延が重要なリアルタイム: ArcFace のわずかに高速な推論は、わずかに問題になる可能性があります。ハードウェアでテストします。

ハイブリッドアプローチ

一部の 2026 プロダクションスタックは、プライマリ ID ベクトルとしての ArcFace と、ソース画像の品質スコアがしきい値を下回った場合の品質を意識したフォールバックとしての AdaFace の両方をアンサンブルします。アンサンブルにより、最大 5% の遅延が追加され、最悪の場合の動作が 10 ～ 15% 改善されます。一般向けの消費者向け製品には価値があります。

ArcFace と AdaFace を超えて

新しい埋め込み (CosFace 2.0、MagFace v2、いくつかの独自ネットワーク) が 2025 年の論文に登場しました。 ArcFace/AdaFace に取って代わる製品のデフォルトはまだありません。これは通常、限界利益が確立されたパイプラインの統合コストに見合わないためです。その可能性のある候補者については、2026 年の NeurIPS および CVPR の議事録をご覧ください。

評価の誠実さ

1 つの罠: 生成を駆動したのと同じ埋め込みネットワークを使用して ID の保存を評価しないでください。モデルはその埋め込みの ID 概念に合わせて効果的に最適化されているため、スコアが膨らみます。常に独立した埋め込みを使用して評価します (ArcFace 駆動の世代と AdaFace 駆動の世代の両方に個別にトレーニングされた ArcFace を使用しました)。

DeepSwapAI が使用するもの

DeepSwapAI のプロダクションパイプラインはハイブリッドを使用します。プライマリ ID 埋め込みとして AdaFace を使用し、品質スコアリング時の検証チェックとして ArcFace を使用します。これにより、スタジオグレードの検証による消費者セグメントの堅牢性が実現します。調査方法のページに文書化されています。

最終行

コンシューマーまたは混合品質の入力シナリオの場合、2026 年には AdaFace の方が優れた埋め込みです。スタジオグレードの厳選された入力の場合、両方が同等です。ハイブリッドアンサンブルは、適度なコストで最悪の場合の改善を実現します。 ID 保持におけるより大きな要因は、ジェネレーター側のアーキテクチャとトレーニングデータのバランスです。埋め込みの選択は意味がありますが、支配的ではありません。

メトリック	ArcFace	AdaFace
アイデンティティ類似度 (平均)	0.62	0.71
アイデンティティ類似性 (p10)	0.48	0.61
人間の好み	34%	66%