Сохранение идентичности при замене лиц с помощью искусственного интеллекта: тесты ArcFace и AdaFace (2026 г.)
sun d
Опубликовано.: 4/28/2026
Сохранение личности: ArcFace против AdaFace
Сохранение личности — самый важный параметр качества при замене лиц. Сеть встраивания лиц — это то, что сообщает генератору: «Это человек, которого мы переносим». В 2026 году доминируют два встраивания: ArcFace и AdaFace. Мы протестировали оба варианта на производственном конвейере замены лиц.
Для чего оптимизируется каждое встраивание
В 2018 году компания
ArcFace представила аддитивную потерю углового поля, которая на протяжении многих лет доминировала в тестах по распознаванию лиц. Его встраивания плотно сгруппированы по каждому идентификатору — отлично подходят для проверки и эффективны для передачи идентификаторов во время подкачки.
AdaFace (2022) добавил адаптивный запас по качеству: он по-разному взвешивает изображения низкого качества во время обучения, что приводит к тому, что встраивания становятся более устойчивыми к размытию, низкому разрешению и сложному освещению.
Настройка тестирования
<ул>
Тестовый набор. 1000 пар лиц из предварительной оценочной выборки, охватывающей различные ракурсы, освещение и качество изображения.
Конвейер: Тот же генератор замены лиц Wan 2.2, заменена только встраиваемая сеть.
Метрики: косинусное сходство ArcFace (да, используется в качестве оценки независимо от встраивания поколения — независимая оценка), рейтинг человеческих предпочтений, плотность артефактов.
Аппаратное обеспечение: H100 80 ГБ.
Результаты – высококачественные исходные изображения
Метрика
ArcFace
AdaFace
Сходство идентичности (среднее)
0,79
0,78
Сходство идентичности (p10)
0,71
0,72
Человеческие предпочтения
52%
48%
Настенные часы на одну замену
1,0× от базового уровня
1,05× от базового уровня
таблица>
В чистых высококачественных источниках эти два вложения статистически неразличимы. Выбирайте по простоте интеграции.
Результаты — исходные изображения низкого качества
Метрика
ArcFace
AdaFace
Сходство идентичности (среднее)
0,62
0,71
Сходство идентичности (p10)
0,48
0,61
Человеческие предпочтения
34%
66%
таблица>
На размытых источниках, источниках с низким разрешением или плохом освещении адаптивный запас качества AdaFace заметен. Разрыв в случае p10 (наихудшие входные данные дециля) достаточно велик, чтобы иметь значение в масштабе.
Результаты — источник неракурсного изображения
Оба встраивания с трудом преодолевают поворот головы примерно на 45°. Ни то, ни другое не является существенно лучшим. Исправление здесь — на стороне генератора, а не на стороне внедрения: улучшенное руководство по исходному изображению и сети генерации с учетом позы.
Результаты – междемографические показатели
Мы разделили набор тестов по исходным демографическим группам (лучшая практика для сравнительного анализа распознавания лиц). AdaFace сократил, но не устранил демографический разрыв в производительности, который демонстрировали старые версии ArcFace. Фундаментальное решение здесь — это композиция обучающих данных; обе сети улучшаются при обучении на демографически сбалансированных данных.
Руководство по принятию производственных решений
<ул>
Потребительская замена лица с помощью самостоятельно загруженных фотографий: AdaFace является лучшим вариантом по умолчанию. Фотографии, загруженные пользователями, сильно различаются по качеству.
Рабочий процесс студийного уровня с тщательно подобранными высококачественными источниками: ArcFace подойдет; прирост качества от AdaFace здесь незначителен.
API, обслуживающий смешанные группы клиентов: AdaFace является более безопасным вариантом по умолчанию: худший вариант намного лучше, а лучший случай статистически связан.
Режим реального времени с критической задержкой: Немного более быстрый вывод ArcFace может иметь значение при запасе. Проверьте свое оборудование.
Гибридные подходы
Некоторые производственные стеки 2026 года сочетают в себе оба продукта: ArcFace в качестве основного вектора идентификации и AdaFace в качестве запасного варианта с учетом качества, когда показатель качества исходного изображения ниже порогового значения. Ансамбль добавляет задержку примерно на 5 %, улучшая поведение в худшем случае на 10–15 %. Это того стоит, если речь идет о потребительских товарах для широкой аудитории.
За пределами ArcFace и AdaFace
Новые внедрения (CosFace 2.0, MagFace v2, несколько собственных сетей) появились в статьях 2025 года. Ни один из них пока не вытеснил ArcFace/AdaFace в качестве производственного продукта по умолчанию — обычно потому, что предельный выигрыш не оправдывает затраты на интеграцию в существующие конвейеры. Посмотрите слушания NeurIPS и CVPR 2026 года, чтобы найти кандидатов, которые могут это сделать.
Честность оценки
Одна ловушка: не оценивайте сохранение идентичности, используя ту же сеть внедрения, которая способствовала генерации. Модель эффективно оптимизирована для понятия идентичности этого встраивания, поэтому оценка завышена. Всегда оценивайте с помощью независимого внедрения (мы использовали отдельно обученный ArcFace как для поколений на основе ArcFace, так и на основе AdaFace).
Что использует DeepSwapAI
Производственный конвейер DeepSwapAI использует гибрид: AdaFace в качестве основного встроенного идентификатора и ArcFace в качестве проверки при оценке качества. Это обеспечивает надежность потребительского сегмента с проверкой студийного уровня. Документировано на странице методологии исследования.
Итог
Для сценариев ввода потребительского или смешанного качества AdaFace является лучшим внедрением в 2026 году. Для входных данных студийного уровня оба варианта связаны. Гибридные ансамбли позволяют добиться улучшения в худшем случае при умеренных затратах. Более важным рычагом в сохранении идентичности является архитектура на стороне генератора и баланс обучающих данных. Выбор встраивания имеет смысл, но не является доминирующим.