Американские нейросети стали лучшими в распознавании фейковых российских документов

19 марта, 2026, 18:15

Лучшими нейросетями для распознавания поддельных документов на русском языке стали американские ChatGPT, Claude Sonnet и Qwen3-VL-32B-Instruct, рассказали SecPost в MWS AI. При этом среди всего топ-25 нет ни одной отечественной разработки. Эксперты отмечают, что в теории любая нейросеть способна распознавать фейковые документы, однако добавление этой функции требует серьезных инвестиций.

ru.freepik.com
ru.freepik.com

Лучшей нейросетью для распознавания поддельных документов на русском языке стал ChatGPT-5.4 (разрабатывает американский OpenAI) с показателем 42% точности, сообщили SecPost в MWS AI (входит в МТС Web Services). На втором месте — Claude Sonnet 4.6 (разрабатывает американская Anthropic) с точностью 35%, лучшей среди открытых моделей с результатом точности в 25% стала Qwen3-VL-32B-Instruct (выпущена под лицензией APACHE-2.0, разработанной американской Apache Software Foundation).

Тестирование нейросетей проводилось в рамках бенчмарка MWS Vision Bench открытого русскоязычного инструмента для оценки качества мультимодальных моделей, выпущенного MWS AI в октябре 2025 года. Бенчмарк ориентирован на реальные продуктовые сценарии, в которых ИИ-модели работают с документами на русском языке, и содержит более 1 тыс. изображений и 3 тыс. заданий.

Нейросети должны выявлять и распознавать фотореалистичные фальсификации — паспорта, СНИЛС, водительские удостоверения и другие документы. Методология оценки учитывает два компонента. Первый — точность классификации: модель должна определить, является ли документ оригинальным, отредактированным вручную или сгенерированным с помощью ИИ. Второй — качество аргументации: модель должна указать конкретные признаки, выдающие подделку. Каждый компонент вносит до 50% в итоговый балл, поэтому высокий результат возможен только при сочетании точного распознавания и убедительного обоснования.тыс. заданий. «Мы собрали датасеты из оригинальных документов, документов с ручными правками и документов, сгенерированных при помощи ИИ, — и оцениваем модели по двум параметрам: точности распознавания и качеству аргументации», — отметил ведущий инженер-исследователь MWS AI Георгий Гайков.

Ни одна из существующих моделей пока не способна уверенно распознавать большинство подделок: средний результат участников бенчмарка составляет около 15%. Так, модель Gemini 3 Flash разработки Google продемонстрировала точность лишь на уровне 12,5%. Показатель ChatGPT-5.4 в 42% впервые демонстрирует практически применимый уровень детектирования очевидных фальсификаций. 

Продолжение ниже

SecPost ознакомился со списком всех 25 ИИ моделей в рейтинге MWS AI и не увидел там отечественных моделей. По словам представителя MWS AI, их компания протестировала «все доступные на текущий момент нейросети», однако он отказался комментировать результаты российских моделей.

В конце мая 2024 года «РИА Новости» сообщили, что российский разработчик Smart Engines представил нейросеть по распознаванию поддельных документов собственной разработки. «Задачей компании на будущее является масштабирование технологий проверки подлинности документов в банках», заявлял тогда изданию генеральный директор Smart Engines Владимир Арлазаров.

Представители двух крупнейших в РФ нейросетей не стали комментировать свое отсутствие в рейтинге. Так, в «Яндексе» (разрабатывают «Алиса AI») на запрос SecPost отказались от комментариев, в «Сбере» (разрабатывают GigaChat) не смогли ответить на запрос.

Задачи распознавания фальсификаций и антиспуфинга уже давно успешно решаются с помощью специализированных нейросетей, обученных под конкретные сценарии, говорит ML-директор Positive Technologies Андрей Кузнецов. «Хотя большие языковые модели общего назначения способны выполнять подобные функции «из коробки», на практике крупные компании, работающие с проверкой документов, не спешат их внедрять», — подчеркивает он. Среди причин Кузнецов указывает высокую стоимость решений по распознаванию поддельных документов, необходимость передачи чувствительных данных внешним ИИ-вендорам, а также низкая точность по сравнению с узкоспециализированными моделями, оптимизированными под задачи детекции подделок.

Полный рейтинг нейросетей по распознаванию поддельных документов на русском языке от MWS AI

Место рейтингаМодельПроцент точности
1ChatGPT-5.442.1
2Claude 4.6 Sonnet35.0
3ChatGPT-5.232.8
4Claude 4.6 Opus30.8
5Claude 4.5 Sonnet30.0
6Claude 4.5 Opus29.2
7ChatGPT-5-mini25.4
8Qwen3-VL-32B-Instruct25.4
9Qwen 3.5-2B19.2
10Mistral Large 318.5
11Qwen 3.5-0.8B17.7
12Qwen 3.5-9B15.9
13Qwen3-VL-8B-Instruct14.1
14Mistral Small 313.3
15Qwen 3.5-35B-A3B12.9
16Gemini 3 Flash12.5
17ChatGPT-4.112.3
18ChatGPT-4.1-mini12.1
19Qwen3-VL-235B-Instruct8.3
20Qwen 3.5-27B6.9
21Gemini 2.5 Pro6.7
22Gemini 2.5 Flash6.3
23ChatGPT-5.16.2
24Qwen 3.5-4B6.2
25Qwen 2.5-VL-72B-Instruct2.4