Американские нейросети стали лучшими в распознавании фейковых российских документов
Лучшими нейросетями для распознавания поддельных документов на русском языке стали американские ChatGPT, Claude Sonnet и Qwen3-VL-32B-Instruct, рассказали SecPost в MWS AI. При этом среди всего топ-25 нет ни одной отечественной разработки. Эксперты отмечают, что в теории любая нейросеть способна распознавать фейковые документы, однако добавление этой функции требует серьезных инвестиций.
Лучшей нейросетью для распознавания поддельных документов на русском языке стал ChatGPT-5.4 (разрабатывает американский OpenAI) с показателем 42% точности, сообщили SecPost в MWS AI (входит в МТС Web Services). На втором месте — Claude Sonnet 4.6 (разрабатывает американская Anthropic) с точностью 35%, лучшей среди открытых моделей с результатом точности в 25% стала Qwen3-VL-32B-Instruct (выпущена под лицензией APACHE-2.0, разработанной американской Apache Software Foundation).
Тестирование нейросетей проводилось в рамках бенчмарка MWS Vision Bench открытого русскоязычного инструмента для оценки качества мультимодальных моделей, выпущенного MWS AI в октябре 2025 года. Бенчмарк ориентирован на реальные продуктовые сценарии, в которых ИИ-модели работают с документами на русском языке, и содержит более 1 тыс. изображений и 3 тыс. заданий.
Нейросети должны выявлять и распознавать фотореалистичные фальсификации — паспорта, СНИЛС, водительские удостоверения и другие документы. Методология оценки учитывает два компонента. Первый — точность классификации: модель должна определить, является ли документ оригинальным, отредактированным вручную или сгенерированным с помощью ИИ. Второй — качество аргументации: модель должна указать конкретные признаки, выдающие подделку. Каждый компонент вносит до 50% в итоговый балл, поэтому высокий результат возможен только при сочетании точного распознавания и убедительного обоснования.тыс. заданий. «Мы собрали датасеты из оригинальных документов, документов с ручными правками и документов, сгенерированных при помощи ИИ, — и оцениваем модели по двум параметрам: точности распознавания и качеству аргументации», — отметил ведущий инженер-исследователь MWS AI Георгий Гайков.
Ни одна из существующих моделей пока не способна уверенно распознавать большинство подделок: средний результат участников бенчмарка составляет около 15%. Так, модель Gemini 3 Flash разработки Google продемонстрировала точность лишь на уровне 12,5%. Показатель ChatGPT-5.4 в 42% впервые демонстрирует практически применимый уровень детектирования очевидных фальсификаций.
SecPost ознакомился со списком всех 25 ИИ моделей в рейтинге MWS AI и не увидел там отечественных моделей. По словам представителя MWS AI, их компания протестировала «все доступные на текущий момент нейросети», однако он отказался комментировать результаты российских моделей.
В конце мая 2024 года «РИА Новости» сообщили, что российский разработчик Smart Engines представил нейросеть по распознаванию поддельных документов собственной разработки. «Задачей компании на будущее является масштабирование технологий проверки подлинности документов в банках», заявлял тогда изданию генеральный директор Smart Engines Владимир Арлазаров.
Представители двух крупнейших в РФ нейросетей не стали комментировать свое отсутствие в рейтинге. Так, в «Яндексе» (разрабатывают «Алиса AI») на запрос SecPost отказались от комментариев, в «Сбере» (разрабатывают GigaChat) не смогли ответить на запрос.
Задачи распознавания фальсификаций и антиспуфинга уже давно успешно решаются с помощью специализированных нейросетей, обученных под конкретные сценарии, говорит ML-директор Positive Technologies Андрей Кузнецов. «Хотя большие языковые модели общего назначения способны выполнять подобные функции «из коробки», на практике крупные компании, работающие с проверкой документов, не спешат их внедрять», — подчеркивает он. Среди причин Кузнецов указывает высокую стоимость решений по распознаванию поддельных документов, необходимость передачи чувствительных данных внешним ИИ-вендорам, а также низкая точность по сравнению с узкоспециализированными моделями, оптимизированными под задачи детекции подделок.
Полный рейтинг нейросетей по распознаванию поддельных документов на русском языке от MWS AI
| Место рейтинга | Модель | Процент точности |
| 1 | ChatGPT-5.4 | 42.1 |
| 2 | Claude 4.6 Sonnet | 35.0 |
| 3 | ChatGPT-5.2 | 32.8 |
| 4 | Claude 4.6 Opus | 30.8 |
| 5 | Claude 4.5 Sonnet | 30.0 |
| 6 | Claude 4.5 Opus | 29.2 |
| 7 | ChatGPT-5-mini | 25.4 |
| 8 | Qwen3-VL-32B-Instruct | 25.4 |
| 9 | Qwen 3.5-2B | 19.2 |
| 10 | Mistral Large 3 | 18.5 |
| 11 | Qwen 3.5-0.8B | 17.7 |
| 12 | Qwen 3.5-9B | 15.9 |
| 13 | Qwen3-VL-8B-Instruct | 14.1 |
| 14 | Mistral Small 3 | 13.3 |
| 15 | Qwen 3.5-35B-A3B | 12.9 |
| 16 | Gemini 3 Flash | 12.5 |
| 17 | ChatGPT-4.1 | 12.3 |
| 18 | ChatGPT-4.1-mini | 12.1 |
| 19 | Qwen3-VL-235B-Instruct | 8.3 |
| 20 | Qwen 3.5-27B | 6.9 |
| 21 | Gemini 2.5 Pro | 6.7 |
| 22 | Gemini 2.5 Flash | 6.3 |
| 23 | ChatGPT-5.1 | 6.2 |
| 24 | Qwen 3.5-4B | 6.2 |
| 25 | Qwen 2.5-VL-72B-Instruct | 2.4 |

