InfoWatch запатентовала технологию для распознавания текста на сложных изображениях
ГК InfoWatch получила патент на технологию, повышающую точность распознавания текста на искаженных, повреждённых и низкокачественных изображениях. Как сообщили в компании, разработка предназначена для использования в DLP-системах.
Патент защищает способ подготовки текстовых зон, выявленных нейросетью, для последующей обработки OCR-движком. Технология комбинирует нейросети и эвристический алгоритм: нейросети формируют карты вероятности текстовых пикселей и связности символов, а алгоритм объединяет блоки в логические строки и колонки, правильно определяя структуру документа.
Разработка применяется в DLP-системе InfoWatch Traffic Monitor для обработки сканов, скриншотов и фотографий. Повышение глубины и качества распознавания текста на изображениях, по заявлению InfoWatch, поможет снизить риски утечек данных.
