Вторая версия Smart IDReader с помощью нового ИИ прибавила в скорости и качестве распознавания документов со смартфонов
Smart Engines представляет новую версию системы искусственного интеллекта для распознавания документов Smart IDReader 2.0. Вторая версия, созданная с применением глубоких разреженных дискретных нейронных сетей, может распознавать в видеопотоке и на изображениях сотни видов официальных документов, типовые формы формата А4 и поддерживает произвольные ракурсы съемки, удобные пользователю. Продукт нацелен на рынки РФ и стран бывшего СССР.
«3 года назад мы первыми предложили клиентам распознавать паспорт РФ в мобильных приложениях, показывая документ камере телефона. Это был новый пользовательский опыт, и мы очень рады, что рынок его принял. Вторая версия Smart IDReader — это история про новые стандарты в распознавании документов. Клиентам не нужны системы OCR, которые распознают скан паспорта за 5 секунд на мощном компьютере и не умеют обрабатывать фотографии с легко читаемым текстом просто потому, что система не научена законам перспективы. Пользователи хотят буквально за 1 секунду распознавать наспех сделанные фотографии и выполнять real-time распознавание в видеопотоке», – комментирует генеральный директор Smart Engines к.т.н. Владимир Арлазаров.
Использование в версии Smart IDReader 2.0 вычислительно-эффективных алгоритмов машинного зрения и 8-битной модели вычислений позволило специалистам Smart Engines перейти технологический барьер от распознавания на мобильных телефонах документов размера А5 и В5 (паспорт РФ) до типовых удостоверяющих документов и произвольных анкет, заявлений, договоров формата А4. При распознавании «больших» документов в видеопотоке в мобильном приложении требуются принципиально новые подходы к проведению вычислений, так как в отличие от серверных решений производительность смартфона ограничена и для ускорения распознавания невозможно просто подключить дополнительное «ядро».
Развитие дистанционных каналов обслуживания является одной из основных сфер применения технологий распознавания документов. Зачастую клиенты отправляют при обращении фотографии, на которых документы из-за проективных искажений представляют собой непрямоугольные четырехугольники, а в случае паспорта РФ — так называемую «книжку». OCR-технологии, ориентированные на работу со сканами, при обработке таких фотографий могут давать качество на уровне 5-10% и менее. Smart IDReader 2.0 умеет исправлять проективные искажения как на фотографиях, так и при работе с видеопотоком в мобильных приложениях, предлагая пользователю показывать документ камере как ему удобно. Технологически возможность распознавания при этом обеспечивается практически до того момента, пока документ может прочитать без ошибок человек.
Благодаря проведенным алгоритмическим и программным оптимизациям в Smart IDReader 2.0 удалось достигнуть двукратного увеличения точности распознавания. Это означает, что количество ошибок распознавания, которые попадают на верификацию человеку, по сравнению с первым поколением системы сократилось примерно в 2 раза.
В новой версии появилась возможность распознавания паспортов гражданина РФ с рукописным заполнением. И, хотя количество таких документов относительно общего числа невелико, их обработка не только актуальна в различных финансовых сервисах, но и является очередным научным вызовом. Для обработки рукописных паспортов в решении Smart Engines реализованы автоматическая детекция рукописного заполнения и возможность распознавания (помимо номера документа) пола, дат и номера подразделения.
Достигнутые сотрудниками Smart Engines результаты стали возможны благодаря решению целого пласта сложных научно-технических задач в области компьютерного зрения и искусственного интеллекта. Научное подтверждение полученных результатов нашло свое отражение в 2 защищенных кандидатских диссертациях и в более чем 40 статьях, опубликованных в рейтинговых российских и международных журналах.
Помимо распознавания паспорта РФ, СНИЛС, водительских удостоверений, СТС и документов с машиночитаемой зоной, доступного уже в первой версии, Smart IDReader 2.0 умеет распознавать 15 новых видов документов РФ, 20 документов стран бывшего СССР и более 200 документов стран мира на более чем 35 языках. Добавление новых типов документов и языков распознавания реализовано на базе оригинальной разработки Smart Engines в области зрительного интеллекта — технологической платформы HIEROGLYPH.
С точки зрения базового (универсального) функционала улучшено качество распознавания эмбоссированных и неэмбоссированных банковских карт, машиночитаемой зоны на любых документах с MRZ и реализовано распознавание штрихкодов с высокой плотностью печати. В видеопотоке, на фотографиях и сканах обеспечена поддержка распознавания одномерных штрихкодов UPC-A, UPC-E, EAN-8, EAN-13, Code 39, Code 93, Code 128 и двумерных QR Code, Data Matrix, Aztec, PDF 417.
Алгоритмическая база Smart IDReader оптимизирована для архитектур «Эльбрус», SPARC, MIPS, ARM, x86 и совместима с операционными системами iOS, Android, Sailfish Mobile OS RUS, «Эльбрус», Linux (включая Astra Linux и «Атликс»), Windows, macOS и Solaris. Решение относится к классу платформонезависимых — качество распознавания не зависит от используемой ОС и аппаратной платформы, а быстродействие определяется доступными вычислительными ресурсами.
Smart IDReader успешно применяется в банках, страховых компаниях, проектах шеринговой экономики, финтехе, в различных сервисах с дистанционным и выездным обслуживанием, где для оказания услуг клиентам требуется предоставление своих данных. Пользователями системы являются Альфа-Банк, Почта Банк, Тинькофф Банк, Совкомбанк, АльфаСтрахование, Ингосстрах, Ренессанс Страхование, СКБ Контур, QIWI и др.
Опубликовал: Игорь Плотников (info@spbit.ru)
Тематики: Интеграция, ПО
Ключевые слова: сканирование, Электронные архивы, мобильные приложения