Директор по производству корпорации ЭЛАР Кирилл Мильман: «Ситуация на рынке оцифровки потребовала коренного изменения модели услуг»

29.07.2015

Оцифровка является неотъемлемой частью перехода на электронные технологии. В формате аутсорсинга подобные услуги заказываются коммерческими компаниями, государственными учреждениями и учреждениями культуры. В текущей экономической ситуации многие организации вынуждены искать более простые способы наполнения своих информационных систем и баз данных. О тенденциях и новых форматах услуг ECM.ICT-Online.ru рассказывает Кирилл Мильман – директор по производству корпорации ЭЛАР, лидера российского рынка оцифровки.

 - Кирилл Семенович, доброго дня. Чтобы наши читатели имели представление о рынке, опишите, пожалуйста, круг ваших заказчиков: кому и зачем требуется оцифровка.

 - Оцифровка – это собирательное понятие, состоящее из двух больших элементов: сканирования и ретроконверсии, то есть извлечения данных. Часто заказчикам нужно только что-то одно: например, отсканировать картину или непосредственно с бумажного документа внести данные в базу (учетную систему).

Самих заказчиков можно разделить на три большие группы: культура, коммерция и государственный сектор. У каждой из них свои задачи: в культуре – развитие электронных сервисов для привлечения посетителей и учета единиц хранения; в государственных учреждениях – взаимодействие с гражданами, услуги, суперуслуги и межведомственное взаимодействие; в коммерческих организациях – эффективность управления, производства и финансовой деятельности, взаимодействие с контрагентами. 

Директор по производству корпорации ЭЛАР Кирилл Мильман

Директор по производству корпорации ЭЛАР Кирилл Мильман

 - Примеры интересных проектов, если имеете право раскрывать заказчиков?

 - Спасибо за понимание, о многих проектах я действительно не могу рассказывать из-за соглашений о конфиденциальности. Из тех, о которых можно говорить… Попытаюсь максимально охватить спектр задач. Мы оцифровывали документы по корпоративному имуществу для крупнейших компаний ТЭК; переводили в электронный вид техническую и технологическую документацию для ВТЗ; дела скважин и каротаж для «Лукойла»; первичную бухгалтерскую документацию для РФФИ и в рамках нескольких проектов создания ОЦО; клиентские досье для ряда кредитных организаций.

В госсекторе – договоры аренды для ДГИ г.Москвы; правоустанавливающие документы для Администрации г. Сочи во время олимпийского строительства; ОРД для Правительства Якутии; геологические отчеты для Минэкологии Башкирии и даже такие сложные документы с персональными данными, как книги ЗАГС и медицинские карты.

В целом, за 23 года нашими заказчиками стали более 700 организаций.

 - А какие тенденции наблюдаются сегодня? Что, на ваш взгляд, изменилось с приходом кризиса?

 - Кризис мы переживаем не в первый раз. И сегодня поведение заказчиков такое же, как в 2009 году: урезание бюджетов побуждает экономить или искать новые подходы к решению своих задач. Здесь отмечу, что оцифровка в большинстве случаев жизненно необходима. Например, компании часто нужно наполнить новую, недавно внедренную систему, – поэтому большинство заказчиков не сокращает объем оцифровки, а ищет компромисса с подрядчиком в виде сокращения стоимости, разбиения работ на стадии для поэтапного финансирования и т.д.

Собственно, вариантов тут много.

 - Судя по всему, вы нашли такое компромиссное решение?

 - Нашли мы его давно, но вот технически реализовать и оформить конкретное предложение удалось только сейчас. Конечно, катализатором стала ситуация на рынке, когда добрая треть текущих заказчиков обратилась с просьбой пересмотра условий контрактов.

Дело в том, что процесс оцифровки – это конвейер, на каждом участке которого применяется свой набор технологий и программных продуктов. И если сканирование мы уже давно осуществляем на территории заказчика, к которому выезжает наша мобильная бригада, то ретроконверсия – гораздо более долгая и сложная работа. Для ее проведения мы традиционно передаем отсканированные образы в свои производственные центры, где из огромной накопленной базы выбираем оптимальные технологии для данного типа документов – от полностью ручного до полностью программного извлечения данных. Только так нам удается добиться высочайшего качества получаемого ресурса.

 - Так что же изменилось?

 - Родился формат услуги СК+. Мы научились проводить работы под ключ на территории заказчика. Это дало ряд преимуществ: меньшую стоимость за счет сокращения числа привлекаемых специалистов и транспортных расходов; оперативность благодаря применению уникальных технологий извлечения данных и максимальному сокращению ручной обработки; дополнительную безопасность информации за счет того, что документы не вывозятся из организации и обрабатываются в рамках соглашения о конфиденциальности. Полностью решение сформулировано на нашем сайте. Единственное условие – документы должны быть печатными, так как преимущества достигаются в первую очередь благодаря применению «умных» технологий извлечения данных.

 - Давайте конкретизируем. Вот шкаф с договорами. Там есть счета-фактуры и акты, к которым можно применить программы шаблонного распознавания. Но также много обычных текстовых документов. Что делать с ними, перепечатывать данные вручную?

 - В том-то и смысл услуги, что мы можем обрабатывать абсолютно любые документы на территории заказчика. Все тайны раскрывать не буду, скажу лишь, что мы также используем программы распознавания, причем 2-3 разных на каждом проекте. А вот методов автоматической классификации и извлечения данных уже более 9, применяются они во всевозможных комбинациях в зависимости от типов документов. В общем виде процесс выгладит так.

Сперва наши специалисты приезжают и оперативно сканируют все востребованные документы. Если вернуться к постановке вопроса, то для всех работ будет достаточно этой комнаты и этого переговорного стола.

Затем электронные копии документов распознаются и с помощью автоклассификации разделяются по видам и типам: счета-фактуры, товарные накладные, договоры, приказы, распоряжения, свидетельства и т.д. Также документы объединяются по признакам группы: например, договор и приложения к нему, реестр счетов и сами счета-фактуры. Для многих заказчиков этого достаточно – они получают готовые комплекты электронных копий документов с распознанным текстом и возможностью поиска информации.

Наконец, документы индексируются и загружаются в информационную систему заказчика. Может извлекаться любой согласованный набор атрибутов: от базового перечня (тип, номер, дата) до любого расширенного состава (сумма, ИНН, КПП, наименование контрагента, адреса и т.п.).

Человек участвует в процессе только на стадии верификации, проверяя качество сформированного ресурса.

 - Можете привести примеры кейсов, когда СК+ может стать действительно единственным решением задачи?

 - Скажу больше – единственным решением разных задач. В одних случаях заказчики не хотят вывозить документы; в других требуется максимально простая и недорогая оцифровка; в третьих не выгодна транспортировка; а иногда ограничения накладывают и сами документы, точнее разнообразие их типов.

Так, с помощью СК+ мы оцифровывали ПБД для одного крупного производителя углеводородов, так как по условиям контракта был запрещен вывоз документов за пределы помещений бухгалтерии.

А для департамента имущества одного крупного города СК+ применялась как наиболее выгодный способ обеспечения оперативного поиска информации и освобождения площадей от бумаги. В этом случае мы просто не стали проводить дорогостоящее индексирование каждого документа, а сформировали комплекты в электронном виде – договоры аренды и приложения к ним, приватизационные дела и пр.

И еще одна ситуация, с которой мы впервые столкнулись несколько лет назад в крупном банке. Была поставлена задача оцифровать досье юридических лиц. Как оказалось, в этом ресурсе можно встретить около 250 разных типов документов, причем только половина из них формализованные.

Мы попытались обойтись программами распознавания форм. Не получилось по двум причинам. Во-первых, стоимость разработки такого количества форм превысила смету бюджета. Во-вторых, уже при наличии 40 типов документов скорость подбора формы для одного документа снижается до 30 секунд (программы подбирают формы, накладывая их последовательно). В результате превышаются все разумные сроки проекта. Кроме того, остаются неформализованные документы. 

Именно такие задачи побудили нас развивать альтернативные, «умные» технологии извлечения данных, накапливать базу знаний и компетенции. В результате родился новый формат услуг – «СК+».

Спасибо за беседу!

Опубликовал: Александр Абрамов (info@ict-online.ru)

Тематики: ПО

Ключевые слова: ЭЛАР