INFODOCUM-2012: электронные архивы и новые технологии извлечения данных. Опыт ЭОС
Профессиональный форум INFODOCUM.ARCHIVE-2012 «Современные технологии эффективного архива», собравший более двухсот представителей органов законодательной и исполнительной власти, руководителей региональных архивов ведущих предприятий и организаций страны, состоялся в декабре прошлого года в Москве. Один из докладов представителей генерального спонсора форума, - «Электронные офисные системы» (ЭОС) был посвящен опыту организации интеллектуального электронного архива с использованием новых технологий извлечения данных на примере решения ЭОС eDocLib: «Хранение и оцифровка».
По словам руководителя направления современных ЕСМ-решений ЭОС Сергея Полтева, лавинообразный рост объемов корпоративных данных, наблюдающийся в последние несколько лет, делает задачу организации надежного хранения и эффективного, своевременного и наглядного доступа к архивной информации еще более актуальной. ЭОС на протяжении 18 лет реализует проекты по организации электронных архивов самого различного масштаба: от малых предприятий до многопрофильных холдингов. Среди его клиентов - федеральные и региональные органы власти, ведущие производственные компании и финансовые организации. В частности: Электронный архив Совета Федерации, Судебный департамент при Верховном Суде РФ, Архивная служба ОАО «Мосэнерго», банк «ДельтаКредит», банк «Петрокоммерц», ОАО «Татнефть» и другие организации. За это время компания накопила солидный опыт, отмечая существенные изменения в запросах пользователей архивных систем.
Одним из таких ключевых требований, обусловленным значительным увеличением объемов обрабатываемых и хранимых данных, - это минимизация времени и трудозатрат на загрузку данных в архив, а также обеспечение простого и удобного представления хранимых данных для пользователей. Если речь идет об оцифровке бумажного архива, то, как правило, наиболее трудоемким процессом является само сканирование. Однако, это лишь первый шаг к эффективному и удобному электронному архиву, - для последующей работы с полученными электронными образами каждый из документов необходимо снабдить определенным набором метаданных (заполнить «карточку документа» с определенным перечнем реквизитов). Именно это в дальнейшем позволит использовать различные поисковые возможности и фильтры, создавать различные наглядные представления и разграничивать права доступа для пользователей. «Но если на сканирование документа уходит не более нескольких секунд, то заполнение вручную соответствующей формы, требует как минимум нескольких минут времени. Таким образом, загрузка документов в электронный архив требует значительного времени и существенных трудозатрат, связанных в первую очередь за заполнение карточек документа. Однако подобную ситуацию можно значительно улучшить, если воспользоваться технологиями извлечения данных из неструктурированных документов. С помощью технологии Data Capture можно обеспечить автоматическое заполнение карточки реквизитов данными, извлекаемыми непосредственно из неструктурированного текста документа» - отмечает Сергей Полтев.
Времени, которое требуется для сканирования и заполнения карточки для 10 тыс. документов. Слайд из презентации Сергея Полтева, ЭОС
Еще одним важным моментом, по его словам, является соответствие возможностей архивной системы и реальных потребностей по хранению и извлечению данных. К примеру, соответствие типов документов и их реквизитного состава и необходимых на практике атрибутов для дальнейшего структурирования и обработки информации. В то же время, использование современных технологий обработки данных, позволяет обеспечить одновременно надежное хранение документов в базе данных, высокое быстродействие и возможность быстро конфигурирования атрибутного состава документа и его визуального представления в точном соответствии со спецификой документа и пожеланиями пользователей. Фактически, совместное использование гибко-настраиваемой платформы и инструмента для извлечения данных, позволяет выделить в документах значимый набор атрибутов, адаптировать архивную систему в точном соответствии с выбранным атрибутным составом и его наиболее предпочтительном визуальном представлении и организовать автоматическое заполнение карточек документов при сканировании. Это обеспечивает полное соответствие хранимых атрибутов документа потребностям пользователей и минимальное время загрузки документов в электронный архив.
Комплексное решение ЭОС eDocLib: «Хранение и оцифровка»
«Опыт внедрений разработанного нами комплексного решения на базе ЕСМ-платформы eDocLib и продукта Abbyy FlexiCapture, подтверждает, что применение перечисленных технологий позволяет значительно ускорить как процедуру загрузки информации в электронный архив, так и обеспечить быстрый и удобный доступ к хранимым в архиве данным для пользователей. Очевидно, что повсеместное увеличение объемов данных продолжится, а следовательно, - подобные решения, уже востребованные в организациях, деятельность которых связана с постоянной обработкой значительных объемов информации, получат повсеместное распространение» - отметил руководитель направления современных ЕСМ-решений ЭОС Сергей Полтев. Среди наиболее перспективных сфер использования комплексного решения ЭОС eDocLib: «Хранение и оцифровка» г-н Полтев называет банковскую отрасль, девелоперские компании, образование и производственные компании.
При этом, в банковской сфере уже имеется успешный опыт использования решения. В частности, на отраслевой конференции Docflow-2012 ведущий специалист по документообороту ИК «МИБ-Инвестиции» Вадим Савинов рассказал об опыте организации электронного архива финансовой документации с помощью решения eDocLib: «Хранение и оцифровка». По его словам, оцифровка банковской документации не является простой задачей, однако, значительную часть такого документа составляет стандартный текст, для всего остального удается выделить определенный набор значимых параметров, таких как дата, сумма, номер и т.п. При этом, извлекать из неструктурированных документов такие данные позволяет технология ABBYY FlexiCapture, которая, в свою очередь, интегрирована в решение eDocLib: «Хранение и оцифровка».
Автоматический ввод данных с технологией Data Capture в решении ЭОС eDocLib: «Хранение и оцифровка»
Ключевыми особенностями этого решения ЭОС Вадим Савинов называет легкую настройку без программирования, простоту поддержки, конструирование объектов произвольного вида, привычный интерфейс офисных приложений для пользователей, интеграцию с системами бизнес-аналитики и невысокие требования к аппаратному обеспечению. В результате внедрения решения eDocLib: «Хранение и оцифровка» в кратчайшие сроки (одна неделя) был обеспечен перевод архива в электронный вид, значительно сокращено время извлечения и необходимой обработки данных, а специалисты ИК «МИБ-Инвестиции» самостоятельно могут адаптировать решение для новых типов документов. В будущем предполагается расширение электронного хранилища в направлении постепенного перехода к «единой точке входа» для работы с информацией. Кроме того, будет автоматизированы бизнес-процессы по обработке вновь поступивших документов, возможно, будет осуществлен переход на «облачный» сервис.
Сферы наиболее перспективного использования решения ЭОС eDocLib: «Хранение и оцифровка»
«Все большее проникновение облачных сервисов и планшетных устройств будет задавать новый уровень требований к пользовательским интерфейсам в том числе и архивных приложений, и к возможностям «кастомизации» и адаптации внешнего вида приложения и логики его работы в соответствии с потребностями пользователей, а не наоборот как это происходило ранее. Именно на эти тенденции мы стараемся ориентироваться при разработке наших решений для электронных архивов и опыт наших клиентов подтверждает правильность выбранного направления» - отметил в заключении своего выступления руководитель направления современных ЕСМ-решений ЭОС Сергей Полтев.
Опубликовал: Сергей Мальцев (info@ict-online.ru)
Тематики: Интеграция, Оборудование, ПО
Ключевые слова: электронный документооборот, ЭОС, хранение данных, eDocLib