Новые технологии помогают искать героев войны

04.09.2013

Информация о погибших и пропавших без вести в годы Второй мировой войны не только не теряет значимости сегодня, но приобретает все большую актуальность. Этому способствуют и открытость сегодняшних архивов, и уникальные работы по формированию интернет-ресурсов, позволяющих вести поиск архивных документов. Среди них — обобщенный банк данных (ОБД) “Мемориал” и “Подвиг народа в Великой Отечественной войне 1941—1945 гг.”, содержащий архивные документы о погибших и пропавших без вести, а также наградные дела периода Великой Отечественной войны. С помощью этих порталов русскоязычные пользователи Интернета могут найти информацию и документы о судьбах своих близких — участников войны.

Работы по проекту начались в 2007 г., и в настоящее время завершён первый его этап. “Основными задачами, которые мы ставили перед собой, начиная эту работу, было установление забытых имен, судеб защитников отечества, обобщение информации о наградах, патриотическое воспитание молодежи. С этой целью обработаны материалы Центрального архива Министерства обороны (ЦАМО), Военно-мемориального центра Министерства обороны (ВМЦ), Центрального военно-морского архива (ЦВМА), Российского государственного военного архива (РГВА), Государственного архива РФ (ГАРФ). Всего около 30,4 млн. записей, данные о погибших и пропавших без вести. Установлены судьбы более чем 760 тыс. героев войны, а также свыше 2,5 млн. мест захоронения солдат и офицеров. На сайте проекта содержится 12,67 млн. описаний о ходе крупнейших военных операций, обработано 22 млн. карточек наградной картотеки”, — рассказал Павел Плотников, директор по маркетингу компании ЭЛАР, исполнителя проекта.

По словам Виктора Тумаркина, руководителя производственного центра корпорации ЭЛАР, технического директора проектов ОБД “Мемориал” и “Подвиг народа…”, эти интернет-ресурсы интересны и уникальны тем, что в них содержатся документы из разных источников, что позволило прояснить неизвестные ранее факты жизни героев войны. “Донесения о потерях, паспорта современных захоронений, трофейные документы о военнопленных прояснили очень многие судьбы”, — рассказал он.

Перед стартом проекта потребовалась серьезная и основательная первоначальная подготовка к работе с документами. Это не просто сложно сшитые и ветхие документы, многие из них находятся на грани разрушения. Кроме того, военные архивы — это большой массив рукописных документов, которые формировались в окопах, во время военных действий. Зачастую информация об одном и том же человеке представлена противоречиво. По-разному указаны имя, фамилия, отчество, год рождения.

“Первое, что мы учли, создавая ОБД “Мемориал”, было то, что работать с этим ресурсом могут совершенно разные люди: и те, кто имеет большой опыт работы с компьютером, навыки поиска информации в Сети, и те, кто никогда туда не обращался. Имеется как простой, так и расширенный поиск, в котором можно задавать уточняющую информацию. Пользователи, зарегистрировавшись на сайте, могут также внести любые уточнения. Это может быть текст, фотография, ссылки на сайты, где опубликованы вновь открывшиеся обстоятельства о том или ином воине. То есть данная опция позволяет получить о человеке много новой информации”, — уточнил Виктор Тумаркин.

Процесс создания ресурса был разделен на четыре этапа: экспертиза, которая предполагает отбор первоначального массива архивных документов, их изучение; оцифровка; создание поисковой базы; загрузка на сайт. На каждом этапе предусматривался контроль качества заполнения документов.

“Оцифровывали документы непосредственно в архивах. Затем создавали поисковую базу. Представьте объем: 10 млн. документов. Задействовали более сотни сканеров на участках сканирования в разных архивах. Была разработана технологическая цепочка: движение документа от сканера в базу данных, — пояснил Павел Плотников. — Очень часто спрашивают, почему эти ресурсы не были созданы раньше. Всё просто. Прочитать миллионы бумажных документов и сравнить информацию каждого из них практически невозможно. А перевод их в электронный вид позволяет анализировать, сравнивать информацию, взятую из разных источников. Но самым сложным в этой работе является извлечение данных”.

По его словам, было задействовано более 5 тыс. человек по всей России. В Екатеринбурге, Самаре, Зеленограде созданы центры, где люди разбирали рукописный текст и формировали БД. Была разработана специальная программа, которая контролировала этот процесс, сделан специальный сканер, работающий с большой скоростью. “Мало просто извлечь информацию, важно, чтобы она была абсолютно верной. Поэтому применялись очень сложные технологии, которые позволяли избежать ошибок. Например, двойной ввод. То есть информация извлекалась дважды, причем разными людьми. Это нужно для того, чтобы обеспечить соответствие извлеченной информации подлинным документам”, — отметил г-н Плотников.

В настоящее время существуют списки найденных воинов, которые в ходе поисковых работ регулярно пополняются и издаются в виде книги “Имена из солдатских медальонов”. Эта информация также задействована в ОБД “Мемориал”. Уже введено более 42 тыс. паспортов захоронений, и, по словам Виктора Тумаркина, ресурс в ближайшее время будет дополнен новыми данными.

Не меньший интерес вызывает интернет-ресурс “Подвиг народа в Великой Отечественной войне 1941—1945 гг.”, наполняемый документами о ходе и итогах основных боевых операций, подвигах и наградах всех воинов Великой Отечественной войны. Виктор Тумаркин рассказал, что нередко в обращениях пользователей этого ресурса звучит фраза о том, что “он никогда не говорил нам о своих наградах и не любил рассказывать о войне, мы только сейчас узнаем, каким героем он был и какие подвиги совершил”.

“Именно поэтому сайт оказался так востребован. Обработана учетная наградная картотека ЦАМО. Однако архив разрешил публиковать не всю информацию из картотеки. Были обработаны только номерные награды, то есть ордена и две медали: “За отвагу” и “За боевые заслуги”. Но есть и другие медали, которые еще не учтены. Дело в том, что и здесь обработаны только компактные массивы документов о награждении, которые имеются в наградном отделе ЦАМО и ЦВМА. И это, к сожалению, не все. Предстоит еще более сложная дальнейшая обработка. И эту работу надо продолжать”, — считает г-н Тумаркин.

Оба интернет-ресурса стали одним из основных источников информации для нового социального проекта компании ЭЛАР — “Календарь Победы”. Это описания малоизвестных, но значимых сражений, интересные статьи из фронтовых газет, рассказы о подвигах и судьбах отдельных людей, военный фольклор, фотографии, плакаты, рисунки из газет.

По словам представителей ЭЛАР, несмотря на довольно большой массив учтенных на сайтах ОБД “Мемориал” и “Подвиг народа…” документов, обращения граждан о том, что нет той или иной информации, поступают весьма часто. К сожалению, представлены далеко не все имеющиеся в архивах данные. Это обстоятельство объясняется тем, что не все документы военных лет хранятся в архивах Министерства обороны. Существуют архивы призывных пунктов, архивы регионов, которые не были задействованы в проектах. По словам Павла Плотникова, это следующий этап работы: “Необходимо и дальше обобщать и сравнивать информацию из разных источников. Сейчас есть инструментарий, который позволяет это делать. Вся информация о Второй мировой войне должна быть полной и доступной всем гражданам. Еще много документов, которые предстоит оцифровать. Те же самые рукописные документы, сводки, карты… Это всё впереди”.

Опубликовал: Александр Абрамов (info@ict-online.ru)

Тематики: Интеграция, ПО

Ключевые слова: информационные технологии