ABBYY объявляет итоги волонтерского проекта «Открой историю Большого»
В электронной базе музея Большого театра собраны ценные данные о более чем 28 тысячах опер, 18 тысячах балетов и 5 тысячах концертов
Большой театр и компания ABBYY (при участии КАМИС) завершили масштабный волонтерский проект «Открой историю Большого» (openbolshoi.ru). В практике российских музыкальных театров и музеев проект такого масштаба реализован впервые. Искусственный интеллект ABBYY и более 7800 волонтеров помогли оцифровать, извлечь и систематизировать информацию из 48 000 афиш, 120 000 программок и 100 000 фотографий коллекции музея Большого театра. Ценные данные уже загружены в электронную базу музея Большого театра, разработанную компанией КАМИС. Сотрудникам музея предстоит проанализировать весь массив данных и опубликовать на сайте электронного архива театра, чтобы уникальная информация стала доступна каждому.
Целью проекта «Открой историю Большого» было оцифровать и упорядочить информацию из коллекции бумажных программок и фотографий для электронной базы данных театра. Сначала все исторические документы были отсканированы и распознаны программой ABBYY FineReader. Затем интеллектуальные технологии ABBYY извлекли из документов данные: названия спектаклей, имена артистов, дирижеров и пр.
Своим успехом проект обязан волонтерам. «Открой историю Большого» объединил неравнодушных людей из более 60 стран мира: США, Австралии, Бразилии, Индии, Китая, многих стран Европы и, конечно, России. Именно они тщательно проверяли и дополняли информацию на каждом этапе проекта, чтобы исключить возможные ошибки и максимально приблизить электронные версии документов к оригиналу. Также волонтерам был полностью отдан третий этап проекта – рубрикация исторических фотографий. Участники внесли в электронную базу рукописные тексты, написанные на оборотах изображений. Благодаря усилиям волонтеров, люди со всего мира смогут увидеть самые яркие моменты выступлений Майи Плисецкой, Галины Улановой, Федора Шаляпина и еще более 5 тыс. артистов театра.
В заключительной части проекта специалисты ABBYY систематизировали данные в соответствии с требованиями сотрудников музея. Они настроили автоматический перевод текстов с дореволюционной орфографией на современный русский язык, заполнили пропущенные поля, исправили опечатки, привели цифры и тексты к единому формату. Вся информация из архивов театра о 54 тысячах спектаклей и 75 тысячах персон была загружена в базу данных, разработанную компанией КАМИС. По мере проверки специалистами музея Большого театра, данные публикуются на специально разработанном поисковом разделе театрального сайта.
«Проделана огромная работа, которую едва ли удалось бы осуществить в столь сжатый срок без новейших технологических разработок компании ABBYY и без человеческого фактора – без любви к Большому театру тысяч волонтеров из самых разных стран, – отмечает Владимир Урин, генеральный директор Большого театра. – В эти летние дни, когда мир как будто замер, и Большой театр вынуждено не показывает спектакли уже несколько месяцев, мне особенно приятно поблагодарить наших партнёров – компанию ABBYY и наших верных зрителей, потративших три года на то, чтобы осуществить уникальный проект по оцифровке архивов Большого театра. Тысячи фотографий, афиш, ежедневных программ наших спектаклей в самое ближайшее время станут доступными не только специалистам, историкам театра, которые приходят работать в музей».
«ABBYY создает технологии искусственного интеллекта, которые помогают превращать разрозненные данные в полезную информацию. Мы особенно ценим проекты, в которых компания не только решает повседневные задачи людей, но и помогает расширять кругозор, сохранять культуру и историю страны, получать вдохновение и новые идеи для работы и жизни. Проектов, подобных «Открой историю Большого», в мире пока немного. Но я уверен, что с развитием технологий обработки естественного языка мы сможем решать все более сложные и масштабные задачи в разных странах мира», – комментирует Дмитрий Шушкин, генеральный директор ABBYY Россия.
«Команда ABBYY и волонтеров проделала огромную и очень важную работу. Были отсканированы несколько тысяч программ спектаклей Большого театра с 1901 года, а затем обработаны таким образом, что в настоящий момент мы можем среди тысяч образов найти нужную программку любого спектакля и концерта, проходящих на нашей сцене, посмотреть, когда и с какими партнерами выступал тот или иной артист, какие дирижеры, режиссеры, художники участвовали в постановке спектаклей. Кроме программок были обработаны и несколько тысяч афиш спектаклей, отсканированных ранее, причем временной промежуток здесь был еще больше: с 1858 года, – говорит Лидия Харина, директор музея Большого театра. – Это огромный и очень интересный архив, который теперь доступен в электронном виде. В настоящий момент им активно пользуются все сотрудники Музея и Большого театра, а также исследователи, приходящие к нам работать. Мы надеемся, что вскоре он будет доступен и широкой аудитории, сотрудники Музея проверяют весь массив внесенной информации, систематизируют его определенным образом, добавляют иллюстративный материал».
В ходе проекта «Открой историю Большого» волонтеры помогли собрать интересную статистику об истории главного театра страны. Так, в XIX веке на сцене около 450 раз ставили оперу «Жизнь за царя». В ХХ веке почти 60 лет одной из наиболее популярных постановок театра оставалась опера «Евгений Онегин». Неподражаемая Майя Плисецкая исполняла роли Одетты и Одиллии в балете «Лебединое озеро» 175 раз, а знаменитый лирический тенор Леонид Собинов пел арию Ленского не менее 86 раз. Были и другие находки, связанные с жизнью театра и его зрителей. Например, участники обнаружили на страницах программок необычные постановки, такие как опера, написанная императрицей Екатериной II, водевиль, переведенный поэтом Николаем Некрасовым, экспериментальные балеты 30-х годов XX века. В программках публиковали не только информацию об артистах, но и рекламу и даже объявления о забытых вещах.
Тематики: Интеграция
Ключевые слова: ABBYY, Электронные архивы