Автономное учреждение культуры Воронежской области «Государственная инспекция историко-культурного наследия» (АУК ВО ГИИКН) перевела в цифровой формат архив исторических документов по объектам культурного наследия (ОКН) города Воронежа и двух районов области.
В аналоговом виде сведения собирали с 1978 года. Объём оцифровки составил 305 000 страниц в формате A4. Для распознавания документов применили российскую платформу Beorg Smart Vision на базе искусственного интеллекта и краудсорсинга. Разработчик технологии – компания «Биорг», резидент ИТ-кластера «Сколково».
Сотрудники инспекции используют электронные данные, чтобы оперативно решать научно-исследовательские задачи в интересах государственных органов охраны ОКН. Например, готовят проектную документацию, в том числе по территориальным границам и предмету охраны ОКН. Основная цель работы — сохранить объект в неизменном виде для будущих поколений.
«В феврале 2024 года президент поручил сформировать долгосрочную программу сохранения объектов культурного наследия. В послании Федеральному собранию он отметил, что «надо устранить избыточные, противоречивые требования, из-за которых памятник порой разрушается на глазах, а формально, по закону, оперативно принять меры по его спасению невозможно». Цифровые данные помогут сократить бюрократические процедуры. Сэкономленное время используют для работ по сохранению и восстановлению ОКН. Объектами можно будет эффективнее управлять с точки зрения реализации их инвестиционного потенциала, привлечения дополнительных денег в экономику регионов», — отмечает директор «Биорг» по работе с органами государственной власти Илья Веригин.
На основе оцифрованной информации компания «Биорг» подготовила структурированную взаимосвязанную базу данных. В результате только на процессе поиска необходимых исторических справок и исторических паспортов можно сэкономить как 30 минут, так и 4-5 часов. Работа с цифровыми копиями позволяет лучше сохранить оригинальные исторические документы.
«Простой пример оптимизации временных затрат: недавно государственный орган охраны Воронежской области переехал в другую часть города. Между тем, его сотрудникам нужно регулярно иметь доступ к документам. Благодаря оцифровке данных им не надо ехать через полгорода, чтобы искать нужные папки в архиве. Доступ к данным осуществляется в несколько простых кликов. Информация в электронном виде позволяет эффективно работать в условиях небольшого штата сотрудников, концентрироваться на исследовательской работе, а не на поиске документов», — комментирует начальник АУК ВО ГИИКН Андрей Домбровский.
В процессе оцифровки искусственный интеллект (ИИ) извлек из документов необходимые атрибуты, распознал печатный текст, специальные отметки, в том числе сделанные от руки. Система проверила комплектность и упорядоченность документов. Разрозненные многостраничные документы ИИ собрал в единый файл. При этом система сохранила порядок следования разделов документа, номера и число страниц в каждом разделе и в целом по документу. Распознанные данные были автоматически нормализованы по контексту и справочникам.
На базе платформы «Биорг» провели работу по распознаванию рукописного текста, печатей и подписей, где нейросети обычно испытывают трудности. ИИ улучшал качество изображения, удалял или нормализовал фон, устранял размытие текста и т.д. Через краудсорсинговый модуль платформы «Биорг» провели контроль качества распознавания. Операторы, трудоустроенные на платформе, при необходимости корректировали параметры, где нейросеть могла допустить ошибку распознавания.
Искусственный интеллект — сквозная технология, входящая в перечень приоритетных направлений научно-технологического развития России, утвержденный указом президента РФ от 18 июня 2024 года.