Группа ЦРТ представила визуально-языковую модель, которая может более чем на 30% повысить эффективность управления в городах

22.04.2026

Группа компаний ЦРТ представила «Визирь.VLM» (Vision Language Model, визуально-языковая модель) — решение, которое объединяет возможности компьютерного зрения и обработки естественного языка. Новое решение создано на базе биометрической системы компьютерного зрения «Визирь» с поддержкой большой языковой модели. «Визирь.VLM» обрабатывает визуальные данные (изображения, видео) и текстовую информацию в едином контуре, может существенно оптимизировать работу крупного бизнеса и госсектора. Демонстрация первой версии нового решения состоялась на выставке Securika, которая проходит в Москве.

CRT-270x122.png

Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ: «Биометрическая система компьютерного зрения „Визирь“ удерживает более 65% российского рынка видеоаналитики, используется более чем на 400 транспортных объектах, 28 стадионах и ледовых аренах, в 30 городах страны работает в составе АПК „Безопасный город“. Такой опыт и экспертиза позволили команде ЦРТ ответить на новый запрос рынка — объединить возможности видеоаналитики с большой языковой моделью и представить „Визирь.VLM“. Новое решение может помочь не только обрабатывать кадры с помощью видеоаналитики, „видеть“ и понимать увиденное, выстраивая смысловые связи, но и давать развернутые ответы о происходящем, подобно человеку. Все это позволяет строить универсальную аналитику — от безопасности до проактивного управления городом. Наиболее актуальные сценарии — мониторинг благоустройства и контроль ЖКХ. Визуально-языковая модель может анализировать причины инцидентов и предлагать решения, экономя более 90% времени операторов, повышая эффективность управления городом более чем на 30%».

Применение видеомониторинга в городах позволяет контролировать доступ на объекты, фиксировать нарушение правопорядка, проводить аналитику, изучать пассажиропоток для улучшения работы транспорта и т. д. При этом текущее состояние городской и региональных систем видеомониторинга предполагает высокую степень участия человека: ручную обработку и анализ массива данных, поиск и реагирование на правонарушения.

«Визирь.VLM» не просто фиксирует события на видео, но и предлагает решения, при этом позволяет задавать любые вопросы на естественном языке, анализирует поведение и предоставляет готовые ответы на вопросы там, где раньше требовалась ручная работа оператора.

К примеру, можно попросить найти интересующее событие, оценить прогресс выполнения задачи, сформировать статистику по объектам в кадре, проанализировать перемещения, проверить массив видео на наличие нарушений в архиве, и при этом все результаты могут быть преобразованы в простой и понятный отчет, что может помочь экономить более 90% времени операторов мониторинговых центров, существенно оптимизируя ресурсы для эффективного управления территорией.



Компания-источник:  Группа компаний ЦРТ