Deckhouse, разработчик продуктов для построения надёжной корпоративной инфраструктуры, объявил о запуске распределённого синтетического мониторинга доступности веб-сервисов в платформе наблюдаемости Deckhouse Observability Platform (DOP). Теперь команды разработки и эксплуатации могут отслеживать фактическую доступность веб-сервисов «снаружи» c помощью агентов в разных географических зонах, получать объективные данные для расчёта SLA и реагировать на инциденты до того, как о них сообщат пользователи.

Deckhouse Observability Platform — централизованная платформа наблюдаемости для гибридной и Kubernetes-инфраструктуры. Решение объединяет метрики, логи и трассировки приложений, физических серверов, виртуальных машин, сетей и Kubernetes-кластеров в одной системе.
Веб-мониторинг позволяет выполнить активные внешние и внутренее проверки с помощью агентов, установленных на внешних точках наблюдения. Система выполняет HTTP(S)-запросы с валидацией кодов ответа, проверяет содержимое ответов, сетевую связность, наличие DNS-записей, доступность TCP-портов и отслеживает срок действия SSL-сертификатов. Проверки запускаются из разных локаций, что позволяет видеть региональные различия в доступности: например, сервис может быть доступен в Центральном регионе, но недоступен на Северо-Западе.
«Мы добавили в DOP распределённый синтетический мониторинг веб-сервисов, чтобы команды видели фактическую доступность, а не узнавали о проблемах от пользователей. Проверки с помощью агентов дают понятный сигнал, где именно произошла деградация, а графики и алерты помогают быстрее реагировать и устранять инциденты. Результаты проверок можно использовать как объективную базу для расчёта SLA и подтверждения доступности сервисов», — отметил Владимир Гурьянов, технический директор продукта Deckhouse Observability Platform, компания «Флант»
Распределённый синтетический мониторинг закрывает ряд критических проблем эксплуатации. Часто внешние пользователи сталкиваются с недоступностью сервиса, в то время как внутренние метрики показывают нормальную работу. Без внешних проверок сложно определить, является ли проблема глобальной или затрагивает только одну зону. Новая функция DOP позволяет обнаруживать инциденты проактивно, а не по жалобам пользователей и быстро классифицировать тип проблемы: сетевая связность, доступность эндпоинта или конфигурацию сертификата.
Возврат к списку