Автоматизированное устранение неисправностей с помощью интеграции Dynatrace с Red Hat Ansible Automation

Содержание статьи:
● Red Hat Ansible меняет правила игры в области автоматизации операционных процессов в IT● Попробуйте Dynatrace. Получите новые возможности● Как это работает?

Red Hat Ansible Automation Platform вместе с Dynatrace Software Intelligence Platform позволяет автоматически устранять проблемы еще до возникновения, что значительно упрощает операционные процессы IT-команд.
Ранее понятие автоматизации в IT было несколько иным, чем сейчас — оно включало в себя гораздо меньший объем задач и процессов и совсем другой, не столь широкий список результатов. Иными словами, тогда с помощью автоматизации нельзя было добиться того, чего можно добиться сейчас.
Будь это развертывание новой системы или выпуск обновления, иногда нужно сотни раз тестировать сценарии, чтобы найти все нюансы и мелкие неисправности и устранить их.Позже появились специализированные решения по проведению автоматизации. Это означало, что индустрия точно движется в сторону автоматизации, хотя этот процесс все еще требует написания кода.

Red Hat Ansible меняет правила игры в области автоматизации операционных процессов в IT

Ansible ворвался в сферу автоматизации и вдруг все сценарии Perl стали устаревшими, а вместо них появился модульный подход Ansible, позволявший с помощью нескольких десятков строк YAML делать то, что раньше требовало сотни строк кода.
Изменения в автоматизации происходили постепенно. С развитием Ansible в нем появился графический интерфейс и возможность интегрироваться через API. И тут началось – не только человек мог запустить автоматизированный процесс, но и машина при выполнении определенных условий. Реализовывалось все это с помощью RESTful API.

Попробуйте Dynatrace. Получите новые возможности

Далее мы на мгновение оставим Ansible и поговорим о Dynatrace. 
Dynatrace – это платформа для детального наблюдения и мониторинга работы IT-сервисов. Решений класса APM (Application Performance Monitoring) на рынке просто огромное количество, поэтому многие специалисты не понимают до конца преимущества Dynatrace перед другими инструментами.
Dynatrace использует детерминированный искусственный интеллект, позволяющий не просто выполнять корреляцию событий между собой, а гораздо глубже анализировать среду, чтобы прогнозировать проблемы до их возникновения.

Illustration

Вместе с Red Hat Ansible Automation Platform, детерминированный ИИ от Dynatrace образует решение, способное самостоятельно выявлять и исправлять инциденты без реактивного вмешательства IT-специалистов.
Для этого инфраструктура и программы развертываются с помощью Ansible для получения более согласованной и предполагаемой среды. Для взаимодействия с искусственным интеллектом Dynatrace (которого, кстати, зовут Davis), у Ansible имеется небольшой фрагмент YAML, с помощью которого и осуществляется автоматизированное исправление, когда это необходимо.

Illustration

Как это работает?

Сначала в игру вступает Dynatrace…

Большинство систем мониторинга и исправления представляют собой набор заранее запрограммированных специалистом политик.
Например:

«Если APPSERVER123 видит слово «ошибка» в файле журнала более 10 раз в минуту, инициировать проблему».
или
«Проверяйте APPSERVER456 раз в минуту. Если он соответствует коду ошибки HTTP в диапазоне 4xx или 5xx, извлеките его из пула балансировщика нагрузки и попросите системного администратора вручную проверить его на наличие проблем».

Это рабочий подход, который может приносить пользу. Однако его проблема в том, что он слишком зависим от человека и его понимания того, что является проблемой. Специалист не может предсказать абсолютно все возможные проблемы и просчитать совокупность событий, которые бы точно на них указывали, как в примере выше.
Dynatrace может оценить систему и решить, какие конкретные файлы, службы, порты и события требуют повышенного внимания. К тому же, эта проверка не настраивается вручную и не основывается только на понятиях «что-то работает/что-то не работает» — аномалии могут отслеживаться даже по признакам, которые не приводят к отказу какого-либо процесса прямо сейчас. Но система понимает, что все это может привести к проблеме в будущем. 
Если провести небольшую аналогию сравнения, то традиционные решения мониторинга подскажут, где на корабле произошла пробоина и откуда в трюм затекает вода. Это поможет не искать ее по всему кораблю, а сразу принять меры. Dynatrace в таком случае показывал бы, где на судне падает плотность обшивки и где пробоина может произойти уже скоро. Разница и преимущества очевидны.

…а затем Ansible завершает дело

Когда Dynatrace обнаружил аномалию, ее тип и уровень опасности, он начинает использовать Ansible Playbook, по которому развертывалась служба или система, в которой найдена аномалия. Ansible Playbook использовал известное ему желаемое состояние при развертывании и может «не понимать» наличие сбоя сам по себе, но это ему подсказывает Dynatrace. Playbook умеет взаимодействовать с балансировщиками нагрузки, зависимыми базами данных, серверами приложений. Посредством этого он инициирует исправление ситуации согласно желаемому уровню взаимодействия клиента с приложением, а не только по критерию «отвечает/не отвечает».
То есть, например, повышенное время отклика сервиса также может быть идентифицировано и исправлено с помощью Ansible и Dynatrace, хотя само приложение при этом было доступно.

Но это еще не все, поскольку Dynatrace не успокоится даже после исправления, а в дальнейшем будет отслеживать атрибуты прошлой проблемы, чтобы она не повторилась. Когда он убедится, что все хорошо, то пришлет к Ansible всю подробную информацию об исправлении.

В конце концов система отправит уведомление: администратор проснется утром и увидит хорошую новость «Dynatrace и Ansible обнаружили и исправили аномалию… пока вы спали».

Узнайте больше про Dynatrace

Illustration

2 года с Dynatrace - полет нормальный. Опыт OTP Bank Ukraine

Как устроен IT-мониторинг: о задачах, проблемах, подрядчиках, плохом коде, мониторинге, новых технологиях и "Кровавом enterprise" на практике от Артема Логвиненко, Head Of IT Operations Department, OTP Bank.

Illustration

Автоматизация рутины в ИТ с помощью AI

В переведенном на русский язык руководстве рассмотрены вопросы обнаружения и автоисправления ошибок, поиска первопричин с помощью AI, комплексного мониторинга и автоматизации повторяющихся процессов.

Illustration

Мониторинг Dynatrace в Kapital Bank: история успеха

Запись вебинара о том, как крупнейший банк Азербайджана реализовалмониторинг сложных приложений на базе Dynatrace.

Illustration

12-й раз подряд Лидер Gartner Magic Quadrant for APM & Observability 2022

Платформа Dynatrace является решением, которое дает наиболее исчерпывающую информацию о производительности в гибридной инфраструктуре.
Аналитики Gartner® в этом году выделили следующие конкурентные преимущества Dynatrace:● Мощная аналитика на базе искусственного интеллекта на уровне кода● Объединение Application Monitoring и Application Security● Уникальная архитектура и простота развертывания Dynatrace OneAgent

Испытайте пробную версию в своей инфраструктуре

● 15 дней абсолютно бесплатно● Не нужно вводить данные карты ● Установите и начните использовать менее чем через 5 минут