Стаття

Від observability до дій:

автоматизація з Dynatrace

  • Illustration

    Автор: Yevhenii Volkohon, Service Engineer, BAKOTECH

Сучасні ІТ-середовища є надзвичайно складними. Мультихмара, мікросервіси та розподілені архітектури генерують величезні обсяги логів, метрик, трасувань та подій безпеки — набагато більше, ніж може обробити традиційна операційна діяльність.
Фактично, 88% компаній повідомляють про зростання складності систем, а 86% стверджують, що хмарні стеки (cloud-native stacks) виробляють більше даних, ніж можуть опрацювати люди [1]. На практиці команди часто «тонуть» у сповіщеннях та усуненні несправностей, що уповільнює процес реагування та стримує інновації.

Ключове рішення полягає в тісному поєднанні observability з автоматизацією. Як зазначає Dynatrace, узгодження цих двох компонентів дозволяє системам «чітко бачити, впевнено ухвалювати рішення та діяти автономно» [2]. Іншими словами, платформа Dynatrace на основі штучного інтелекту перетворює телеметрію на цінні дані, а потім передає ці відповіді в автоматизовані робочі процеси — замикаючи цикл між виявленням та виправленням. 
Пропоную розібратись детальніше. 

Чому автоматизація важлива для сучасних середовищ

Покладатися лише на ручні процеси більше неможливо. Зверніть увагу на факти: хмарні архітектури охоплюють десятки технологій, і 88% організацій заявляють, що складність їхніх стеків зросла минулого року [1]. Середньостатистичне підприємство використовує близько 10 різних інструментів моніторингу, що додає командам фрагментації та виснажливої роботи [3].
Згідно з глобальним опитуванням, 81% технологічних лідерів визнає, що ручний аналіз логів і застарілий моніторинг «не встигають за темпами змін у їхньому технологічному стеку та за обсягами даних» [4]. Команди витрачають багато часу на роботу з інформаційними панелями й тикетами, тож від цього страждають інновації. Ці чинники тиску — перевантаження даними, швидкі зміни та людські обмеження — пояснюють, чому 72% організацій впроваджують автоматизацію на основі ШІ (AI-driven automation) для відновлення контролю [5][6]. Простіше кажучи, автоматизація є обов'язковою: вона дозволяє ІТ-відділу масштабуватися відповідно до потреб бізнесу.
Серед ключових причин:

    Перевантаження даними. Обсяг телеметрії стрімко зростає, створюючи надмірне навантаження на команди. 86% технічних лідерів кажуть, що хмарні стеки виробляють дані, які «перевищують можливості людей щодо керування ними» [7]. Тисячі сповіщень і логів надходять безперервно, створюючи шум і втому від них. 

    Зростання складності. Сучасні системи працюють у багатохмарних та контейнеризованих середовищах. За умов, коли 51% організацій очікує подальшого зростання складності, визначення першопричин інцидентів без застосування ШІ стає майже неможливим [1]. 

    Розповсюдження інструментів. Оперування численними інструментами моніторингу та безпеки (в середньому 10) додає плутанини. 85% лідерів погоджуються, що збільшення кількості інформаційних панелей лише підвищує накладні витрати на керування [3]. 

    «Вузькі місця», повʼязані з мануальною роботою. 81% компаній повідомляють, що аналітика, створена вручну, та застарілі системи керування продуктивністю застосунків (APM) просто не встигають за темпом [4]. SRE-інженери втрачають години на підготовку даних та налаштування інформаційних панелей, які можна було б витратити на розробку функцій. 

Ці проблеми роблять автоматизацію життєво необхідною. Observability на основі ШІ гарантує, що команди отримують правильні відповіді в контексті. Двигуни автоматизації потім впроваджують виправлення зі швидкістю машини. У поєднанні вони перетворюють ІТ-діяльність із реактивного «гасіння пожеж» на проактивні операції із замкнутим циклом [6][8]. 

Переваги Dynatrace SaaS та AutomationEngine

Платформа Dynatrace на основі штучного інтелекту розроблена саме для цієї ери автоматизованих операцій. Як повністю кероване SaaS-рішення (Software as a Service), Dynatrace збирає всі ваші дані observability та безпеки в єдине, насичене контекстом середовище. Останні інновації платформи — Grail, AppEngine та AutomationEngine — надають рішенню Dynatrace SaaS «надпотужну» здатність надавати відповіді та керувати автоматизацією на основі ваших даних [9]. Результат простий: запобігати проблемам, автоматизувати робочі процеси та швидше надавати краще програмне забезпечення [10].

Серед ключових переваг:

    Інсайти та дії на основі ШІ. Причинно-наслідковий ШІ від Dynatrace, відомий як Davis, аналізує телеметрію, щоб точно визначити першопричини (наприклад, сервіс, реліз коду або процес, що спричинив проблему). Ці точні відповіді стають тригерами для AutomationEngine. За словами спеціалістів Dynatrace, ви можете «перетворити точні відповіді на інтелектуальні, розширювані засоби автоматизації, які звільняють час для інновацій» [11]. Наприклад, сповіщення про збій сервісу, збагачене повним контекстом стека викликів, може автоматично запустити сценарій виправлення або робочий процес тикетів. 

    Створення робочих процесів без коду або з мінімальним кодом. AutomationEngine дозволяє командам графічно створювати робочі процеси або визначати їх як код. Ви можете перетягувати завдання (запити, сповіщення, виклики API тощо) та пов’язувати їх із тригерами (сповіщення, розклади, REST-виклики) [12]. Попередньо визначені дії охоплюють типові операції (такі як перезапуск сервісів, масштабування інфраструктури або створення тикетів), щоб командам не доводилося починати з нуля. Ця візуальна, «керована відповідями» модель означає, що DevOps та SRE-інженери можуть автоматизувати процеси без написання громіздких сценаріїв, прискорюючи розгортання. 

    Широка інтеграція та масштабованість. Як SaaS-рішення, Dynatrace миттєво масштабується для обробки величезних обсягів даних, тому автоматизація надійно працює в масштабах хмари. Крім того, AutomationEngine поставляється із захищеними інтеграціями в рамках всієї вашої екосистеми [13]. Наприклад, він може двонаправлено підʼєднуватися до ITSM-систем, контейнерних платформ або користувацьких API. Таким чином, виявлена аномалія може автоматично відкрити інцидент у ServiceNow або запустити горизонтальне масштабування Kubernetes — і все в контексті. Це дозволяє уникнути «інтеграційної мороки» та дає командам можливість розумніше використовувати свої наявні інструменти. 

На практиці такі можливості приводять до величезної економії часу. Як зазначає один користувач Dynatrace, поєднання AIOps від Dynatrace та low-code автоматизації «спрощує автоматизацію завдань, які колись вимагали участі інженерів» [14]. Використовуючи Dynatrace SaaS, організації об’єднують моніторинг, ШІ та автоматизовані робочі процеси на одній платформі, усуваючи розрізненість та ручні передавання. 

Реальні сценарії використання 

Платформа Dynatrace пропонує багато готових (out-of-the-box) варіантів використання, які демонструють автоматизацію, керовану observability. Ось кілька ілюстративних прикладів:

    Розумна маршрутизація сповіщень та вразливостей. Dynatrace автоматично збагачує проблеми точним контекстом (код, топологія сервісу, вплив на бізнес), а потім використовує метадані про власника, щоб маршрутизувати сповіщення. Робочі процеси гарантують, що кожне сповіщення про проблему або вразливість потрапляє безпосередньо до потрібного інженера. Наприклад, коли виходить з ладу критичний процес Apache або виявляється нова вразливість, Dynatrace генерує сповіщення, насичене контекстом, і «ескалує [його] до потрібного власника для швидкого вирішення» [15]. Така цільова маршрутизація долає втому від сповіщень: потрібна людина миттєво бачить потрібну інформацію. 

    Автоматизовані “quality gates” CI/CD. Інтегруючись у конвеєри релізу, Dynatrace забезпечує примусове автоматизоване проведення перевірок якості та безпеки для кожної збірки. AutomationEngine може автоматично оцінювати нове розгортання на відповідність цілям рівня обслуговування (показники продуктивності, частота помилок) та відомим вразливостям безпеки. Якщо реліз не проходить ці перевірки, конвеєр зупиняється або виконується відкат. За визначенням Dynatrace, «кожен push автоматично проходить через ворота якості та безпеки, що приводить до високоякісних, безпечних та надійних релізів» [16]. Це гарантує, що у виробництво потрапляє лише безпечний та продуктивний код. 

    Прогнозоване автомасштабування. Dynatrace використовує ШІ для прогнозування вузьких місць ресурсів до того, як вони виникнуть. Наприклад, робочий процес може запустити ШІ Davis для прогнозування вичерпання ресурсів ЦП або пам’яті (CPU or memory exhaustion) у розгортанні Kubernetes, а потім автоматично скоригувати його репліки або ліміти ресурсів. Як пояснює Dynatrace, ви можете «прогнозувати дефіцит ресурсів і автоматично відкривати запити на масштабування застосунків» [17]. Це проактивне масштабування мінімізує час простою та оптимізує витрати, додаючи потужності саме тоді, коли вона необхідна. 

Інші варіанти використання (такі як автоматизоване виправлення інцидентів, оптимізація хмарних витрат або розгортання самообслуговування) можуть бути реалізовані аналогічно — і всі вони працюють на тій самій моделі даних Dynatrace та робочих процесах AutomationEngine. 

Висновок

У сучасному стрімкому світі самого лише observability недостатньо — потрібна автоматизація, керована observability.

Dynatrace SaaS тісно поєднує ці два елементи, забезпечуючи зворотний зв'язок на основі ШІ, який перетворює видимість на дію. Завдяки AutomationEngine завдання, починаючи від сортування сповіщень і закінчуючи контролем розгортання та масштабуванням, виконуються автоматично, дозволяючи ІТ-командам зосередитися на інноваціях, а не на «гасінні пожеж». Як обіцяє Dynatrace, ви можете «прискорити цифрову трансформацію за допомогою простих, але потужних засобів автоматизації, керованих інсайтами у сфері observability та безпеки» [18].

Якщо ваша команда «тоне» у сповіщеннях або рутинній роботі, познайомтесь з AutomationEngine від Dynatrace ближче. А наша команда допоможе вам розробити та впровадити автоматизацію у ваші процеси.

Ресурси

Dynatrace industry reports and documentation[1][19][17][9][12].
[1] [3] [4] [5] [7] Annual Global CIO Report Reveals Cloud-Native Technologies Produce Explosion of Data Beyond Humans' Ability to Manage https://www.dynatrace.com/news/press-release/annual-global-cio-report-reveals-cloud-native-technologies-produce-explosion-of-data-beyond-humans-ability-to-manage/ [2] How Dynatrace and ServiceNow are powering autonomous IT https://www.dynatrace.com/news/blog/how-dynatrace-and-servicenow-are-powering-autonomous-it/ [6] [8] What is observability? Not just logs, metrics, and traces https://www.dynatrace.com/news/blog/what-is-observability-2/ [9] Drive Innovation, Speed, and Agility by Upgrading to Dynatrace SaaS | Dynatrace https://info.dynatrace.com/noram-southeast-vdh-saas-webinar-22647-registration.html [10] [11] Dynatrace | Observability built for the age of AI https://www.dynatrace.com/ [12] [13] [14] AutomationEngine https://www.dynatrace.com/platform/automationengine/ [15] [16] [19] Platform engineering: Empowering key Kubernetes use cases https://www.dynatrace.com/news/blog/platform-engineering-empowering-key-kubernetes-use-cases/ [17] Predict and autoscale Kubernetes workloads — Dynatrace Docs https://docs.dynatrace.com/docs/deliver/self-service-kubernetes-use-case [18] Software Delivery https://www.dynatrace.com/platform/software-delivery/