Як Bank of Georgia реалізував повну видимість у своїй інфраструктурі

Зміст статті:
● Диджиталізація в Bank of Georgia ● Що спонукає нас до змін ● Як вибрати рішення APM ● Dynatrace: важливість впровадження рішення● Як ми працюємо з виявленням проблем● Який результат ми отримали ● Висновок 

Bank of Georgia — систематично важливий і провідний банк Грузії. Він є лідером у сфері платіжного бізнесу та фінансових мобільних додатків із сильними роздрібними та корпоративними банківськими франшизами. Відповідно до цифрової стратегії, банк зосереджується на розширенні технологічних і передових можливостей аналізу даних, щоб пропонувати клієнтам більш персоналізовані рішення та бездоганний досвід.
52% усіх платіжних операцій у країні проходять через Bank of Georgia. 1 000 000 клієнтів щомісяця активно користуються основним цифровим продуктом банку, а половина клієнтів використовують додаток щодня. Також Bank of Georgia обслуговує близько 44% кредитів та 40% депозитів в країні.
Керівництво банку дотримується ідеї, що найкращий спосіб створити сучасну та сильну компанію — бути технологічними та клієнтоорієнтованими.
Як Bank of Georgia проходив процес диджиталізації та запровадив повну видимість — читайте нижче.

Важа Мантуа - Заступник CIO, ІТ-операції. Про диджиталізацію, вплив і неминучі зміни

Диджиталізація в Bank of Georgia

Через пандемію COVID, компанії по всьому світу почали масово долучатись до цифрової трансформації, але ми зробили це набагато раніше. Зараз ми зміцнюємо свої позиції на ринку, оскільки вже маємо унікальні продукти та функції на наших цифрових платформах.
Банкінг — не єдиний продукт, який пропонує наша платформа. Наприклад, у нас є платформа фондової біржі, де ви можете в один клік купити або продати акції відомих компаній. У майбутньому ми впровадимо в наш мобільний банкінг криптобіржу. 
Наші головні виклики — це масштабованість, висока продуктивність, безпека, доступність і нескладні бізнес-процеси. Тож можна говорити про виклики в трьох напрямках: люди, процеси та платформи.

ЛюдиТри роки тому у нас був дуже агресивний кадровий процес. Після цього перед нами постали нові виклики. Наприклад, виявилось, що коли наймаєш нових співробітників, процеси онбордингу мають бути досконалими. Ще ми зробили важливе відкриття: коли компанія збільшується в три-чотири рази, це може негативно вплинути на якість послуг, оскільки вона здебільшого залежить від персоналу. Ось чому ми робимо процеси адаптації максимально ефективними, включаючи в них наставництво, перевірку коду та командну роботу. 
ПроцесиУ нас були стандартні каскадні процеси, але потім ми перейшли на agile. Але це був більше, ніж просто перехід до іншої системи — ми змінилися ментально і почали мислити більш глобально. 
Ми почали використовувати нові KPI — технологічні API (Application Programming Interfaces), які можна вимірювати. Крім того, в нашій компанії зростає культура зворотного зв’язку, тому що важливо прислухатися до співробітників і намагатися виправити всі недоліки. Задоволений працівник — це життєво важливий фактор успіху.
ПлатформиНаші платформи стали складнішими, а кількість клієнтів різко зросла. Це означає, що ми повинні мати гнучку та сучасну архітектуру, мікросервіси та легкі процеси, які допомагають нам досягти прямої масштабованості. 

Що спонукає нас до змін

Середньостатистичні компанії підлаштовуються під поведінку клієнтів, а прогресивні можуть самі впливати на неї та встановлювати тренди. І я твердо вірю, що Bank of Georgia належить саме до другого типу. Водночас наші клієнти спонукають нас до модифікацій під час використання наших цифрових платформ.
Якщо у вас монолітна архітектура, вам слід оновлювати мультиархітектуру кожні два роки. Однак це дуже тривалі та дорогі процеси: коли кожен процес виконується в одній програмі та платформі, важко оновлювати їх щорічно. Ось чому ми почали використовувати мікросервісну архітектуру, яка є дуже легкою та має просту масштабованість. Крім того, така архітектура допоможе нам у нашій майбутній міграції в хмару: ми оголосили, що через п’ять років будемо повністю хмарною організацією, і всі наші платформи працюватимуть у публічній хмарі — Amazon, Azure або Google.
Перехід до мікросервісів призвів до розгалуження та розширення інфраструктури. В такому випадку компанії повинні забезпечити повну видимість для контролю масштабування, змін процесів і архітектури, інакше вони не витримають вагу власних проблем при переході на мікросервіси, хмару чи куди завгодно. APM-рішення постійно перевіряють «здоров’я» процесів та інфраструктури, а також вплив змін на користувача та роботу сервісів. В результаті повна видимість інфраструктури спрощує роботу спеціалістів і паралельно прискорює ІТ-трансформацію всіх процесів. 

Як вибрати рішення APM

У пошуках будь-якого нового технічного рішення ми зазвичай використовуємо два підходи: внутрішній пошук і поради наших партнерів.
У нас є спеціальна команда архітекторів в ІТ-організації для внутрішнього пошуку. Вони проводять дослідження, знаходять технічні рішення для різних завдань і роблять першу оцінку. Іноді ми обираємо рішення, спираючись на поради наших місцевих партнерів. У нас є близько 6 партнерів, яким ми можемо довіряти. 
Виходячи з нашого досвіду, я хочу дати вам кілька порад:● Зʼясуйте, що саме вам потрібно;● Сформуйте список вимог і почніть дослідження;● Знайшовши варіант, перевірте, чи відповідає платформа вашим вимогам;● Прийміть фінальне рішення. 
Ви повинні чітко розуміти ролі та обов’язки. Інакше ви будете незадоволені, оскільки технології не дають вам того, що ви хочете.
Ось як це працює в нас: зазвичай ми беремо 4-5 відомих на ринку платформ і проводимо дослідження. Потім ми отримуємо приблизну вартість проєкту і дивимось, чи зможе наш бюджет її покрити. Нарешті, коли ми знаємо, що підтвердження концепції успішно завершено, ми вирішуємо інвестувати в платформу. 
Вибираючи інструменти моніторингу, ми ставили багато запитань: хто буде відповідати за повне впровадження, створення та відстеження метрик, а також системи оповіщення? У нашому випадку Dynatrace відповідав усім запитам і завданням. Як на мене, це найкращий інструмент моніторингу програм. Основними причинами, чому ми зупинилися на Dynatrace, були технічні можливості платформи, ті показники, які вона могла надавати у порівнянні з конкурентами, та вартість. Як правило найкращі рішення на ринку завжди коштують дорого. На практиці ж ми виявили, що рішення ідеально вписується в наш бюджет і немає потреби йти на компроміс у пошуках. Окремо зазначу, що політика Dynatrace гнучка до потреб та побажань клієнта, а це для нас дуже важливо.
У нашому ІТ-відділі 800 людей, і я думаю, що співпраця ролей і обов’язків у ІТ-організації разом із перевагами платформи може принести лише чудові результати.

Давід Лапіашвілі — керівник відділу мобільних і веброзробок. Про впровадження рішення та технічні проблеми

Dynatrace: важливість впровадження рішення

У 2017 році ми створили новий мобільний додаток для наших користувачів. Він виявився успішним — у нас було близько 90 000 встановлень. Але ця програма поставила перед нами нові виклики, оскільки ми були не готові до такого навантаження. Ми розв'язували проблеми вручну, аналізували та збирали дані, щоб зрозуміти, з якими службами виникають несправності.
Наша нова мета полягала в тому, щоб мобільний додаток задовольняв клієнтів, і це було пріоритетом номер один. Тоді й зʼявився Dynatrace. Спочатку ми використовували його саме для моніторингу back-end'у нашого мобільного додатку (написаний на Java). Це дало нам величезні можливості для усунення всіх несправностей у наших програмах.
Коли ми перейшли від нашої платформи (стандартна інфраструктура VMware) до нинішньої інфраструктури VMWare плюс Kubernetes, ми були готові до певних проблем з моніторингом. Але Dynatrace дуже простий у роботі з новими платформами та Kubernetes. Отже, в нас немає відкритих питань щодо міграції ліцензій зі стандартної платформи VMWare на Kubernetes.
Впровадження було непростим, але нам дуже допомогла документація Dynatrace. У нас були всі системи оповіщення, критичні системи та деякі бізнес-індикатори. Нам знадобилось близько місяця, щоб створити інформаційні панелі, моделі атрибуції та все необхідне для моніторингу наших критично важливих систем.
Dynatrace служить інструментом моніторингу та усунення несправностей. Разом з тим у нас є багато діаграм KPI та графіків, невеликих платформ або некритичних процесів. Для них ми використовуємо рішення з відкритим кодом — наприклад, Prometheus.
Dynatrace також вміє вимірювати SLA. Люди здійснюють різні платежі в мобільному банкінгу, і Dynatrace вимірює стійкість послуг — не лише для Bank of Georgia, але й для інших компаній, які мають пов’язані послуги. 

Як ми працюємо з виявленням проблем

Наразі ми маємо два типи виявлення. Перший — коли клієнти не знають про існування проблеми, і Dynatrace показує нам, що щось ненормально. Тоді ми оперативно реагуємо, і в цьому полягає найбільша перевага.
Другий — коли ми пропускаємо якусь несправність або коли зʼявляються зовнішні фактори (наприклад, зміни нового постачальника). Це також створює певні коливання в нашій системі та часто впливає на всю інфраструктуру. Dynatrace дозволяє нам виявити цю проблему за кілька хвилин і виправити її до того, як вона призведе до чогось дійсно серйозного.
Коли все йде з ладу одночасно, все одно корисно використовувати Dynatrace, оскільки рішення допомагає точно визначити, де є проблема, а отже, і швидко відреагувати. Усі проблеми у вашій інфраструктурі впорядковано за часом, але ви можете переглянути докладнішу інформацію, клікнувши одну конкретну програму.
Ми не використовуємо автоматичний відкат, оскільки ми маємо кілька компонентів майже в кожному розгортанні, і це непросто організувати. Але Dynatrace допомагає зрозуміти, чи було кілька розгортань додатків і яка служба є проблематичною.

Який результат ми отримали

Коли ми почали працювати з Dynatrace, ми дослідили деякі проблеми, про які не знали раніше. Наприклад, ми аналізували нові шляхи, винятки та інше. Ще ми створили кілька нових сповіщень — це дало нам більше прозорості для моніторингу.
До Dynatrace наші клієнти час від часу скаржилися на системні збої та серйозний вплив. Тепер ми отримуємо миттєві сповіщення, щоб зрозуміти, де проблема. Завдяки цьому значно зросли показники задоволеності клієнтів. Наприклад, ми отримали 90 балів в оцінюванні для мобільних додатків і індивідуальних клієнтів, понад 80 для бізнес-клієнтів і також понад 80 для індивідуальних вебдодатків. Все це говорить про покращення якості продукції, яка натомість впливає на показники задоволеності споживачів.
Тепер ми вимірюємо час простою для кожної системи, а Dynatrace — це інструмент для розуміння проблеми та реагування на неї. Він допомагає нам знайти проблему, ще до того, як клієнт її побачить, усунути першопричину та завдяки цьому скоротити час відповіді.
Підсумовуючи — позапланові простої зменшилися вдвічі, що для нас є відмінним результатом. Використовуючи рішення APM, ми значно підвищили якість наших послуг. Ми збираємося збільшити навантаження та покрити моніторингом ще більше інфраструктури та ключових систем.

Висновок 

Наш вердикт — ми точно можемо рекомендувати Dynatrace.
З нашого досвіду, моніторинг кожної критичної системи з Dynatrace є вкрай важливим кроком. Платформа містить велику кількість інструментів що суттєво полегшують роботу з пошуку та ідентифікації проблем. Ми наполегливо рекомендуємо використовувати їх для забезпечення високого рівня стабільності ключових систем.
Dynatrace — це не просто APM, а рішення для спостереження, і зараз ми вивчаємо всі можливості Dynatrace, такі як моніторинг користувачів, AppSec, моніторинг хмарних середовищ тощо. Можливо, у майбутньому ми розширимо нашу підписку.
Перш ніж запроваджувати Dynatrace, ви можете протестувати, так би мовити, власноруч створене observability-рішення. Створіть ланцюжок додатків від інтерфейсу до серверної частини, бази даних і всього, що ви використовуєте для однієї служби. Таким чином, ви отримаєте повне уявлення про можливості Dynatrace і його основні переваги. 
Невеликі компанії не мають можливості для глибокого аналізу програмного забезпечення. Тому ми хочемо бути для них прикладом компанії, яка покращила всі процеси та може гарантувати стабільну роботу програм завдяки платформі моніторингу.

Протестуйте пробну версію Dynatrace у вашій інфраструктурі

● 15 днів абсолютно безкоштовно● Не потрібно вводити дані карти● Встановіть та почніть використовувати рішення менш ніж через 5 хвилин

Дізнайтесь більше про Dynatrace

Illustration

2 роки з Dynatrace - політ нормальний. Досвід OTP Bank Ukraine

Як влаштований IT-моніторинг: про завдання, проблеми, підрядники, поганий код, моніторинг, нові технології та "Кривавий enterprise" на практиці від Артема Логвиненка, Head Of IT Operations Department, OTP Bank.

Illustration

Автоматизація рутини в ІТ з допомогою AI

У перекладеному на російську мові посібнику розглянуті питання виявлення та автовиправлення помилок, пошуку першопричин за допомогою AI, комплексного моніторингу та автоматизації повторюваних процесів.

Illustration

Моніторинг Dynatrace в Kapital Bank: історія успіху

Запис вебінару про те, як найбільший банк Азербайджану реалізував моніторинг складних програм на базі Dynatrace.

Illustration

12-й раз підряд лідер Gartner Magic Quadrant for APM & Observability 2022

Платформа Dynatrace є рішенням, яке дає вичерпну інформацію про продуктивність у гібридній інфраструктурі.
Аналітики Gartner® виділили такі конкурентні переваги Dynatrace:● Потужна аналітика на основі штучного інтелекту на рівні коду● Об'єднання Application Monitoring та Application Security● Унікальна архітектура та простота розгортання Dynatrace OneAgent