Incident Management - “na linii ognia”

Na początek pytanie: jaka powinna być usługa? To znaczy: czego oczekuje od niej klient? Przede wszystkim tego, że zagwarantuje płynność funkcjonowania biznesu. Czyli – ma działać i być bezpieczna. Co jednak, jeśli nie działa tak, jak powinna? Satysfakcja klientów, zadowolenie użytkowników oraz wartość, jaką reprezentujemy jako firma w dużej mierze zależą od tego, jak szybko rozwiążemy napotkaną “w życiu” serwisu przeszkodę. Kto więc zajmuje się ratowaniem sytuacji, gdy coś, potocznie mówiąc, płonie? Tutaj z pomocą przychodzi Incident Management, znany ze słynnego koła ITIL.

Sporo publikacji poświęconych zarządzaniu incydentami możemy znaleźć m.in. na stronie atlassian.com. Czytamy tam, że zarządzanie incydentami ma na celu zminimalizowanie negatywnego wpływu incydentów poprzez jak najszybszy fix i powrót do standardowego działania danej usługi. 

Program przekwalifikowan grafika
Co to jest incydent?

Incydent to nieplanowana przerwa w dostarczaniu konkretnej usługi lub obniżenie jakości tej usługi za sprawą usterki. [1]

Wyobraźmy sobie bank, który udostępnia użytkownikom aplikację mobilną. Pewnego dnia użytkownicy napotykają problem: kody autoryzacyjne w aplikacji nie generują się lub aplikacja zamyka się w trakcie tego działania. To właśnie jest incydent.

 

Cykl życia incydentu

Cykl życia zgłoszenia zaczyna się od wyłapania błędu w infrastrukturze IT lub działaniu systemu. Każde zgłoszenie (a także prośba o zmianę) powinno zostać zarejestrowane w systemie obsługi zgłoszeń. Przechodzą one najczęściej przez następujące procesy (etapy): Zarządzanie Incydentem (Incident Management), Problemem (Problem Management) i Zmianą (Change Management).

Wszystkie zgłoszenia w pierwszej kolejności zostają objęte procesem zarządzania incydentami. W przypadku gdy rozwiązanie nie jest jeszcze znane i wymaga rozpoznania problemu, zgłoszenie jest przekazywane na następny etap: zarządzania problemem. W przeciwnym razie Service Desk dostarcza użytkownikowi natychmiastową pomoc, najczęściej w postaci workaround, które pozwoli wyeliminować skutki incydentu.

Wszystkie zgłoszenia w pierwszej kolejności zostają objęte procesem zarządzania incydentami. W przypadku gdy rozwiązanie nie jest jeszcze znane i wymaga rozpoznania problemu, zgłoszenie jest przekazywane na następny etap: zarządzania problemem. W przeciwnym razie Service Desk dostarcza użytkownikowi natychmiastową pomoc, najczęściej w postaci workaround, które pozwoli wyeliminować skutki incydentu.

Workaround to zazwyczaj tymczasowe rozwiązanie danego zdarzenia w celu zachowania ciągłości pracy, na przykład aplikacji. Klasycznym przykładem jest zmiana sposobu jej użytkowania. Powiedzmy, że użytkownik korzysta z Outlooka, ale wersja mobilna przestała działać. Zgłoszenie zostało zarejestrowane, ale nie możemy naprawić go od ręki. Aby użytkownik mógł osiągnąć cel, jakim jest wysłanie maila, proponujemy do czasu rozwiązania sprawy używanie Outlooka w wersji Web.

Oczywiście, bardziej złożony incydent trafia do odpowiedniego Resolving Team, co może oznaczać dłuższy czas rozwiązania zgłoszenia. Tak czy inaczej głównym kontaktem zazwyczaj jest Service Desk (który z założenia powinien rozwiązywać zdecydowaną większość incydentów).

Poniżej wykres, który przedstawia cykl życia incydentu.

cykl życia incydentu

Grafika 1. Cykl życia incydentu

 

SLA/KPI – co oznaczają w kontekście incydentu?

Gdy mówimy o incydentach, konieczna jest znajomość takich pojęć, jak SLA oraz KPI.

  • SLA (Service Level Agreement) to gwarancja jakości wykonywanych usług, ujęta w kontrakcie między klientem a dostawcą. Przykładowo: w umowie może znaleźć się zapis mówiący, że incydenty typu “password reset” rozwiązywane będą poniżej 30 minut od zarejestrowania zgłoszenia.
  • KPI (Key Performance Indicator) to najważniejsze wskaźniki, dzięki którym organizacja może stale monitorować postępy w osiąganiu wcześniej założonego celu. Nie są one zapisywane w kontrakcie, ale stanowią główne narzędzie Incydent Managera do sprawdzania jakości serwisu, wewnątrz zespołu czy też organizacji. Przykładem będzie sprawdzenie, ile incydentów rozwiązano w założonym czasie, na przykład w ciągu dwóch miesięcy.
Incydent w świetle ITIL

A co na temat incydentu mówi ITIL (Information Technology Infrastructure Library), czyli zbiór dobrych praktyk z zakresu IT?

Według ITIL, działania związane z zarządzaniem incydentami tworzą de facto dwa procesy:

  • obsługa i rozwiązywanie incydentów (od wykrycia do zamknięcia incydentów),
  • okresowy przegląd incydentów (sprawdzanie, czy incydenty były/są obsługiwane według przyjętych procedur i czy wyciągnięta została tak zwana lekcja).
kariera_ludzie przy komputerach

Pierwszy proces został już częściowo wyjaśniony w cyklu życia incydentu. Proces ten zawiera w sobie takie elementy, jak:

  1. Wykrycie incydentu – przez użytkownika lub system do monitorowania incydentów.
  2. Rejestracja incydentu – w bazie incydentów, ticketing toolu itp.
  3. Klasyfikacja incydentu – nadanie sprawie właściwego tempa, przypisanie  odpowiedniego priorytetu oraz kategorii.
  4. Diagnoza incydentu – szukanie rozwiązania lub konsultacja z innymi zespołami w bardziej zaawansowanym przypadku.
  5. Rozwiązanie incydentu – kiedy dostawca daje znać, że u niego działa.
  6. Zamknięcie incydentu – potwierdzenie działania usługi przez użytkownika.

Etapy drugiego procesu to:

  1. Przegląd i analiza zarejestrowanych incydentów – Incident Manager wraz z właścicielami usług analizują głównie incydenty z wysokim priorytetem oraz zdarzenia, które nie zostały rozwiązane w ustalonym czasie. Celem jest znalezienie powtarzających się schematów, aby na tej podstawie opracować nowe modele incydentów. Dokonują optymalizacji i automatyzacji na podstawie znalezionych wartości.
  2. Inicjowanie poprawy modelu incydentów – rejestracja wcześniej zidentyfikowanych inicjatyw usprawniających.
  3. Komunikowanie aktualizacji modelu incydentów – przekazanie interesariuszom informacji o nowych procedurach.
work in Salesforce
Rola Incident Managera

Incident Manager odpowiada za zarządzanie wszystkimi incydentami w danym obszarze (klient/organizacja). Jest głównym “punktem kontaktowym” w obsłudze incydentów.

Jego najważniejsze zadania to:

  • koordynowanie działań związanych z obsługą incydentów, w szczególności, gdy nad sprawą pracuje wiele zespołów,
  • monitorowanie i przegląd pracy zespołów odpowiedzialnych za rozwiązywanie incydentów,
  • poszerzanie świadomości na temat incydentów,
  • regularny przegląd incydentów i implementowanie działań naprawczych,
  • uczestniczenie w spotkaniach związanych z pracą serwisu,
  • raportowanie pracy serwisu pod kątem obsługi incydentów,
  • odpowiedzialność za eskalacje klienckie oraz na poziomie użytkowników.

Podsumowując rolę Incident Managera można powiedzieć, że spoczywa na nim obowiązek  szeroko pojętej kontroli prawidłowej pracy serwisu pod kątem nagłych zdarzeń. Czasami, gdy coś się “pali”, czyli wykracza poza SLA lub rozwiązanie nie jest proste, Incident Manager musi być bardzo elastyczny, aby reagować na zmieniającą się sytuację (również w kontekście zmieniającego się serwisu). Wspomniałem o cyklu życia incydentu – w życiu powinniśmy spodziewać się także tego, co niespodziewane. Dodam jeszcze, że w tej roli (i ogólnie w segmencie ITIL) niezmiernie ważna jest efektywna komunikacja. Jej umiejętność to jedno z głównych narzędzi pracy Incident Managera.

 

Korzyści Incident Managementu

Wdrożenie w firmie Incident Managementu jest gwarancją bezpieczeństwa. Moim zdaniem, najważniejsze korzyści to:

  • ulepszone monitorowanie i poprawa wydajności względem SLA,
  • szerokie kanały informacyjne odnośnie jakości usług,
  • zwiększenie wydajności,
  • zminimalizowanie ryzyka niepożądanych zdarzeń (incydentów),
  • zwiększenie satysfakcji klienta/klientów,
  • zmniejszenie strat finansowych klienta,
  • tworzenie wykwalifikowanego zespołu, podwyższanie kompetencji pracowników.

 

Major Incident Management (MIM)

Warto wspomnieć, że procesy z zakresu Incident Managementu są bezpośrednio powiązane z zagadnieniem Major Incident Managementu, który skupia się na zgłoszeniach o najwyższym priorytecie i znaczeniu biznesowym. To duży i ciekawy temat, więc przybliżymy go w kolejnym artykule.

 

Na co mi ten Incident Management?

Nie macie już chyba wątpliwości, jak ważne jest wdrożenie odpowiednio ułożonego procesu Incident Managementu oraz wyznaczenie osób, które się nim opiekują. To tylko jeden z elementów, jakie uwzględnia ITIL wśród rozwiązań dotyczących efektywnego zarządzania usługami.
Zarządzanie incydentami jest często bagatelizowane i pomijane. W mojej opinii, to duży błąd:  przecież z doświadczenia wiemy, że lepiej zapobiegać niż leczyć. Dlatego tak ważna jest rola Incident Managera jako strażnika procesu bezpieczeństwa. Wczesne wykrycie incydentów i odpowiednie zarządzanie nimi bezpośrednio przekłada się na zmniejszenie kosztów utrzymania usługi, jest to fakt. Zaniedbywanie tego procesu często może być znacznie bardziej kosztowne niż samo jego utrzymanie (i innych procesów).

Craftware i nasz zespół znakomitych specjalistów gwarantuje, że te procesy można stworzyć, zoptymalizować, utrzymywać i dbać o ich stałe doskonalenie. Mamy doświadczenie w pełnym spektrum zarządzania tym (i nie tylko tym) procesem, ponieważ jest to część każdego dnia naszej pracy, a zadowolenie klientów jest najlepszym dowodem, że umiemy to robić dobrze.

Bibliografia: 

 [1] – https://www.commint.pl/slownik-outsourcingu/definicja-incydent

Potrzebujesz doświadczonego specjalisty?
Skontaktuj się z nami!
Autor
  • Kuba Dzwonek
  • Junior Service Manager
  • Doświadczenie w branży IT zdobywa od 3 lat, przede wszystkim w roli Incident Managera. W Craftware od lutego 2022 roku. Aktualnie ma “pod opieką” usługi dla wiodącego na rynku klienta z branży medycznej. Interesuje się zarządzaniem i muzyką, w szczególności tą w wydaniu na żywo (festiwale). Najważniejszą wartością jest dla niego efektywna komunikacja.

Opracowanie redakcyjne:
Ania Sawicka
Redakcja tekstu
Podobał Ci się mój artykuł?

Dołącz do naszego newslettera, a nie ominą Cię żadne nowości.