Toolverse
All skills

slo-implementation

by wshobson

Define and implement Service Level Indicators (SLIs) and Service Level Objectives (SLOs) with error budgets and alerting. Use when establishing reliability targets, implementing SRE practices, or measuring service performance.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
wshobson
Category
DevOps
Views
34

About this skill

Define and implement Service Level Indicators (SLIs) and Service Level Objectives (SLOs) with error budgets and alerting. Use when establishing reliability targets, implementing SRE practices, or measuring service performance.

How to use

  1. Zainstaluj skill slo-implementation w swoim środowisku agenta, dodając go do konfiguracji observability-monitoring.

  2. Zdefiniuj Service Level Indicators (SLI) dla swojej usługi, wybierając typ pomiaru: dostępność (stosunek udanych żądań do wszystkich żądań), opóźnienie (żądania poniżej progu czasu odpowiedzi) lub trwałość danych (udane zapisy do wszystkich zapisów). Użyj dostarczonych zapytań PromQL jako szablonów dla Twojego systemu monitorowania.

  3. Ustal Service Level Objectives (SLO) — wewnętrzne cele niezawodności — biorąc pod uwagę oczekiwania użytkowników, wymagania biznesowe i bieżącą wydajność. Skorzystaj z tabeli przykładów, aby wybrać odpowiedni procent (np. 99.9% dla 43 minut przestoju miesięcznie).

  4. Oblicz i przydziel budżet błędów na podstawie różnicy między SLO a 100%, określając, ile niedostępności możesz zaakceptować bez naruszenia umowy z klientami.

  5. Skonfiguruj alerty oparte na SLO, które będą powiadamiać zespół, gdy faktyczna niezawodność zbliża się do granic budżetu błędów, umożliwiając równoważenie niezawodności z szybkością wdrażania nowych funkcji.

  6. Monitoruj cele niezawodności w czasie, porównując rzeczywiste SLI z ustalonymi SLO, aby śledzić postępy i dostosowywać strategie niezawodności w razie potrzeby.

Related skills