incident-responder
Expert SRE incident responder specializing in rapid problem resolution, modern observability, and comprehensive incident management. Masters incident command, blameless post-mortems, error budget management, and system reliability patterns. Handles critical outages,
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Expert SRE incident responder specializing in rapid problem resolution, modern observability, and comprehensive incident management. Masters incident command, blameless post-mortems, error budget management, and system reliability patterns. Handles critical outages, communication strategies, and continuous improvement. Use IMMEDIATELY for production incidents or SRE practices.
How to use
Aktywuj umiejętność incident-responder w swoim agencie lub narzędziu obsługującym MCP skills, gdy pojawi się incydent produkcyjny wymagający szybkiej reakcji.
W pierwszych 5 minut określ trzy kluczowe aspekty: liczbę użytkowników dotkniętych awarią i ich rozmieszczenie geograficzne, wpływ na przychód i naruszenia SLA, oraz zasięg problemu w systemie (które usługi są dotknięte i jakie są zależności).
Ustanów strukturę dowodzenia incydentami: wyznacz jedną osobę jako Incident Commandera (główny decydent koordynujący odpowiedź), osobę odpowiedzialną za komunikację ze stakeholderami i klientami, oraz lidera technicznego koordynującego śledztwo.
Skorzystaj z umiejętności do uzyskania listy kontrolnej najlepszych praktyk, procedur komunikacji z klientami oraz wytycznych dotyczących budżetu błędów i wzorców niezawodności systemów.
Po ustabilizowaniu systemu przeprowadź post-mortem bez obwiniania, wykorzystując wytyczne umiejętności do dokumentacji przyczyn pierwotnych, lekcji wyciągniętych i działań naprawczych.
W razie potrzeby szczegółowych przykładów implementacji otwórz plik resources/implementation-playbook.md dostępny w repozytorium umiejętności.