k8s-incident
Respond to Kubernetes incidents with runbooks and diagnostics. Use for outages, pod failures, node issues, network problems, and emergency response.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Respond to Kubernetes incidents with runbooks and diagnostics. Use for outages, pod failures, node issues, network problems, and emergency response.
How to use
Zainstaluj skill k8s-incident w swoim środowisku Claude/Copilot, wskazując repozytorium rohitg00/kubectl-mcp-server.
Gdy zauważysz problem w klastrze (awaria, pod nie uruchamia się, węzeł niedostępny), poproś Claude o "incident response" — skill automatycznie aktywuje się na słowa kluczowe takie jak "incident", "outage", "emergency" czy "down".
Zacznij od szybkiej kontroli zdrowia klastra: skill uruchomi get_nodes() aby sprawdzić stan węzłów, get_pods(namespace="kube-system") aby zweryfikować płaszczyznę kontrolną, oraz get_events() aby zebrać zdarzenia przed wprowadzeniem zmian.
W zależności od typu incydentu postępuj wg runbooka: dla podów w CrashLoopBackOff użyj get_pod_logs(previous=True) aby zobaczyć poprzednie logi, następnie describe_pod() dla szczegółów; dla węzła niedostępnego sprawdź describe_node(); dla niedostępnej usługi zweryfikuj get_endpoints() i get_network_policies().
Zbieraj zdarzenia i logi zanim wprowadzisz zmiany — skill priorytetyzuje dokumentację przed akcjami naprawczymi, aby zachować ścieżkę audytu.
Jeśli to bezpieczne, użyj rollback_deployment() aby przywrócić poprzednią wersję, lub postępuj wg konkretnego runbooka dla Twojego scenariusza (kontrolna płaszczyzna, zasoby, polityki sieciowe).