Toolverse
All skills

k8s-incident

by rohitg00

Respond to Kubernetes incidents with runbooks and diagnostics. Use for outages, pod failures, node issues, network problems, and emergency response.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
rohitg00
Category
Security
Views
3

About this skill

Respond to Kubernetes incidents with runbooks and diagnostics. Use for outages, pod failures, node issues, network problems, and emergency response.

How to use

  1. Zainstaluj skill k8s-incident w swoim środowisku Claude/Copilot, wskazując repozytorium rohitg00/kubectl-mcp-server.

  2. Gdy zauważysz problem w klastrze (awaria, pod nie uruchamia się, węzeł niedostępny), poproś Claude o "incident response" — skill automatycznie aktywuje się na słowa kluczowe takie jak "incident", "outage", "emergency" czy "down".

  3. Zacznij od szybkiej kontroli zdrowia klastra: skill uruchomi get_nodes() aby sprawdzić stan węzłów, get_pods(namespace="kube-system") aby zweryfikować płaszczyznę kontrolną, oraz get_events() aby zebrać zdarzenia przed wprowadzeniem zmian.

  4. W zależności od typu incydentu postępuj wg runbooka: dla podów w CrashLoopBackOff użyj get_pod_logs(previous=True) aby zobaczyć poprzednie logi, następnie describe_pod() dla szczegółów; dla węzła niedostępnego sprawdź describe_node(); dla niedostępnej usługi zweryfikuj get_endpoints() i get_network_policies().

  5. Zbieraj zdarzenia i logi zanim wprowadzisz zmiany — skill priorytetyzuje dokumentację przed akcjami naprawczymi, aby zachować ścieżkę audytu.

  6. Jeśli to bezpieczne, użyj rollback_deployment() aby przywrócić poprzednią wersję, lub postępuj wg konkretnego runbooka dla Twojego scenariusza (kontrolna płaszczyzna, zasoby, polityki sieciowe).

Related skills