conducting-chaos-engineering
This skill enables Claude to design and execute chaos engineering experiments to test system resilience. It is used when the user requests help with failure injection, latency simulation, resource exhaustion testing, or resilience validation. The skill is triggered by
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
This skill enables Claude to design and execute chaos engineering experiments to test system resilience. It is used when the user requests help with failure injection, latency simulation, resource exhaustion testing, or resilience validation. The skill is triggered by discussions of chaos experiments (GameDays), failure injection strategies, resilience testing, and validation of recovery mechanisms like circuit breakers and retry logic. It leverages tools like Chaos Mesh, Gremlin, Toxiproxy, and AWS FIS to simulate real-world failures and assess system behavior.
How to use
Opisz swój system i cele testowania — powiedz mi, jaką usługę chcesz testować i jakie scenariusze awarii Cię interesują (np. symulacja opóźnień, wyczerpanie zasobów, przerwy w połączeniu).
Wspólnie definiujemy zakres eksperymentu — określamy docelowy komponent, typ awarii oraz metryki, które będziemy monitorować podczas testu.
Wybieram odpowiednie narzędzie — na podstawie Twojego środowiska (Kubernetes, AWS, lokalne) rekomenduje Chaos Mesh, Gremlin, Toxiproxy lub AWS FIS.
Pomagam skonfigurować eksperyment — przygotowuję konfigurację, skrypty lub parametry potrzebne do uruchomienia testu w Twoim systemie.
Monitorujemy zachowanie systemu — obserwujemy, jak system reaguje na symulowane awarie, zbierając dane o wydajności i błędach.
Analizuję wyniki i daję rekomendacje — identyfikuję odkryte słabe punkty i proponuję konkretne ulepszenia mechanizmów odporności, takich jak timeout'y, retry'e lub failover'y.