Toolverse
All skills

devops-troubleshooter

by sickn33

Expert DevOps troubleshooter specializing in rapid incident response, advanced debugging, and modern observability. Masters log analysis, distributed tracing, Kubernetes debugging, performance optimization, and root cause analysis. Handles production outages, system reliability,

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
sickn33
Category
DevOps
Views
1

About this skill

Expert DevOps troubleshooter specializing in rapid incident response, advanced debugging, and modern observability. Masters log analysis, distributed tracing, Kubernetes debugging, performance optimization, and root cause analysis. Handles production outages, system reliability, and preventive monitoring. Use PROACTIVELY for debugging, incident response, or system troubleshooting.

How to use

  1. Zainstaluj skill w swoim środowisku agenta DevOps, upewniając się, że masz dostęp do dokumentacji playbook'ów w katalogu resources/implementation-playbook.md.

  2. Przed rozpoczęciem pracy wyjaśnij cel diagnozy: czy chodzi o bieżący incydent produkcyjny, analiza wydajności, czy budowanie monitorowania prewencyjnego. Określ ograniczenia czasowe i dostępne narzędzia obserwacyjne (logi, metryki, traces).

  3. Zastosuj odpowiednie praktyki dla Twojego problemu: do analizy logów użyj ELK Stack lub Loki, do śledzenia żądań rozprosonych wybierz Jaeger lub OpenTelemetry, do debugowania Kubernetesa opanuj zaawansowane komendy kubectl i inspektowanie zasobów.

  4. Zbierz dane diagnostyczne z dostępnych źródeł obserwacyjnych (Prometheus dla metryk, DataDog/New Relic dla APM, logi aplikacji). Zidentyfikuj anomalie i wzorce wskazujące na przyczynę problemu.

  5. Przeprowadź analizę przyczyny głównej, łącząc informacje z logów, metryk i traces. Dostarczaj konkretne kroki naprawcze wraz z weryfikacją ich skuteczności.

  6. Jeśli potrzebujesz szczegółowych przykładów lub szablonów procedur, otwórz resources/implementation-playbook.md, aby znaleźć gotowe scenariusze dla typowych awarii i strategii monitorowania.

Related skills

senior-data-engineer

by davila7

World-class data engineering skill for building scalable data pipelines, ETL/ELT systems, and data infrastructure. Expertise in Python, SQL, Spark, Airflow, dbt, Kafka, and modern data stack. Includes data modeling, pipeline orchestration, data quality, and DataOps. Use when

DevOps
1268

chrome-devtools

by mrgoonie

Browser automation, debugging, and performance analysis using Puppeteer CLI scripts. Use for automating browsers, taking screenshots, analyzing performance, monitoring network traffic, web scraping, form automation, and JavaScript debugging.

DevOps
29141

file-organizer

by ComposioHQ

Intelligently organizes your files and folders across your computer by understanding context, finding duplicates, suggesting better structures, and automating cleanup tasks. Reduces cognitive load and keeps your digital workspace tidy without manual effort.

DevOps
1399

clawhub

by openclaw

Use the ClawHub CLI to search, install, update, and publish agent skills from clawhub.com. Use when you need to fetch new skills on the fly, sync installed skills to latest or a specific version, or publish new/updated skill folders with the npm-installed clawhub CLI.

DevOps
14106

planning-with-files

by davila7

Implements Manus-style file-based planning for complex tasks. Creates task_plan.md, findings.md, and progress.md. Use when starting complex multi-step tasks, research projects, or any task requiring u003e5 tool calls.

DevOps
2365

lambda

by itsmostafa

AWS Lambda serverless functions for event-driven compute. Use when creating functions, configuring triggers, debugging invocations, optimizing cold starts, setting up event source mappings, or managing layers.

DevOps
127