Toolverse
All skills

vastai-observability

by jeremylongshore

Set up comprehensive observability for Vast.ai integrations with metrics, traces, and alerts.\nUse when implementing monitoring for Vast.ai operations, setting up dashboards,\nor configuring alerting for Vast.ai integration health.\nTrigger with phrases like \

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Category
Security
Views
6

About this skill

Set up comprehensive observability for Vast.ai integrations with metrics, traces, and alerts.\nUse when implementing monitoring for Vast.ai operations, setting up dashboards,\nor configuring alerting for Vast.ai integration health.\nTrigger with phrases like \

How to use

  1. Upewnij się, że masz aktywne konto Vast.ai z uruchomionymi instancjami GPU oraz zainstalowane narzędzie vastai CLI z uwierzytelnieniem.

  2. Wyzwól skill frazami takimi jak "vastai monitoring", "vastai metrics", "monitor vastai" lub "vastai alerts" w Claude Code.

  3. Skill automatycznie pobierze listę Twoich instancji i wyświetli kluczowe metryki: identyfikator instancji, typ GPU, procent wykorzystania GPU, temperaturę, godzinowy koszt oraz czas działania.

  4. Przeanalizuj raport wykorzystania — zwróć uwagę na instancje z GPU_util poniżej 10%, które wskazują marnotrawstwo zasobów. Skill obliczy straty finansowe dla bezczynnych GPU.

  5. Monitoruj całkowity koszt godzinowy wszystkich uruchomionych instancji — skill sumuje dph_total (koszt za godzinę) dla każdej instancji i mnożyć przez czas działania.

  6. Skonfiguruj alerty dla instancji spot (podatne na przerwanie) i długotrwałych zadań treningowych — skill wspiera zewnętrzne monitorowanie do śledzenia postępu zadań.

Related skills