skypilot-multi-cloud-orchestration
Multi-cloud orchestration for ML workloads with automatic cost optimization. Use when you need to run training or batch jobs across multiple clouds, leverage spot instances with auto-recovery, or optimize GPU costs across providers.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Multi-cloud orchestration for ML workloads with automatic cost optimization. Use when you need to run training or batch jobs across multiple clouds, leverage spot instances with auto-recovery, or optimize GPU costs across providers.
How to use
Zainstaluj SkyPilot wraz z obsługą wybranych chmur: uruchom pip install "skypilot[aws,gcp,azure,kubernetes]", a następnie zweryfikuj dostęp do swoich kont chmurowych poleceniem sky check.
Przygotuj plik konfiguracji YAML opisujący Twoje zadanie ML — określ wymagane zasoby (np. akcelerator GPU), a następnie dodaj skrypt do uruchomienia w sekcji run. Przykład: resources z accelerators T4:1 i run z poleceniami nvidia-smi oraz echo.
Uruchom zadanie poleceniem sky launch -c nazwa_klastra plik.yaml — SkyPilot automatycznie wybierze najtańszą chmurę i region, a następnie uruchomi klaster i Twoje zadanie.
Połącz się z klastrem przez SSH (ssh nazwa_klastra) aby monitorować postęp, przeglądać logi lub debugować zadanie w razie potrzeby.
Po zakończeniu pracy usuń klaster poleceniem sky down nazwa_klastra, aby zatrzymać naliczanie kosztów. SkyPilot zadbał o automatyczne odzyskiwanie w przypadku przerwania instancji spot.