Toolverse
All skills

ray-train

by davila7

Distributed training orchestration across clusters. Scales PyTorch/TensorFlow/HuggingFace from laptop to 1000s of nodes. Built-in hyperparameter tuning with Ray Tune, fault tolerance, elastic scaling. Use when training massive models across multiple machines or running

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
davila7
Category
Security
Views
35

About this skill

Distributed training orchestration across clusters. Scales PyTorch/TensorFlow/HuggingFace from laptop to 1000s of nodes. Built-in hyperparameter tuning with Ray Tune, fault tolerance, elastic scaling. Use when training massive models across multiple machines or running distributed hyperparameter sweeps.

How to use

  1. Zainstaluj Ray Train za pomocą pip install -U "ray[train]". Upewnij się, że masz zainstalowane PyTorch (torch) i bibliotekę transformers, jeśli planujesz pracę z modelami HuggingFace.

  2. Zdefiniuj funkcję treningową, która zawiera Twoją normalną pętlę treningową PyTorch. Wewnątrz funkcji użyj train.torch.prepare_model() aby przygotować model do pracy rozproszonej — Ray automatycznie obsługuje przydzielanie urządzeń GPU.

  3. W pętli treningowej dodaj train.report() aby raportować metryki takie jak loss czy dokładność. Ray zbiera te metryki automatycznie ze wszystkich węzłów.

  4. Utwórz instancję TorchTrainer, przekazując funkcję treningową i ScalingConfig z liczbą pracowników (num_workers) oraz flagą use_gpu=True jeśli chcesz używać GPU. Na przykład num_workers=4 oznacza trening na 4 GPU.

  5. Uruchom trening wywołując trainer.fit(). Ray obsługuje koordynację rozproszoną, alokację zasobów, checkpointowanie i tolerancję na błędy — Ty skupiasz się tylko na logice treningowej.

  6. Pobierz wyniki z obiektu zwróconego przez fit(), który zawiera finalne metryki i wytrenowany model. Możesz sprawdzić result.metrics aby zobaczyć ostateczne wartości loss i inne metryki.

Related skills

security-compliance

by davila7

Guides security professionals in implementing defense-in-depth security architectures, achieving compliance with industry frameworks (SOC2, ISO27001, GDPR, HIPAA), conducting threat modeling and risk assessments, managing security operations and incident response, and embedding

Security
1172

brand-voice

by anthropics

Apply and enforce brand voice, style guide, and messaging pillars across content. Use when reviewing content for brand consistency, documenting a brand voice, adapting tone for different audiences, or checking terminology and style guide compliance.

Security
48158

reviewing-code

by CaptainCrouton89

Systematically evaluate code changes for security, correctness, performance, and spec alignment. Use when reviewing PRs, assessing code quality, or verifying implementation against requirements.

Security
1493

academic-researcher

by Shubhamsaboo

Academic research assistant for literature reviews, paper analysis, and scholarly writing.\nUse when: reviewing academic papers, conducting literature reviews, writing research summaries,\nanalyzing methodologies, formatting citations, or when user mentions academic research,

Security
1260

qmd

by tobi

Search personal markdown knowledge bases, notes, meeting transcripts, and documentation using QMD - a local hybrid search engine. Combines BM25 keyword search, vector semantic search, and LLM re-ranking. Use when users ask to search notes, find documents, look up information in

Security
1951

ui-audit

by openclaw

AI skill for automated UI audits. Evaluate interfaces against proven UX principles for visual hierarchy, accessibility, cognitive load, navigation, and more. Based on Making UX Decisions by Tommy Geoco.

Security
1223