Toolverse
All skills

splitting-datasets

by jeremylongshore

This skill enables Claude to split datasets into training, validation, and testing sets. It is useful when preparing data for machine learning model development. Use this skill when the user requests to split a dataset, create train-test splits, or needs data partitioning for

Installation

Pick a client and clone the repository into its skills directory.

Installation

About this skill

This skill enables Claude to split datasets into training, validation, and testing sets. It is useful when preparing data for machine learning model development. Use this skill when the user requests to split a dataset, create train-test splits, or needs data partitioning for model training. The skill is triggered by terms like \

How to use

  1. Aktywuj umiejętność, prosząc Claude'a o podział zbioru danych. Użyj słów kluczowych takich jak "podziel dataset", "train-test split", "validation set" lub "data partitioning", aby system automatycznie rozpoznał żądanie.

  2. Określ plik źródłowy i proporcje podziału. Na przykład: "Podziel dane z 'my_data.csv' na 70% treningowe, 15% walidacyjne i 15% testowe" lub "Utwórz train-test split z 'large_dataset.csv' w stosunku 80/20".

  3. Claude wygeneruje kod Python wykorzystujący standardowe biblioteki do uczenia maszynowego (np. scikit-learn). Kod będzie dostosowany do Twoich wymagań i proporcji.

  4. Umiejętność automatycznie wykonuje wygenerowany kod, dzieląc zbiór danych zgodnie z podanymi parametrami.

  5. Wynikiem są nowe pliki CSV zawierające podzielone zestawy — na przykład 'train.csv', 'validation.csv' i 'test.csv' — gotowe do użycia w trenowaniu modelu.

  6. Możesz następnie załadować te pliki do swojego pipeline'u uczenia maszynowego i przystąpić do trenowania i ewaluacji modelu.

Related skills