splitting-datasets
This skill enables Claude to split datasets into training, validation, and testing sets. It is useful when preparing data for machine learning model development. Use this skill when the user requests to split a dataset, create train-test splits, or needs data partitioning for
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
This skill enables Claude to split datasets into training, validation, and testing sets. It is useful when preparing data for machine learning model development. Use this skill when the user requests to split a dataset, create train-test splits, or needs data partitioning for model training. The skill is triggered by terms like \
How to use
Aktywuj umiejętność, prosząc Claude'a o podział zbioru danych. Użyj słów kluczowych takich jak "podziel dataset", "train-test split", "validation set" lub "data partitioning", aby system automatycznie rozpoznał żądanie.
Określ plik źródłowy i proporcje podziału. Na przykład: "Podziel dane z 'my_data.csv' na 70% treningowe, 15% walidacyjne i 15% testowe" lub "Utwórz train-test split z 'large_dataset.csv' w stosunku 80/20".
Claude wygeneruje kod Python wykorzystujący standardowe biblioteki do uczenia maszynowego (np. scikit-learn). Kod będzie dostosowany do Twoich wymagań i proporcji.
Umiejętność automatycznie wykonuje wygenerowany kod, dzieląc zbiór danych zgodnie z podanymi parametrami.
Wynikiem są nowe pliki CSV zawierające podzielone zestawy — na przykład 'train.csv', 'validation.csv' i 'test.csv' — gotowe do użycia w trenowaniu modelu.
Możesz następnie załadować te pliki do swojego pipeline'u uczenia maszynowego i przystąpić do trenowania i ewaluacji modelu.