Toolverse
All skills

scikit-learn

by davila7

Machine learning in Python with scikit-learn. Use when working with supervised learning (classification, regression), unsupervised learning (clustering, dimensionality reduction), model evaluation, hyperparameter tuning, preprocessing, or building ML pipelines. Provides

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
davila7
Category
Data Science
Views
43

About this skill

Machine learning in Python with scikit-learn. Use when working with supervised learning (classification, regression), unsupervised learning (clustering, dimensionality reduction), model evaluation, hyperparameter tuning, preprocessing, or building ML pipelines. Provides comprehensive reference documentation for algorithms, preprocessing techniques, pipelines, and best practices.

How to use

  1. Zainstaluj scikit-learn za pomocą polecenia uv pip install scikit-learn. Jeśli planujesz wizualizować wyniki, dodaj biblioteki matplotlib i seaborn poleceniem uv pip install matplotlib seaborn. Do pracy z danymi zainstaluj również pandas i numpy.

  2. Użyj tej umiejętności, gdy chcesz budować modele klasyfikacji lub regresji, wykonywać klasteryzację, redukować wymiarowość danych, lub tworzyć pipeline'y do produkcji. Skill wspiera również preprocessing danych, ewaluację modeli poprzez walidację krzyżową oraz strojenie hiperparametrów.

  3. Przygotuj swoje dane i podziel je na zbiór treningowy i testowy za pomocą train_test_split. Określ rozmiar zbioru testowego (np. 20%) i użyj parametru stratify dla danych niezbalansowanych.

  4. Zastosuj preprocessing — użyj StandardScaler do normalizacji cech numerycznych lub innych transformatorów dostępnych w scikit-learn, aby przygotować dane do trenowania.

  5. Wybierz odpowiedni algorytm (np. RandomForestClassifier do klasyfikacji) i wytrenuj model na danych przetworzonych. Umiejętność zapewnia dostęp do dokumentacji wszystkich dostępnych algorytmów.

  6. Oceń wydajność modelu za pomocą metryk takich jak classification_report, cross_val_score lub innych narzędzi ewaluacyjnych, a następnie dostosuj hiperparametry, jeśli to konieczne.

Related skills