Toolverse
All skills

preprocessing-data-with-automated-pipelines

by jeremylongshore

This skill empowers Claude to preprocess and clean data using automated pipelines. It is designed to streamline data preparation for machine learning tasks, implementing best practices for data validation, transformation, and error handling. Claude should use this skill when

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Category
DevOps
Views
2

About this skill

This skill empowers Claude to preprocess and clean data using automated pipelines. It is designed to streamline data preparation for machine learning tasks, implementing best practices for data validation, transformation, and error handling. Claude should use this skill when the user requests data preprocessing, data cleaning, ETL tasks, or mentions the need for automated pipelines for data preparation. Trigger terms include \

How to use

  1. Opisz swoje dane i cel przetwarzania — podaj informacje o źródle danych, żądanym formacie wyjściowym i transformacjach, które chcesz wykonać. Możesz wspomnieć o czyszczeniu, walidacji lub budowie potoku ETL.

  2. Claude przeanalizuje Twoje wymagania i wygeneruje kod Python dla automatycznego potoku przetwarzania, wykorzystując odpowiednie biblioteki i standardy branżowe.

  3. Potok zostanie uruchomiony automatycznie, wykonując wszystkie kroki przetwarzania danych — czyszczenie, transformację i walidację.

  4. Otrzymasz raport z metrykami wykonania, w tym ocenę jakości danych i listę napotkanych problemów lub anomalii.

  5. Jeśli potrzebujesz zmian, możesz poprosić Claude'a o modyfikację potoku — na przykład dodanie nowych reguł walidacji lub zmianę transformacji.

Related skills