airflow-dag-patterns
Build production Apache Airflow DAGs with best practices for operators, sensors, testing, and deployment. Use when creating data pipelines, orchestrating workflows, or scheduling batch jobs.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Build production Apache Airflow DAGs with best practices for operators, sensors, testing, and deployment. Use when creating data pipelines, orchestrating workflows, or scheduling batch jobs.
How to use
Zainstaluj umiejętność w swoim środowisku agenta, dodając ścieżkę do repozytorium wshobson/agents w konfiguracji pluginów data-engineering.
Zdefiniuj podstawową strukturę DAG-a, tworząc plik w katalogu dags/ z importami datetime, DAG i operatorami (PythonOperator, EmptyOperator lub innymi dostępnymi w Airflow).
Skonfiguruj default_args z parametrami właściciela, liczby ponowień (retries), opóźnienia między próbami i alertów e-mail na wypadek awarii.
Zdefiniuj DAG z dag_id, harmonogramem (schedule), datą startu i opisem, a następnie dodaj zadania (tasks) jako instancje operatorów.
Ustal zależności między zadaniami, używając operatorów >> dla przepływu liniowego, fan-out (jedno zadanie prowadzące do wielu) lub fan-in (wiele zadań prowadzących do jednego).
Przetestuj DAG lokalnie przed wdrożeniem, sprawdzając poprawność składni, zależności i logiki każdego operatora, a następnie wdróż w produkcji z monitorowaniem logów i alertów.