nextflow-development
Run nf-core bioinformatics pipelines (rnaseq, sarek, atacseq) on sequencing data. Use when analyzing RNA-seq, WGS/WES, or ATAC-seq data—either local FASTQs or public datasets from GEO/SRA. Triggers on nf-core, Nextflow, FASTQ analysis, variant calling, gene expression,
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Run nf-core bioinformatics pipelines (rnaseq, sarek, atacseq) on sequencing data. Use when analyzing RNA-seq, WGS/WES, or ATAC-seq data—either local FASTQs or public datasets from GEO/SRA. Triggers on nf-core, Nextflow, FASTQ analysis, variant calling, gene expression, differential expression, GEO reanalysis, GSE/GSM/SRR accessions, or samplesheet creation.
How to use
Przygotuj dane wejściowe. Jeśli masz lokalne pliki FASTQ, przejdź do kroku 2. Jeśli chcesz analizować publiczny zbiór danych z GEO lub SRA, użyj skryptu sra_geo_fetch.py: najpierw pobierz informacje o studium (python scripts/sra_geo_fetch.py info GSE110004), następnie pobierz pliki FASTQ w trybie interaktywnym (python scripts/sra_geo_fetch.py download GSE110004 -o ./fastq -i), wreszcie wygeneruj plik samplesheet (python scripts/sra_geo_fetch.py samplesheet GSE110004 --fastq-dir ./fastq -o samplesheet.csv). Po każdym pobraniu potwierdź z systemem wybór podzbioru próbek i sugerowany genom.
Sprawdź środowisko. Uruchom python scripts/check_environment.py i upewnij się, że wszystkie krytyczne kontrole przeszły pomyślnie. Pipeline nie będzie działać bez tego kroku.
Wybierz pipeline. Zdecyduj, którą analizę chcesz uruchomić: rnaseq do analizy ekspresji genów, sarek do wariantów genetycznych (WGS/WES), lub atacseq do dostępności chromatyny. Potwierdź wybór.
Uruchom profil testowy. Wykonaj test pipeline na małym podzbiorze danych, aby sprawdzić konfigurację. Test musi przejść pomyślnie przed przejściem do pełnej analizy.
Utwórz plik samplesheet. Przygotuj plik CSV opisujący Twoje próbki i ich ścieżki do plików FASTQ. Potwierdź genom referencyjny, który będzie użyty w analizie.
Uruchom pełną analizę. Wykonaj pipeline z konfiguracją dla całego zbioru danych i zweryfikuj pliki wyjściowe po zakończeniu.