Toolverse
All skills

bulk-rna-seq-differential-expression-with-omicverse

by Starlitnightly

Guide Claude through omicverse's bulk RNA-seq DEG pipeline, from gene ID mapping and DESeq2 normalization to statistical testing, visualization, and pathway enrichment. Use when a user has bulk count matrices and needs differential expression analysis in omicverse.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Category
Backend
Views
2

About this skill

Guide Claude through omicverse's bulk RNA-seq DEG pipeline, from gene ID mapping and DESeq2 normalization to statistical testing, visualization, and pathway enrichment. Use when a user has bulk count matrices and needs differential expression analysis in omicverse.

How to use

  1. Zainstaluj omicverse i wymagane zależności (scanpy, matplotlib) w swoim środowisku Python. Skill zakłada, że masz już przygotowaną surową macierz liczności genów na poziomie genów, np. z narzędzia featureCounts.

  2. Pobierz pliki mapowania identyfikatorów genów za pomocą ov.utils.download_geneid_annotation_pair() i umieść je w folderze genesets/. Skill obsługuje prebudowane genomy (T2T-CHM13, GRCh38, GRCh37, GRCm39, danRer7, danRer11) lub możesz wygenerować własne mapowanie z pliku GTF.

  3. Wczytaj surową macierz liczności jako plik rozdzielany tabulatorami (np. wyjście featureCounts) za pomocą ov.pd.read_csv() z parametrami sep='\t', header=1, index_col=0. Wyczyść nazwy kolumn, usuwając przyrostki .bam z identyfikatorów próbek.

  4. Zmapuj identyfikatory genów na symbole genów, uruchamiając ov.bulk.Matrix_ID_mapping() z przygotowanym plikiem mapowania. Następnie utwórz obiekt DEG za pomocą ov.bulk.pyDEG() i usuń duplikaty symboli genów, zachowując wersję o najwyższej ekspresji.

  5. Znormalizuj dane, wykonując dds.normalize(), aby obliczyć współczynniki wielkości DESeq2 i skorygować różnice w wielkości bibliotek. Następnie uruchom testowanie statystyczne różnicowej ekspresji między grupami próbek.

  6. Wygeneruj wizualizacje (wykresy wulkanu) i przeprowadź analizę wzbogacenia szlaków metabolicznych, aby zidentyfikować procesy biologiczne związane z różnie wyrażonymi genami.

Related skills