arboreto
Infer gene regulatory networks (GRNs) from gene expression data using scalable algorithms (GRNBoost2, GENIE3). Use when analyzing transcriptomics data (bulk RNA-seq, single-cell RNA-seq) to identify transcription factor-target gene relationships and regulatory interactions.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Infer gene regulatory networks (GRNs) from gene expression data using scalable algorithms (GRNBoost2, GENIE3). Use when analyzing transcriptomics data (bulk RNA-seq, single-cell RNA-seq) to identify transcription factor-target gene relationships and regulatory interactions. Supports distributed computation for large-scale datasets.
How to use
Zainstaluj bibliotekę Arboreto za pomocą menedżera pakietów: uv pip install arboreto. Upewnij się, że masz zainstalowaną kompatybilną wersję Pythona i dostęp do danych ekspresji genów w formacie TSV lub CSV.
Przygotuj dane wejściowe: załaduj macierz ekspresji genów jako DataFrame Pandas, gdzie kolumny reprezentują geny, a wiersze reprezentują obserwacje (komórki, próbki lub warunki). Dane powinny być znormalizowane i gotowe do analizy.
Uruchom wnioskowanie sieci regulacji genów za pomocą skryptu basic_grn_inference.py: python scripts/basic_grn_inference.py expression_data.tsv output_network.tsv --tf-file tfs.txt --seed 777. Parametr --tf-file zawiera listę czynników transkrypcji do analizy, a --seed zapewnia powtarzalność wyników.
Alternatywnie, użyj algorytmu GRNBoost2 bezpośrednio w kodzie Python: załaduj dane, zaimportuj grnboost2 z arboreto.algo, uruchom network = grnboost2(expression_data=expression_matrix) i zapisz wyniki do pliku TSV. Pamiętaj o użyciu warunku if name == 'main': ze względu na sposób, w jaki Dask zarządza procesami.
Zinterpretuj wyniki: wyjściowa sieć zawiera kolumny z czynnikami transkrypcji, genami docelowymi i wartościami ważności, które wskazują siłę relacji regulacyjnej. Wyfiltruj wyniki według ważności, aby skoncentrować się na najistotniejszych interakcjach regulacyjnych.