gsea-enrichment-analysis
Gene set enrichment analysis with correct geneset format handling. Critical guidance for loading pathway databases and running enrichment in OmicVerse.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Gene set enrichment analysis with correct geneset format handling. Critical guidance for loading pathway databases and running enrichment in OmicVerse.
How to use
Pobierz bazę danych szlaków biologicznych, uruchamiając ov.utils.download_pathway_database(). Ta funkcja pobiera dostępne zestawy genów, takie jak GO Biological Process 2021 lub KEGG, do lokalnego katalogu genesets/.
Załaduj plik gensetów do formatu słownika za pomocą ov.utils.geneset_prepare(), podając ścieżkę do pliku (np. 'genesets/GO_Biological_Process_2021.txt' lub plik .gmt) oraz organizm ('Human' lub 'Mouse'). Ta funkcja konwertuje plik tekstowy na słownik, który jest wymagany przez funkcję analizy.
Przygotuj listę genów różnicowo ekspresjonowanych (DEG), którą chcesz analizować. Lista powinna zawierać symbole genów, które będą porównane z zestawami genów z bazy danych.
Uruchom analizę wzbogacenia za pomocą ov.bulk.geneset_enrichment(), przekazując listę genów, słownik szlaków (nie ścieżkę pliku), typ wartości p ('auto' lub inny), oraz organizm. Funkcja zwróci wyniki wzbogacenia z wartościami p i statystykami dla każdego zestawu genów.
Pamiętaj, że geneset_enrichment() wymaga słownika, a nie ścieżki do pliku — błędem jest przekazanie stringa z nazwą pliku zamiast wyniku z geneset_prepare().