bulk-rna-seq-deconvolution-with-bulk2single
Turn bulk RNA-seq cohorts into synthetic single-cell datasets using omicverse's Bulk2Single workflow for cell fraction estimation, beta-VAE generation, and quality control comparisons against reference scRNA-seq.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Turn bulk RNA-seq cohorts into synthetic single-cell datasets using omicverse's Bulk2Single workflow for cell fraction estimation, beta-VAE generation, and quality control comparisons against reference scRNA-seq.
How to use
Zainstaluj omicverse i wymagane biblioteki (scanpy, scvelo, anndata, matplotlib) w swoim środowisku Python. Umieść skill w katalogu .claude/skills projektu.
Przygotuj dane wejściowe: załaduj tabelę liczności RNA-seq (bulk) oraz referencyjny zbiór danych scRNA-seq w formacie AnnData. Harmonizuj identyfikatory genów w danych zbiorczych za pomocą funkcji ov.bulk.Matrix_ID_mapping(), wskazując plik mapowania genów (np. 'genesets/pair_GRCm39.tsv'). Upewnij się, że dane referencyjne zawierają etykiety typów komórek w kolumnie adata.obs['clusters'].
Zainicjuj model Bulk2Single, podając dane zbiorcze, dane referencyjne, klucz kolumny z typami komórek, listę nazw próbek zbiorczych oraz parametry (liczba markerów, GPU). Wybierz gpu=0 dla karty graficznej lub gpu=-1 dla procesora. Upewnij się, że nazwy próbek w parametrze bulk_group odpowiadają identyfikatorom kolumn w macierzy danych zbiorczych.
Uruchom szacowanie frakcji komórek za pomocą model.predicted_fraction(), która wykonuje zintegrowany estymator TAPE. Wizualizuj wyniki jako wykresy słupkowe skumulowane dla każdej próbki, aby zweryfikować proporcje typów komórek. Zapisz tabelę frakcji do pliku CSV w celu dalszej analizy.
Przeprowadź preprocessing danych zbiorczych dla modelu beta-VAE, wykonując funkcję model.bulk_preproc(). Ten krok przygotowuje dane do generowania syntetycznych profili single-cell.
Porównaj wygenerowane syntetyczne komórki z danymi referencyjnymi scRNA-seq, używając funkcji kontroli jakości dostępnych w omicverse. Oceń zgodność między syntetycznymi a rzeczywistymi profilami komórek na podstawie ekspresji markerów i rozkładu typów komórek.