single-cell-preprocessing-with-omicverse
Walk through omicverse's single-cell preprocessing tutorials to QC PBMC3k data, normalise counts, detect HVGs, and run PCA/embedding pipelines on CPU, CPU–GPU mixed, or GPU stacks.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Walk through omicverse's single-cell preprocessing tutorials to QC PBMC3k data, normalise counts, detect HVGs, and run PCA/embedding pipelines on CPU, CPU–GPU mixed, or GPU stacks.
How to use
Przygotuj środowisko, importując omicverse i scanpy, a następnie ustaw standardowe style wykresów poleceniem
ov.plot_set(font_path='Arial'). W notebookach włącz autoreload (%load_ext autoreloadi%autoreload 2), aby zmiany w kodzie były natychmiast widoczne bez restartowania kernela.Pobierz przefiltrowaną macierz PBMC3k z 10x Genomics (plik
pbmc3k_filtered_gene_bc_matrices.tar.gz), rozpakuj ją w katalogudata/filtered_gene_bc_matrices/hg19/i załaduj za pomocąov.io.read_10x_mtx(..., var_names='gene_symbols').Wykonaj kontrolę jakości danych poleceniem
ov.pp.qc(adata, tresh={'mito_perc': 0.2, 'nUMIs': 500, 'detected_genes': 250}, doublets_method='scrublet')dla potoków CPU i CPU–GPU (na czystym GPU pomiń parametrdoublets_method). Przejrzyj wyniki i dostosuj progi filtrowania do swoich danych.Zachowaj surowe liczby przed transformacją, normalizuj dane, a następnie zidentyfikuj geny o wysokiej zmienności (HVG) przy użyciu funkcji dostępnych w omicverse.
Przeprowadź redukcję wymiarowości metodą PCA, skonstruuj graf sąsiedztwa i wygeneruj osadzenia UMAP lub tSNE. Wybierz potok obliczeniowy (CPU, mieszany CPU–GPU lub GPU) w zależności od rozmiaru danych i dostępnych zasobów.
Wyeksportuj wyniki do folderu
write/i przejrzyj wygenerowane wykresy, aby potwierdzić jakość przetworzonych danych.