Toolverse
All skills

single-cell-preprocessing-with-omicverse

by Starlitnightly

Walk through omicverse's single-cell preprocessing tutorials to QC PBMC3k data, normalise counts, detect HVGs, and run PCA/embedding pipelines on CPU, CPU–GPU mixed, or GPU stacks.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Category
DevOps

About this skill

Walk through omicverse's single-cell preprocessing tutorials to QC PBMC3k data, normalise counts, detect HVGs, and run PCA/embedding pipelines on CPU, CPU–GPU mixed, or GPU stacks.

How to use

  1. Przygotuj środowisko, importując omicverse i scanpy, a następnie ustaw standardowe style wykresów poleceniem ov.plot_set(font_path='Arial'). W notebookach włącz autoreload (%load_ext autoreload i %autoreload 2), aby zmiany w kodzie były natychmiast widoczne bez restartowania kernela.

  2. Pobierz przefiltrowaną macierz PBMC3k z 10x Genomics (plik pbmc3k_filtered_gene_bc_matrices.tar.gz), rozpakuj ją w katalogu data/filtered_gene_bc_matrices/hg19/ i załaduj za pomocą ov.io.read_10x_mtx(..., var_names='gene_symbols').

  3. Wykonaj kontrolę jakości danych poleceniem ov.pp.qc(adata, tresh={'mito_perc': 0.2, 'nUMIs': 500, 'detected_genes': 250}, doublets_method='scrublet') dla potoków CPU i CPU–GPU (na czystym GPU pomiń parametr doublets_method). Przejrzyj wyniki i dostosuj progi filtrowania do swoich danych.

  4. Zachowaj surowe liczby przed transformacją, normalizuj dane, a następnie zidentyfikuj geny o wysokiej zmienności (HVG) przy użyciu funkcji dostępnych w omicverse.

  5. Przeprowadź redukcję wymiarowości metodą PCA, skonstruuj graf sąsiedztwa i wygeneruj osadzenia UMAP lub tSNE. Wybierz potok obliczeniowy (CPU, mieszany CPU–GPU lub GPU) w zależności od rozmiaru danych i dostępnych zasobów.

  6. Wyeksportuj wyniki do folderu write/ i przejrzyj wygenerowane wykresy, aby potwierdzić jakość przetworzonych danych.

Related skills