scanpy
Single-cell RNA-seq analysis. Load .h5ad/10X data, QC, normalization, PCA/UMAP/t-SNE, Leiden clustering, marker genes, cell type annotation, trajectory, for scRNA-seq analysis.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Single-cell RNA-seq analysis. Load .h5ad/10X data, QC, normalization, PCA/UMAP/t-SNE, Leiden clustering, marker genes, cell type annotation, trajectory, for scRNA-seq analysis.
How to use
Zainstaluj Scanpy razem z jego zależnościami (numpy, pandas, matplotlib) w swoim środowisku Python. Upewnij się, że masz dostęp do biblioteki AnnData, która stanowi podstawę struktury danych w Scanpy.
Przygotuj swoje dane w jednym z obsługiwanych formatów: .h5ad (natywny format AnnData), 10X Genomics (pliki .h5 lub macierz mtx), lub CSV. Jeśli posiadasz dane z 10X, użyj funkcji sc.read_10x_h5() lub sc.read_10x_mtx() do załadowania; dla plików .h5ad użyj sc.read_h5ad(); dla CSV użyj sc.read_csv().
Załaduj dane do obiektu AnnData i skonfiguruj ustawienia Scanpy (verbosity, parametry rysunków, katalog wyjściowy). Obiekt AnnData zawiera macierz ekspresji (X), metadane komórek (obs), metadane genów (var) oraz wyniki analiz (obsm, uns).
Przeprowadź kontrolę jakości i normalizację danych, aby przygotować je do analiz. Scanpy udostępnia funkcje do filtrowania komórek i genów, normalizacji liczb odczytów oraz transformacji logarytmicznej.
Zastosuj redukcję wymiarowości, wybierając spośród PCA, UMAP lub t-SNE, aby zwizualizować strukturę danych. Następnie wykonaj klasterowanie Leiden, aby zidentyfikować grupy komórek o podobnych profilach ekspresji genów.
Zidentyfikuj geny markerowe dla każdego klastra, dokonaj anotacji typów komórek na podstawie ekspresji znanych markerów, i jeśli jest to istotne, przeprowadź analizę trajektorii do badania zmian biologicznych między komórkami.