Toolverse
All skills

scanpy

by davila7

Single-cell RNA-seq analysis. Load .h5ad/10X data, QC, normalization, PCA/UMAP/t-SNE, Leiden clustering, marker genes, cell type annotation, trajectory, for scRNA-seq analysis.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
davila7
Category
Data Science

About this skill

Single-cell RNA-seq analysis. Load .h5ad/10X data, QC, normalization, PCA/UMAP/t-SNE, Leiden clustering, marker genes, cell type annotation, trajectory, for scRNA-seq analysis.

How to use

  1. Zainstaluj Scanpy razem z jego zależnościami (numpy, pandas, matplotlib) w swoim środowisku Python. Upewnij się, że masz dostęp do biblioteki AnnData, która stanowi podstawę struktury danych w Scanpy.

  2. Przygotuj swoje dane w jednym z obsługiwanych formatów: .h5ad (natywny format AnnData), 10X Genomics (pliki .h5 lub macierz mtx), lub CSV. Jeśli posiadasz dane z 10X, użyj funkcji sc.read_10x_h5() lub sc.read_10x_mtx() do załadowania; dla plików .h5ad użyj sc.read_h5ad(); dla CSV użyj sc.read_csv().

  3. Załaduj dane do obiektu AnnData i skonfiguruj ustawienia Scanpy (verbosity, parametry rysunków, katalog wyjściowy). Obiekt AnnData zawiera macierz ekspresji (X), metadane komórek (obs), metadane genów (var) oraz wyniki analiz (obsm, uns).

  4. Przeprowadź kontrolę jakości i normalizację danych, aby przygotować je do analiz. Scanpy udostępnia funkcje do filtrowania komórek i genów, normalizacji liczb odczytów oraz transformacji logarytmicznej.

  5. Zastosuj redukcję wymiarowości, wybierając spośród PCA, UMAP lub t-SNE, aby zwizualizować strukturę danych. Następnie wykonaj klasterowanie Leiden, aby zidentyfikować grupy komórek o podobnych profilach ekspresji genów.

  6. Zidentyfikuj geny markerowe dla każdego klastra, dokonaj anotacji typów komórek na podstawie ekspresji znanych markerów, i jeśli jest to istotne, przeprowadź analizę trajektorii do badania zmian biologicznych między komórkami.

Related skills