Toolverse
All skills

bulktrajblend-trajectory-interpolation

by Starlitnightly

Extend scRNA-seq developmental trajectories with BulkTrajBlend by generating intermediate cells from bulk RNA-seq, training beta-VAE and GNN models, and interpolating missing states.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Category
Data Science
Views
2

About this skill

Extend scRNA-seq developmental trajectories with BulkTrajBlend by generating intermediate cells from bulk RNA-seq, training beta-VAE and GNN models, and interpolating missing states.

How to use

  1. Zainstaluj biblioteki wymagane: omicverse, scanpy, scvelo oraz funkcje pomocnicze. Zaimportuj omicverse jako ov i uruchom ov.plot_set() do konfiguracji wizualizacji. Załaduj referencyjne dane scRNA-seq (np. za pomocą scv.datasets.dentategyrus()) oraz surowe liczniki bulk RNA-seq, a następnie harmonizuj identyfikatory genów funkcją ov.bulk.Matrix_ID_mapping().

  2. Utwórz instancję BulkTrajBlend, przekazując dane bulk, dane single-cell oraz parametry grupowania. Określ bulk_group jako listę kolumn odpowiadających próbkom bulk (np. ['dg_d_1','dg_d_2','dg_d_3']) i wskaż klucz zawierający typy komórek (celltype_key='clusters'). Upewnij się, że dane bulk są w postaci surowych liczników, nie znormalizowanych.

  3. Skonfiguruj model beta-VAE, wywołując vae_configure() z parametrem cell_target_num określającym oczekiwaną liczbę komórek na klaster. Jeśli pominiesz ten argument, system automatycznie oszacuje wartości na podstawie metody TAPE.

  4. Wytrenuj model beta-VAE, podając parametry takie jak batch_size (np. 512), learning_rate (1e-4), hidden_size (256) i epoch_num (3500). Określ ścieżki zapisu dla modelu VAE i wygenerowanych komórek. Trening można wznowić, ładując wcześniej zapisany model funkcją vae_load().

  5. Wygeneruj brakujące stany komórek z próbek bulk, używając wytrenowanego modelu. Upewnij się, że używasz spójnych ziaren losowych, aby wyniki były powtarzalne.

  6. Interpoluj trajektorie, łącząc wygenerowane komórki z istniejącymi danymi scRNA-seq. Model GNN identyfikuje wspólnoty komórek i wypełnia przerwy w sekwencjach rozwojowych, tworząc pełną trajektorię.

Related skills