Toolverse
All skills

esm

by davila7

Comprehensive toolkit for protein language models including ESM3 (generative multimodal protein design across sequence, structure, and function) and ESM C (efficient protein embeddings and representations). Use this skill when working with protein sequences, structures, or

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
davila7
Category
DevOps
Views
47

About this skill

Comprehensive toolkit for protein language models including ESM3 (generative multimodal protein design across sequence, structure, and function) and ESM C (efficient protein embeddings and representations). Use this skill when working with protein sequences, structures, or function prediction; designing novel proteins; generating protein embeddings; performing inverse folding; or conducting protein engineering tasks. Supports both local model usage and cloud-based Forge API for scalable inference.

How to use

  1. Zainstaluj pakiet ESM i jego zależności (PyTorch, CUDA jeśli pracujesz lokalnie). Pobierz model ESM3 lub ESM C za pomocą predefiniowanych ścieżek (np. "esm3-sm-open-v1" dla wersji lokalnej lub "esm3-medium-2024-08" dla Forge API).

  2. Aby generować sekwencje białek lokalnie, zaimportuj ESM3InferenceClient i załaduj model na GPU poleceniem .to("cuda"). Utwórz obiekt ESMProtein z częściową sekwencją, gdzie znaki podkreślenia (_) oznaczają pozycje do uzupełnienia.

  3. Wywołaj metodę model.generate() z konfiguracją GenerationConfig, określając tryb (np. "sequence" do generacji sekwencji) i liczbę kroków iteracji. Model zwróci uzupełnioną sekwencję białka.

  4. Dla pracy w chmurze zamiast lokalnego modelu użyj ESM3ForgeInferenceClient, połącz się z API Forge podając URL i identyfikator modelu, a następnie wykonaj generację w ten sam sposób — interfejs API obsługuje te same operacje.

  5. Eksperymentuj z różnymi konfiguracjami: zmień liczbę kroków generacji, spróbuj różnych trybów (struktura, funkcja) lub użyj modelu ESM C do obliczania osadzań dla istniejących sekwencji białek bez generacji nowych.

  6. Dla zadań inżynierii białkowej (odwrotne składanie, projektowanie wariantów) przygotuj dane wejściowe w formacie ESMProtein i iteracyjnie refine wyniki, dostosowując parametry GenerationConfig na podstawie otrzymanych rezultatów.

Related skills