esm
Comprehensive toolkit for protein language models including ESM3 (generative multimodal protein design across sequence, structure, and function) and ESM C (efficient protein embeddings and representations). Use this skill when working with protein sequences, structures, or
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Comprehensive toolkit for protein language models including ESM3 (generative multimodal protein design across sequence, structure, and function) and ESM C (efficient protein embeddings and representations). Use this skill when working with protein sequences, structures, or function prediction; designing novel proteins; generating protein embeddings; performing inverse folding; or conducting protein engineering tasks. Supports both local model usage and cloud-based Forge API for scalable inference.
How to use
Zainstaluj pakiet ESM i jego zależności (PyTorch, CUDA jeśli pracujesz lokalnie). Pobierz model ESM3 lub ESM C za pomocą predefiniowanych ścieżek (np. "esm3-sm-open-v1" dla wersji lokalnej lub "esm3-medium-2024-08" dla Forge API).
Aby generować sekwencje białek lokalnie, zaimportuj ESM3InferenceClient i załaduj model na GPU poleceniem
.to("cuda"). Utwórz obiekt ESMProtein z częściową sekwencją, gdzie znaki podkreślenia (_) oznaczają pozycje do uzupełnienia.Wywołaj metodę
model.generate()z konfiguracją GenerationConfig, określając tryb (np. "sequence" do generacji sekwencji) i liczbę kroków iteracji. Model zwróci uzupełnioną sekwencję białka.Dla pracy w chmurze zamiast lokalnego modelu użyj ESM3ForgeInferenceClient, połącz się z API Forge podając URL i identyfikator modelu, a następnie wykonaj generację w ten sam sposób — interfejs API obsługuje te same operacje.
Eksperymentuj z różnymi konfiguracjami: zmień liczbę kroków generacji, spróbuj różnych trybów (struktura, funkcja) lub użyj modelu ESM C do obliczania osadzań dla istniejących sekwencji białek bez generacji nowych.
Dla zadań inżynierii białkowej (odwrotne składanie, projektowanie wariantów) przygotuj dane wejściowe w formacie ESMProtein i iteracyjnie refine wyniki, dostosowując parametry GenerationConfig na podstawie otrzymanych rezultatów.