Toolverse
All skills

geniml

by davila7

This skill should be used when working with genomic interval data (BED files) for machine learning tasks. Use for training region embeddings (Region2Vec, BEDspace), single-cell ATAC-seq analysis (scEmbed), building consensus peaks (universes), or any ML-based analysis of genomic

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
davila7
Category
Data Science
Views
2

About this skill

This skill should be used when working with genomic interval data (BED files) for machine learning tasks. Use for training region embeddings (Region2Vec, BEDspace), single-cell ATAC-seq analysis (scEmbed), building consensus peaks (universes), or any ML-based analysis of genomic regions. Applies to BED file collections, scATAC-seq data, chromatin accessibility datasets, and region-based genomic feature learning.

How to use

  1. Zainstaluj geniml za pomocą menedżera pakietów uv, uruchamiając polecenie uv pip install geniml. Jeśli planujesz używać zależności uczenia maszynowego (PyTorch i inne), zainstaluj wersję rozszerzoną: uv pip install 'geniml[ml]'.

  2. Przygotuj swoje pliki BED zawierające interwały genomowe, które chcesz analizować. Upewnij się, że dane są w standardowym formacie BED (kolumny: chromosom, początek, koniec, opcjonalnie dodatkowe informacje).

  3. Tokenizuj pliki BED, używając referencji wszechświata genomowego. Ten krok konwertuje interwały genomowe na tokeny, które mogą być przetwarzane przez model.

  4. Wytrenuj model Region2Vec na tokenizowanych danych, aby uzyskać embeddingi regionów genomowych. Model uczy się nienadzorowanych reprezentacji wektorowych, które odzwierciedlają podobieństwo między regionami na podstawie ich sąsiedztwa i kontekstu.

  5. Wygeneruj embeddingi dla swoich regionów i użyj ich do wyszukiwania podobieństwa, grupowania lub jako cech wejściowych do dalszych modeli uczenia maszynowego. Embeddingi mogą być również wykorzystane do analizy metadanych, jeśli pracujesz z danymi scATAC-seq lub innymi etykietami eksperymentalnymi.

  6. Zapoznaj się z dokumentacją referencyjną w pliku references/region2vec.md, aby poznać szczegółowe parametry, zaawansowane przepływy pracy i przykłady dostosowane do Twojego przypadku użycia.

Related skills

claude-automation-recommender

by anthropics

Analyze a codebase and recommend Claude Code automations (hooks, subagents, skills, plugins, MCP servers). Use when user asks for automation recommendations, wants to optimize their Claude Code setup, mentions improving Claude Code workflows, asks how to first set up Claude Code

Data Science
1787

threejs

by mrgoonie

Build 3D web apps with Three.js (WebGL/WebGPU). Use for 3D scenes, animations, custom shaders, PBR materials, VR/XR experiences, games, data visualizations, product configurators.

Data Science
1743

infographic-creation

by antvis

Create beautiful infographics based on the given text content. Use this when users request creating infographics.

Data Science
60199

last30days

by sickn33

Research a topic from the last 30 days on Reddit + X + Web, become an expert, and write copy-paste-ready prompts for the user's target tool.

Data Science
2148

nano-banana-pro

by garg-aayush

Generate and edit images using Google's Nano Banana Pro (Gemini 3 Pro Image) API. Use when the user asks to generate, create, edit, modify, change, alter, or update images. Also use when user references an existing image file and asks to modify it in any way (e.g., \

Data Science
535772

ml-paper-writing

by davila7

Write publication-ready ML/AI papers for NeurIPS, ICML, ICLR, ACL, AAAI, COLM. Use when drafting papers from research repos, structuring arguments, verifying citations, or preparing camera-ready submissions. Includes LaTeX templates, reviewer guidelines, and citation

Data Science
2681