Toolverse
All skills

molfeat

by davila7

Molecular featurization for ML (100+ featurizers). ECFP, MACCS, descriptors, pretrained models (ChemBERTa), convert SMILES to features, for QSAR and molecular ML.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
davila7
Category
Data Science
Views
3

About this skill

Molecular featurization for ML (100+ featurizers). ECFP, MACCS, descriptors, pretrained models (ChemBERTa), convert SMILES to features, for QSAR and molecular ML.

How to use

  1. Zainstaluj molfeat za pomocą menedżera pakietów: uruchom uv pip install molfeat. Jeśli potrzebujesz pełnego zestawu featurizerów (w tym modele transformerów takie jak ChemBERTa), użyj uv pip install "molfeat[all]". Dla konkretnych modeli możesz zainstalować tylko potrzebne zależności, np. molfeat[transformer] dla modeli opartych na transformerach.
  2. Zaimportuj klasę Calculator z molfeat.calc – to główny interfejs do featuryzacji. Calculatory to obiekty, które konwertują pojedyncze molekuły na wektory cech. Mogą przyjmować zarówno obiekty RDKit Chem.Mol jak i łańcuchy SMILES.
  3. Wybierz odpowiedni featurizer w zależności od zadania: dla QSAR i predykcji właściwości użyj deskryptorów molekularnych lub ECFP, dla głębokich sieci neuronowych rozważ pretrenowane embeddingi takie jak ChemBERTa, dla wirtualnego screeningu i wyszukiwania podobieństwa użyj fingerprint'ów takich jak MACCS.
  4. Utwórz instancję wybranego calculatora i przekaż mu molekułę lub SMILES: features = calculator(smiles_string). Wynik to wektor numeryczny gotowy do użycia w modelu uczenia maszynowego.
  5. Jeśli przetwarzasz wiele molekuł, skorzystaj z wbudowanego przetwarzania równoległego i pamięci podręcznej – molfeat automatycznie optymalizuje wydajność dla dużych zbiorów danych.
  6. Zintegruj otrzymane cechy z pipelineami scikit-learn lub frameworkami do głębokich sieci neuronowych (TensorFlow, PyTorch) w zależności od wybranego algorytmu uczenia maszynowego.

Related skills

data-storytelling

by wshobson

Transform data into compelling narratives using visualization, context, and persuasive structure. Use when presenting analytics to stakeholders, creating data reports, or building executive presentations.

Data Science
26105

deepwiki-rs

by sopaco

AI-powered Rust documentation generation engine for comprehensive codebase analysis, C4 architecture diagrams, and automated technical documentation. Use when Claude needs to analyze source code, understand software architecture, generate technical specs, or create professional

Data Science
18144

web-artifacts-builder

by anthropics

Suite of tools for creating elaborate, multi-component claude.ai HTML artifacts using modern frontend web technologies (React, Tailwind CSS, shadcn/ui). Use for complex artifacts requiring state management, routing, or shadcn/ui components - not for simple single-file HTML/JSX

Data Science
37124

market-research-reports

by davila7

Generate comprehensive market research reports (50+ pages) in the style of top consulting firms (McKinsey, BCG, Gartner). Features professional LaTeX formatting, extensive visual generation with scientific-schematics and generate-image, deep integration with research-lookup for

Data Science
16115

xlsx

by anthropics

Comprehensive spreadsheet creation, editing, and analysis with support for formulas, formatting, data analysis, and visualization. When Claude needs to work with spreadsheets (.xlsx, .xlsm, .csv, .tsv, etc) for: (1) Creating new spreadsheets with formulas and formatting, (2)

Data Science
40128

docx

by anthropics

Comprehensive document creation, editing, and analysis with support for tracked changes, comments, formatting preservation, and text extraction. When Claude needs to work with professional documents (.docx files) for: (1) Creating new documents, (2) Modifying or editing content,

Data Science
39142