deepchem
Molecular machine learning toolkit. Property prediction (ADMET, toxicity), GNNs (GCN, MPNN), MoleculeNet benchmarks, pretrained models, featurization, for drug discovery ML.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Molecular machine learning toolkit. Property prediction (ADMET, toxicity), GNNs (GCN, MPNN), MoleculeNet benchmarks, pretrained models, featurization, for drug discovery ML.
How to use
Zainstaluj DeepChem za pomocą pip: pip install deepchem. Upewnij się, że masz Python 3.7+ i zainstalowane zależności (numpy, pandas, scikit-learn, TensorFlow lub PyTorch).
Przygotuj dane molekularne w formacie CSV zawierającym kolumnę SMILES (notacja molekuł) i kolumny z właściwościami do przewidywania (np. rozpuszczalność, toksyczność). Alternatywnie użyj pliku SDF lub FASTA dla sekwencji białek.
Załaduj dane za pomocą odpowiedniego loadera — dla CSV użyj CSVLoader z wybranym featurizerem (np. CircularFingerprint do konwersji SMILES na wektory cech), dla SDF użyj SDFLoader, dla białek FASTALoader.
Wybierz featurizer do konwersji molekuł na reprezentacje gotowe do uczenia maszynowego: CircularFingerprint dla odcisków palców, GraphConvFeaturizer dla grafów neuronowych, lub MoleculeNetFeaturizer dla benchmarków MoleculeNet.
Wytrenuj model na przygotowanym zbiorze danych — DeepChem oferuje gotowe architektury do przewidywania właściwości (GCN, MPNN, AttentiveFP) oraz dostęp do pretrenowanych modeli (ChemBERTa, GROVER, MolFormer) do transfer learningu.
Ewaluuj model na zbiorze testowym i użyj go do przewidywania właściwości nowych molekuł — zapisz wyniki i przeanalizuj, które cechy molekularne najbardziej wpływają na przewidywane właściwości.