datamol
Pythonic wrapper around RDKit with simplified interface and sensible defaults. Preferred for standard drug discovery: SMILES parsing, standardization, descriptors, fingerprints, clustering, 3D conformers, parallel processing. Returns native rdkit.Chem.Mol objects. For advanced
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Pythonic wrapper around RDKit with simplified interface and sensible defaults. Preferred for standard drug discovery: SMILES parsing, standardization, descriptors, fingerprints, clustering, 3D conformers, parallel processing. Returns native rdkit.Chem.Mol objects. For advanced control or custom parameters, use rdkit directly.
How to use
Zainstaluj datamol za pomocą menedżera pakietów: uruchom w terminalu
uv pip install datamol. Po instalacji zaimportuj bibliotekę w swoim skrypcie Pythona:import datamol as dm.Konwertuj łańcuchy SMILES na obiekty molekularne. Użyj
dm.to_mol("CCO")aby sparsować pojedynczą cząsteczkę (tutaj etanol). Jeśli SMILES jest nieprawidłowy, funkcja zwraca None — zawsze sprawdzaj wynik przed dalszą pracą.Przetwarzaj listy cząsteczek pętlą:
mols = [dm.to_mol(smi) for smi in smiles_list]. W ten sposób szybko konwertujesz wiele SMILES na obiekty molekularne gotowe do analizy.Konwertuj molekuły z powrotem do różnych formatów tekstowych. Użyj
dm.to_smiles(mol)dla kanonicznego SMILES,dm.to_smiles(mol, isomeric=True)jeśli chcesz zachować stereochemię, lubdm.to_inchi(mol)idm.to_inchikey(mol)dla formatów InChI.Stosuj zaawansowane operacje takie jak standaryzacja struktur, obliczanie deskryptorów, generowanie odcisków palców czy klasteryzacja — wszystkie funkcje dostępne w module dm. Zwracane obiekty to natywne RDKit, więc możesz je dalej przetwarzać standardowymi narzędziami RDKit jeśli potrzebujesz pełnej kontroli.