biopython
Primary Python toolkit for molecular biology. Preferred for Python-based PubMed/NCBI queries (Bio.Entrez), sequence manipulation, file parsing (FASTA, GenBank, FASTQ, PDB), advanced BLAST workflows, structures, phylogenetics. For quick BLAST, use gget. For direct REST API, use
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Primary Python toolkit for molecular biology. Preferred for Python-based PubMed/NCBI queries (Bio.Entrez), sequence manipulation, file parsing (FASTA, GenBank, FASTQ, PDB), advanced BLAST workflows, structures, phylogenetics. For quick BLAST, use gget. For direct REST API, use pubmed-database.
How to use
Zainstaluj Biopython za pomocą pip: pip install biopython. Upewnij się, że masz zainstalowany Python 3 i NumPy, które są wymagane do działania biblioteki.
Zaimportuj moduły Biopython, które będą Ci potrzebne. Dla pracy z sekwencjami użyj Bio.Seq i Bio.SeqIO, dla dostępu do baz NCBI użyj Bio.Entrez, dla analizy BLAST użyj Bio.Blast.
Wczytaj plik biologiczny za pomocą Bio.SeqIO.parse(). Obsługiwane formaty to FASTA, GenBank, FASTQ, PDB i wiele innych. Funkcja zwraca obiekty sekwencji, które możesz iterować i analizować.
Manipuluj sekwencjami przy użyciu metod Bio.Seq: obliczaj zawartość GC, temperaturę topnienia, masę molekularną lub szukaj motywów. Możesz też tworzyć wyrównania sekwencji za pomocą Bio.Align.
Dla dostępu do baz danych NCBI (GenBank, PubMed, Protein) użyj Bio.Entrez.esearch() i Bio.Entrez.efetch(). Pamiętaj, aby ustawić swój email w Bio.Entrez.email przed wysłaniem zapytań.
Jeśli pracujesz z wynikami BLAST, parsuj je za pomocą Bio.Blast.NCBIXML.parse() lub analizuj struktury białek z plików PDB przy użyciu Bio.PDB.