Toolverse
All skills

hugging-face-datasets

by patchy631

Create and manage datasets on Hugging Face Hub. Supports initializing repos, defining configs/system prompts, streaming row updates, and SQL-based dataset querying/transformation. Designed to work alongside HF MCP server for comprehensive dataset workflows.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
patchy631
Category
Data Science
Views
2

About this skill

Create and manage datasets on Hugging Face Hub. Supports initializing repos, defining configs/system prompts, streaming row updates, and SQL-based dataset querying/transformation. Designed to work alongside HF MCP server for comprehensive dataset workflows.

How to use

  1. Zainstaluj wymagane zależności: huggingface_hub, duckdb oraz datasets. Skill wymaga również bibliotek wbudowanych json i time, które są dostępne domyślnie.

  2. Zainicjuj nowy zbiór danych na Hub, podając nazwę repozytorium i strukturę katalogów. Skill automatycznie utworzy odpowiednią strukturę projektu i przygotuje repozytorium do pracy.

  3. Skonfiguruj zbiór danych, definiując metadane, system prompty i inne parametry konfiguracyjne. Zapisane ustawienia będą dostępne dla wszystkich przyszłych operacji na tym zbiorze.

  4. Dodawaj nowe wiersze danych za pomocą funkcji streamingu, która pozwala na efektywne aktualizacje bez konieczności pobierania i przesyłania całego zbioru danych.

  5. Wykonuj zapytania SQL na zbiorach danych za pośrednictwem menedżera SQL (scripts/sql_manager.py). Możesz odkrywać schemat, pobierać próbki, wykonywać agregacje, filtrować i transformować dane, a następnie zapisywać wyniki lokalnie lub wysyłać je do nowych repozytoriów na Hub.

  6. Dla złożonych przepływów pracy używaj tego skilla do edycji i transformacji danych, a serwer MCP Hugging Face do wyszukiwania i pobierania metadanych zbiorów.

Related skills

quant-analyst

by zenobi-us

Expert quantitative analyst specializing in financial modeling, algorithmic trading, and risk analytics. Masters statistical methods, derivatives pricing, and high-frequency trading with focus on mathematical rigor, performance optimization, and profitable strategy development.

Data Science
67217

prompt-optimizer

by solatis

Optimize system prompts for Claude Code agents using proven prompt engineering patterns. Use when users request prompt improvement, optimization, or refinement for agent workflows, tool instructions, or system behaviors.

Data Science
15109

pdf-processing

by Ming-Kai-LC

Comprehensive PDF processing techniques for handling large files that exceed Claude Code's reading limits, including chunking strategies, text/table extraction, and OCR for scanned documents. Use when working with PDFs larger than 10-15MB or more than 30-50 pages.

Data Science
23134

xlsx

by anthropics

Comprehensive spreadsheet creation, editing, and analysis with support for formulas, formatting, data analysis, and visualization. When Claude needs to work with spreadsheets (.xlsx, .xlsm, .csv, .tsv, etc) for: (1) Creating new spreadsheets with formulas and formatting, (2)

Data Science
40128

pdf

by anthropics

Comprehensive PDF manipulation toolkit for extracting text and tables, creating new PDFs, merging/splitting documents, and handling forms. When Claude needs to fill in a PDF form or programmatically process, generate, or analyze PDF documents at scale.

Data Science
31144

docx

by anthropics

Comprehensive document creation, editing, and analysis with support for tracked changes, comments, formatting preservation, and text extraction. When Claude needs to work with professional documents (.docx files) for: (1) Creating new documents, (2) Modifying or editing content,

Data Science
39142