hugging-face-datasets
Create and manage datasets on Hugging Face Hub. Supports initializing repos, defining configs/system prompts, streaming row updates, and SQL-based dataset querying/transformation. Designed to work alongside HF MCP server for comprehensive dataset workflows.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Create and manage datasets on Hugging Face Hub. Supports initializing repos, defining configs/system prompts, streaming row updates, and SQL-based dataset querying/transformation. Designed to work alongside HF MCP server for comprehensive dataset workflows.
How to use
Zainstaluj wymagane zależności: huggingface_hub, duckdb oraz datasets. Skill wymaga również bibliotek wbudowanych json i time, które są dostępne domyślnie.
Zainicjuj nowy zbiór danych na Hub, podając nazwę repozytorium i strukturę katalogów. Skill automatycznie utworzy odpowiednią strukturę projektu i przygotuje repozytorium do pracy.
Skonfiguruj zbiór danych, definiując metadane, system prompty i inne parametry konfiguracyjne. Zapisane ustawienia będą dostępne dla wszystkich przyszłych operacji na tym zbiorze.
Dodawaj nowe wiersze danych za pomocą funkcji streamingu, która pozwala na efektywne aktualizacje bez konieczności pobierania i przesyłania całego zbioru danych.
Wykonuj zapytania SQL na zbiorach danych za pośrednictwem menedżera SQL (scripts/sql_manager.py). Możesz odkrywać schemat, pobierać próbki, wykonywać agregacje, filtrować i transformować dane, a następnie zapisywać wyniki lokalnie lub wysyłać je do nowych repozytoriów na Hub.
Dla złożonych przepływów pracy używaj tego skilla do edycji i transformacji danych, a serwer MCP Hugging Face do wyszukiwania i pobierania metadanych zbiorów.