hugging-face-dataset-creator
Create and manage datasets on Hugging Face Hub. Supports initializing repos, defining configs/system prompts, and streaming row updates. Designed to work alongside HF MCP server for comprehensive dataset workflows.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Create and manage datasets on Hugging Face Hub. Supports initializing repos, defining configs/system prompts, and streaming row updates. Designed to work alongside HF MCP server for comprehensive dataset workflows.
How to use
Zainstaluj skill jako zależność w swoim projekcie Claude/Copilot. Upewnij się, że masz zainstalowane biblioteki huggingface_hub oraz dostęp do Hugging Face Hub (wymagane konto i token autoryzacyjny).
Zainicjuj nowy zbiór danych, podając nazwę repozytorium i strukturę katalogów. Skill automatycznie utworzy właściwe struktury folderów na Hugging Face Hub.
Zdefiniuj konfigurację zbioru danych, w tym schemat danych, system prompts i metadane. Możesz wybrać jeden z gotowych szablonów (rozmowy, klasyfikacja tekstu, pytania-odpowiedzi, uzupełnianie tekstu, dane tabelaryczne) lub utworzyć własny format.
Dodawaj wiersze danych za pomocą funkcji streamowania. Zamiast przesyłać cały zbiór naraz, możesz dodawać dane przyrostowo, co jest efektywne dla dużych zbiorów.
Skill automatycznie waliduje dane w formacie JSON i obsługuje błędy przesyłania. W przypadku konfliktów lub niepowodzeń, narzędzie gracefully obsługuje sytuacje i pozwala na ponowną próbę.
Dla złożonych przepływów pracy połącz ten skill z serwerem MCP Hugging Face: użyj serwera do wyszukiwania i pobierania metadanych zbiorów, a tego skilla do edycji zawartości i zarządzania konfiguracją.