Toolverse
All skills

book-sft-pipeline

by muratcankoylan

This skill should be used when the user asks to \

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Category
DevOps
Views
17

About this skill

This skill should be used when the user asks to \

How to use

  1. Przygotuj plik ePub z książką, którą chcesz wykorzystać do treningu. Upewnij się, że plik jest dostępny w formacie ePub i zawiera tekst, który chcesz analizować.

  2. Aktywuj umiejętność, gdy chcesz wykonać jedno z następujących zadań: wyodrębnić tekst z książki, stworzyć zestaw danych SFT, trenować model naśladujący styl autora, przeprowadzić segmentację tekstu lub przygotować dane do treningu LoRA.

  3. Pozwól orchestratorowi zarządzać fazami pipeline'u. System automatycznie wyodrębni tekst z ePuba, podzieli go na fragmenty o długości 150–400 słów na naturalnych granicach (koniec akapitu, zdania), aby uniknąć fragmentarycznych wyników.

  4. Zezwól na generowanie instrukcji treningowych. Pipeline użyje co najmniej 15 różnych szablonów promptów i 5 wariantów system promptów, aby zapobiec memoryzacji i nauczyć model autentycznego stylu pisarskiego.

  5. Przygotuj dane do treningu na platformach takich jak Tinker. Wygenerowany zestaw danych będzie zawierać pary instrukcja–odpowiedź, gdzie odpowiedzi odzwierciedlają styl autora bez dosłownego cytowania tekstu.

  6. Uruchom trening małego modelu (8B parametrów lub mniej) na przygotowanym zestawie. Model nauczy się rytmu, słownictwa i charakterystycznych wzorców pisarskich, umożliwiając generowanie tekstu w głosie wybranego autora.

Related skills