model-merging
Merge multiple fine-tuned models using mergekit to combine capabilities without retraining. Use when creating specialized models by blending domain-specific expertise (math + coding + chat), improving performance beyond single models, or experimenting rapidly with model
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Merge multiple fine-tuned models using mergekit to combine capabilities without retraining. Use when creating specialized models by blending domain-specific expertise (math + coding + chat), improving performance beyond single models, or experimenting rapidly with model variants. Covers SLERP, TIES-Merging, DARE, Task Arithmetic, linear merging, and production deployment strategies.
How to use
Zainstaluj mergekit, klonując repozytorium z GitHub (https://github.com/arcee-ai/mergekit.git), wchodząc do folderu i uruchamiając
pip install -e ., lub zainstaluj bezpośrednio przez pip:pip install mergekit. Opcjonalnie zainstaluj bibliotekę transformers i torch:pip install transformers torch.Przygotuj plik konfiguracyjny w formacie YAML (np. config.yml), w którym zdefiniujesz metodę merowania (linear, SLERP, TIES-Merging, DARE lub Task Arithmetic), listę modeli do połączenia z ich wagami oraz typ danych (np. bfloat16). Przykład: ustaw merge_method na "linear", dodaj dwa modele z wagą 0.5 każdy.
Uruchom mergekit z linią poleceń, używając komendy
mergekit-yaml config.yml ./merged_model, gdzie config.yml to Twój plik konfiguracyjny, a ./merged_model to ścieżka wyjściowa dla połączonego modelu.Czekaj na zakończenie procesu merowania — zajmuje to zwykle kilka minut na CPU, w zależności od rozmiaru modeli i wybranej metody.
Zweryfikuj wynik, testując połączony model na swoich danych testowych, aby potwierdzić, że uzyskałeś oczekiwane połączenie możliwości z oryginalnych modeli.