vector-index-tuning
Optimize vector index performance for latency, recall, and memory. Use when tuning HNSW parameters, selecting quantization strategies, or scaling vector search infrastructure.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Optimize vector index performance for latency, recall, and memory. Use when tuning HNSW parameters, selecting quantization strategies, or scaling vector search infrastructure.
How to use
Zainstaluj umiejętność w swoim środowisku agenta – pobierz pliki z repozytorium wshobson/agents w katalogu skills/vector-index-tuning.
Przygotuj dane wejściowe: zbiór wektorów (np. embeddingi tekstowe), zestaw zapytań testowych oraz dane referencyjne (ground truth) do oceny dokładności wyszukiwania.
Wybierz typ indeksu na podstawie rozmiaru danych – dla poniżej 10 tys. wektorów użyj Flat (wyszukiwanie dokładne), dla 10 tys.–1 mln wektorów HNSW, dla większych zbiorów dodaj kwantyzację lub przejdź na IVF+PQ.
Uruchom benchmarking parametrów HNSW, testując różne wartości M (liczba połączeń na węzeł), efConstruction (jakość budowy indeksu) i efSearch (jakość wyszukiwania) – wyższa wartość M i ef daje lepszą dokładność, ale więcej pamięci i wolniej.
Porównaj strategie kwantyzacji (FP32, FP16, INT8, Product Quantization, Binary) – każda zmniejsza rozmiar indeksu, ale wpływa na dokładność wyników.
Wdróż wybraną konfigurację w produkcji i monitoruj opóźnienia wyszukiwania oraz recall (procent poprawnie znalezionych wyników) – dostrajaj parametry na podstawie rzeczywistych metryk.