V
v3-performance-optimization
Achieve aggressive v3 performance targets: 2.49x-7.47x Flash Attention speedup, 150x-12,500x search improvements, 50-75% memory reduction. Comprehensive benchmarking and optimization suite.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Achieve aggressive v3 performance targets: 2.49x-7.47x Flash Attention speedup, 150x-12,500x search improvements, 50-75% memory reduction. Comprehensive benchmarking and optimization suite.
How to use
- Zainicjuj optymalizację wydajności, uruchamiając zadanie "Performance baseline" w roli v3-performance-engineer — ustanowi to punkt odniesienia dla benchmarków v2, od którego będziesz mierzyć postęp. 2. Uruchom równolegle trzy zadania walidacyjne: pierwsze sprawdzi osiągnięcie przyspieszenia Flash Attention (cel 2,49x–7,47x), drugie zwaliduje poprawę wyszukiwania poprzez indeksowanie HNSW (cel 150x–12 500x), trzecie zmierzy redukcję zużycia pamięci (cel 50–75%). 3. Monitoruj wyniki benchmarków dla każdego obszaru — narzędzie dostarcza metryki takie jak opóźnienie poniżej 1 milisekundy dla atencji oraz czas odpowiedzi poniżej 100 ms dla wyszukiwania w zbiorach 1M+ wpisów. 4. Przeanalizuj raport z benchmarków, aby zidentyfikować wąskie gardła — porównaj wyniki v3 z ustanowionym wcześniej baseline'em v2 i sprawdź, które obszary osiągnęły cele optymalizacji. 5. Iteruj nad konfiguracją systemu na podstawie wyników — dostosuj parametry Flash Attention i ustawienia indeksowania HNSW, a następnie ponownie uruchom benchmarki, aby potwierdzić poprawę wydajności.