openrouter-performance-tuning
Optimize OpenRouter performance and latency. Use when reducing response times or improving throughput. Trigger with phrases like 'openrouter performance', 'openrouter latency', 'speed up openrouter', 'openrouter optimization'.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Optimize OpenRouter performance and latency. Use when reducing response times or improving throughput. Trigger with phrases like 'openrouter performance', 'openrouter latency', 'speed up openrouter', 'openrouter optimization'.
How to use
Zainstaluj umiejętność w swoim środowisku Claude Code, Codex lub OpenClaw, upewniając się że masz dostęp do narzędzi Read, Write, Edit, Bash i Grep.
Ustaw zmienną środowiskową OPENROUTER_API_KEY z Twoim kluczem API OpenRouter, a także nagłówki HTTP-Referer i X-Title wskazujące na Twoją aplikację.
Wyzwól umiejętność frazami takimi jak "openrouter performance", "openrouter latency", "speed up openrouter" lub "optimize openrouter throughput" — system automatycznie rozpozna zapytanie dotyczące optymalizacji.
Użyj funkcji benchmark_model() do pomiaru latencji wybranego modelu — narzędzie zwróci medianę (p50), percentyl 95 (p95), średnią, minimum i maksimum czasu odpowiedzi w milisekundach.
Na podstawie wyników benchmarku wybierz mniejszy model (szybszy), włącz streaming aby zmniejszyć TTFT, rozważ przetwarzanie równoległe dla wielu żądań i zmniejsz rozmiar promptu jeśli to możliwe.
Przetestuj konfigurację z rzeczywistymi zapytaniami, monitoruj czasy odpowiedzi i iteracyjnie dostrajaj routing dostawcy oraz parametry modelu aż osiągniesz docelową wydajność.