computer-vision-expert
SOTA Computer Vision Expert (2026). Specialized in YOLO26, Segment Anything 3 (SAM 3), Vision Language Models, and real-time spatial analysis.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
SOTA Computer Vision Expert (2026). Specialized in YOLO26, Segment Anything 3 (SAM 3), Vision Language Models, and real-time spatial analysis.
How to use
Zainstaluj umiejętność w swoim agencie Claude/Copilot, wskazując repozytorium GitHub sickn33/antigravity-awesome-skills. Umiejętność będzie dostępna jako narzędzie do analizy wizji komputerowej.
Przygotuj zadanie związane z detekcją obiektów lub segmentacją. Jeśli chcesz pracować z YOLO26, opisz wymagania dotyczące wydajności (np. detekcja w czasie rzeczywistym na urządzeniu brzegowym, małe obiekty w scenach przemysłowych).
Dla detekcji w czasie rzeczywistym poproś eksperta o optymalizację architektur bez NMS, wybór odpowiedniego optymalizatora (MuSGD) i strategii przydzielania (STAL) dla precyzji małych obiektów.
Dla segmentacji tekstowej wykorzystaj SAM 3 — opisz obiekty naturalnym językiem (np. "niebieski kontener po prawej") lub podaj obrazy do segmentacji. Ekspert zasugeruje, czy użyć 2D, 3D czy trybu śledzenia.
Jeśli potrzebujesz zrozumienia sceny lub odpowiedzi na pytania o zawartość obrazu, użyj Vision Language Models (Florence-2, PaliGemma 2, Qwen2-VL). Poproś eksperta o wybór modelu i prompt engineering.
Dla wdrożenia na urządzeniach brzegowych (IoT, NPU) poproś o optymalizację poprzez ONNX, TensorRT lub konwersję do formatu mobilnego. Ekspert doradzí redukcję latencji i dostosowanie do ograniczeń sprzętu.