Toolverse
All skills

computer-vision-expert

by sickn33

SOTA Computer Vision Expert (2026). Specialized in YOLO26, Segment Anything 3 (SAM 3), Vision Language Models, and real-time spatial analysis.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
sickn33
Category
DevOps
Views
35

About this skill

SOTA Computer Vision Expert (2026). Specialized in YOLO26, Segment Anything 3 (SAM 3), Vision Language Models, and real-time spatial analysis.

How to use

  1. Zainstaluj umiejętność w swoim agencie Claude/Copilot, wskazując repozytorium GitHub sickn33/antigravity-awesome-skills. Umiejętność będzie dostępna jako narzędzie do analizy wizji komputerowej.

  2. Przygotuj zadanie związane z detekcją obiektów lub segmentacją. Jeśli chcesz pracować z YOLO26, opisz wymagania dotyczące wydajności (np. detekcja w czasie rzeczywistym na urządzeniu brzegowym, małe obiekty w scenach przemysłowych).

  3. Dla detekcji w czasie rzeczywistym poproś eksperta o optymalizację architektur bez NMS, wybór odpowiedniego optymalizatora (MuSGD) i strategii przydzielania (STAL) dla precyzji małych obiektów.

  4. Dla segmentacji tekstowej wykorzystaj SAM 3 — opisz obiekty naturalnym językiem (np. "niebieski kontener po prawej") lub podaj obrazy do segmentacji. Ekspert zasugeruje, czy użyć 2D, 3D czy trybu śledzenia.

  5. Jeśli potrzebujesz zrozumienia sceny lub odpowiedzi na pytania o zawartość obrazu, użyj Vision Language Models (Florence-2, PaliGemma 2, Qwen2-VL). Poproś eksperta o wybór modelu i prompt engineering.

  6. Dla wdrożenia na urządzeniach brzegowych (IoT, NPU) poproś o optymalizację poprzez ONNX, TensorRT lub konwersję do formatu mobilnego. Ekspert doradzí redukcję latencji i dostosowanie do ograniczeń sprzętu.

Related skills