computer-vision-expert

Name: computer-vision-expert
Author: sickn33

SOTA Computer Vision Expert (2026). Specialized in YOLO26, Segment Anything 3 (SAM 3), Vision Language Models, and real-time spatial analysis.

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author: sickn33
Category: DevOps
Views: 35

GitHub repo

About this skill

SOTA Computer Vision Expert (2026). Specialized in YOLO26, Segment Anything 3 (SAM 3), Vision Language Models, and real-time spatial analysis.

How to use

Zainstaluj umiejętność w swoim agencie Claude/Copilot, wskazując repozytorium GitHub sickn33/antigravity-awesome-skills. Umiejętność będzie dostępna jako narzędzie do analizy wizji komputerowej.
Przygotuj zadanie związane z detekcją obiektów lub segmentacją. Jeśli chcesz pracować z YOLO26, opisz wymagania dotyczące wydajności (np. detekcja w czasie rzeczywistym na urządzeniu brzegowym, małe obiekty w scenach przemysłowych).
Dla detekcji w czasie rzeczywistym poproś eksperta o optymalizację architektur bez NMS, wybór odpowiedniego optymalizatora (MuSGD) i strategii przydzielania (STAL) dla precyzji małych obiektów.
Dla segmentacji tekstowej wykorzystaj SAM 3 — opisz obiekty naturalnym językiem (np. "niebieski kontener po prawej") lub podaj obrazy do segmentacji. Ekspert zasugeruje, czy użyć 2D, 3D czy trybu śledzenia.
Jeśli potrzebujesz zrozumienia sceny lub odpowiedzi na pytania o zawartość obrazu, użyj Vision Language Models (Florence-2, PaliGemma 2, Qwen2-VL). Poproś eksperta o wybór modelu i prompt engineering.
Dla wdrożenia na urządzeniach brzegowych (IoT, NPU) poproś o optymalizację poprzez ONNX, TensorRT lub konwersję do formatu mobilnego. Ekspert doradzí redukcję latencji i dostosowanie do ograniczeń sprzętu.

Related skills

grafana-dashboards

by wshobson

Create and manage production Grafana dashboards for real-time visualization of system and application metrics. Use when building monitoring dashboards, visualizing metrics, or creating operational observability interfaces.

DevOps

92262

clawhub

by openclaw

Use the ClawHub CLI to search, install, update, and publish agent skills from clawhub.com. Use when you need to fetch new skills on the fly, sync installed skills to latest or a specific version, or publish new/updated skill folders with the npm-installed clawhub CLI.

DevOps

14106

trello

by openclaw

Manage Trello boards, lists, and cards via the Trello REST API.

DevOps

23107

chrome-devtools

by mrgoonie

Browser automation, debugging, and performance analysis using Puppeteer CLI scripts. Use for automating browsers, taking screenshots, analyzing performance, monitoring network traffic, web scraping, form automation, and JavaScript debugging.

DevOps

29141

3d-games

by davila7

3D game development principles. Rendering, shaders, physics, cameras.

DevOps

1355

task-master

by sfc-gh-dflippo

AI-powered task management for structured, specification-driven development. Use this skill when you need to manage complex projects with PRDs, break down tasks into subtasks, track dependencies, and maintain organized development workflows across features and branches.

DevOps

14126