siliconflow-vision
图片识别与分析工具。使用视觉大模型识别图片内容,输出详细客观的识别结果供主模型分析。当用户发图片时,主模型必须直接调用此 skill,然后基于识别结果进行分析和回答。支持 SiliconFlow(默认)、OpenAI、Anthropic 等多服务商。
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
图片识别与分析工具。使用视觉大模型识别图片内容,输出详细客观的识别结果供主模型分析。当用户发图片时,主模型必须直接调用此 skill,然后基于识别结果进行分析和回答。支持 SiliconFlow(默认)、OpenAI、Anthropic 等多服务商。
How to use
Zainstaluj skill w swoim środowisku agenta Claude/Codex/Copilot, upewniając się, że masz dostęp do repozytorium openclaw/skills i folderu siliconflow-vision.
Skonfiguruj klucze API w pliku config/default.json dla wybranego dostawcy usług. Domyślnie używany jest SiliconFlow z kluczem siliconflow_api_key, ale możesz również skonfigurować openai_api_key dla OpenAI lub anthropic_api_key dla Anthropic.
Gdy użytkownik przesyła obraz, agent główny powinien automatycznie wywołać skill za pomocą polecenia: python scripts/analyze_image.py /ścieżka/do/obrazu.jpg
Dla bardziej precyzyjnej analizy złożonych obrazów, wykresów lub memów użyj trybu inteligentnego: python scripts/analyze_image.py obraz.png -m smart. Tryb ten zajmuje więcej czasu (~2 minuty), ale zapewnia dokładniejsze wyniki.
Jeśli chcesz dostosować pytanie do konkretnego zadania, dodaj parametr -q, na przykład: python scripts/analyze_image.py zdjęcie.jpg -q "Wyodrębnij cały tekst z obrazu". Możesz również użyć flagi -s dla skróconego wyjścia lub --provider openai aby zmienić dostawcę.
Agent główny analizuje wyniki zwrócone przez skill i na ich podstawie udziela odpowiedzi użytkownikowi. Skill dostarcza tylko rozpoznawanie; analiza, wnioskowanie i odpowiadanie na pytania pozostają zadaniem agenta głównego.