使用 AI 理解和分析图片内容。Use when user wants to 理解图片, 分析图片, 图片识别, 看图说话, 图片问答, understand image, analyze image, describe image, image recognition, what is in this image, 这张图片是什么.
/plugin marketplace add InfQuest/vibe-ops-plugin/plugin install vibe-ops@vibe-opsThis skill inherits all available tools. When active, it can use any tool Claude has access to.
image-understand.js使用 Gemini 3 Pro Preview 通过 OpenRouter API 分析和理解图片内容。
OPENROUTER_API_KEY 环境变量install-app skill 来安装)你是一个图片理解助手,帮助用户分析和理解图片内容。请按以下步骤操作:
首先验证 OPENROUTER_API_KEY 是否已设置:
[ -n "$OPENROUTER_API_KEY" ] && echo "API_KEY_SET" || echo "API_KEY_NOT_SET"
如果未设置,直接报错退出:「缺少 OPENROUTER_API_KEY 环境变量,无法分析图片。」
which node && node --version || echo "NOT_INSTALLED"
如果未安装,使用 install-app skill 来安装 Node.js。
⚠️ 必须:使用 AskUserQuestion 工具收集用户的图片分析需求。不要跳过这一步。
使用 AskUserQuestion 工具收集以下信息:
图片路径:让用户提供要分析的图片
分析类型:用户想了解图片的什么内容
具体问题(如果用户选择"回答问题"或"其他"):
输出语言:
使用 skill 目录下的 image-understand.js 脚本:
node /path/to/skills/image-understand/image-understand.js "IMAGE_PATH" "PROMPT" "LANGUAGE"
参数说明:
根据用户选择的分析类型,使用以下 prompt:
描述图片:
请详细描述这张图片的内容,包括:
1. 图片的主要元素和对象
2. 场景和背景
3. 颜色、构图和风格
4. 任何值得注意的细节
识别文字(OCR):
请识别并提取这张图片中的所有文字内容。按照文字在图片中的位置,从上到下、从左到右进行整理输出。
回答问题: 使用用户输入的具体问题作为 prompt。
示例:
node skills/image-understand/image-understand.js "./photo.jpg" "请详细描述这张图片的内容" "chinese"
分析完成后:
API Key 无效:
图片加载失败:
分析结果不准确:
用户:帮我看看这张图片里有什么 ./photo.jpg
助手:
This skill should be used when the user asks to "create a slash command", "add a command", "write a custom command", "define command arguments", "use command frontmatter", "organize commands", "create command with file references", "interactive command", "use AskUserQuestion in command", or needs guidance on slash command structure, YAML frontmatter fields, dynamic arguments, bash execution in commands, user interaction patterns, or command development best practices for Claude Code.
This skill should be used when the user asks to "create an agent", "add an agent", "write a subagent", "agent frontmatter", "when to use description", "agent examples", "agent tools", "agent colors", "autonomous agent", or needs guidance on agent structure, system prompts, triggering conditions, or agent development best practices for Claude Code plugins.
This skill should be used when the user asks to "create a hook", "add a PreToolUse/PostToolUse/Stop hook", "validate tool use", "implement prompt-based hooks", "use ${CLAUDE_PLUGIN_ROOT}", "set up event-driven automation", "block dangerous commands", or mentions hook events (PreToolUse, PostToolUse, Stop, SubagentStop, SessionStart, SessionEnd, UserPromptSubmit, PreCompact, Notification). Provides comprehensive guidance for creating and implementing Claude Code plugin hooks with focus on advanced prompt-based hooks API.