Generates and edits images via GPT Image 2 using 80+ structured templates for posters, UI, products, infographics, diagrams, comics, avatars, workflows. Adapts to local Garden mode, host tools, or prompt advising.
npx claudepluginhub conardli/garden-skills --plugin knowledge-base-skillsThis skill uses the workspace's default tool permissions.
这是一个面向 GPT Image 2 的聚焦型技能,在 3 种运行环境下都能用,但行为差异显著。**第一步必须先确定当前运行模式**。
README.mdREADME.zh-CN.mdreferences/academic-figures/graphical-abstract.mdreferences/academic-figures/mechanism-diagram.mdreferences/academic-figures/method-pipeline-overview.mdreferences/academic-figures/multi-condition-comparison.mdreferences/academic-figures/neural-network-architecture.mdreferences/academic-figures/publication-chart.mdreferences/academic-figures/qualitative-comparison-grid.mdreferences/academic-figures/research-overview-poster.mdreferences/academic-figures/scientific-schematic.mdreferences/assets-and-props/game-screenshot-mockup.mdreferences/assets-and-props/retro-skeuomorphic-icons.mdreferences/avatars-and-profile/character-grid-portrait.mdreferences/avatars-and-profile/cultural-portrait-series.mdreferences/avatars-and-profile/sticker-set.mdreferences/avatars-and-profile/style-transfer-selfie.mdreferences/avatars-and-profile/themed-3d-icon.mdreferences/branding-and-packaging/beverage-label-design.mdreferences/branding-and-packaging/brand-identity-board.mdGenerates and edits images using OpenAI gpt-image-2 via CLI, Claude Code skill, and prompt gallery with 162 curated prompts for UI mockups, research figures, photography.
Generates AI images like thumbnails, logos, illustrations, posters, and profile pics using Codex CLI's /imagen. Auto-triggers on Korean/English requests such as '이미지 만들어줘' or 'create image'. Handles text rendering in images.
Generates images from text prompts and edits reference images using OpenAI gpt-image-2 via CLI. Supports restyling, combining references, inpainting with PNG masks, and dense typography. Outputs PNG/JPEG/WebP to disk.
Share bugs, ideas, or general feedback.
这是一个面向 GPT Image 2 的聚焦型技能,在 3 种运行环境下都能用,但行为差异显著。第一步必须先确定当前运行模式。
它只做两类图像任务:
POST /images/generationsPOST /images/edits本文件保留:运行模式、技能结构、环境变量、保存 / 命名规则、模板索引、模式感知工作流。详细模板全部放在 references/,分层组织:
本 Skill 自带一个轻量探测脚本,先跑一次,再根据结果决定怎么干活:
node skills/gpt-image-2/scripts/check-mode.js
# 想拿结构化结果给上层程序用:
node skills/gpt-image-2/scripts/check-mode.js --json
输出会给出 mode = A / A? / B-or-C 以及 recommendation。三个模式定义如下:
触发条件:环境变量 ENABLE_GARDEN_IMAGEGEN 为真(1 / true / yes / on)且 存在 OPENAI_API_KEY。
行为:完整端到端跑通"选模板 → 写 prompt → 调用脚本 → 出图落盘"。
scripts/generate.js 文本生图、scripts/edit.js 编辑现有图。garden-gpt-image-2/prompt/、图片落盘到 garden-gpt-image-2/image/。触发条件:未启用 Garden(ENABLE_GARDEN_IMAGEGEN 未设置 / 为假),但当前宿主 Agent 自带图像生成工具或图像 MCP。
典型识别信号(你应该自检):
image_generation / imagegen / dalle / nano_banana / mcp__*image* / make_image / 类似名字行为:本 Skill 退化成提示词工程指引——
node scripts/generate.js(没有 API key、必失败)。garden-gpt-image-2/prompt/,但图片去向由宿主决定,不强制。触发条件:未启用 Garden,且宿主 Agent 也没有任何图像生成工具。
行为:本 Skill 退化为"高质量 prompt 撰写顾问"——
garden-gpt-image-2/prompt/<task-slug>-<timestamp>.md。| 条件 | 模式 | 调用脚本? | 落盘 prompt? | 落盘图片? |
|---|---|---|---|---|
ENABLE_GARDEN_IMAGEGEN=1 + 有 KEY | A | ✅ generate.js / edit.js | ✅ 自动 | ✅ 自动 |
ENABLE_GARDEN_IMAGEGEN=1 但没 KEY | A? | ❌(先要 KEY) | — | — |
| 未启用 + 宿主有图像工具 | B | ❌(用宿主工具) | 可选 | 由宿主决定 |
| 未启用 + 宿主无图像工具 | C | ❌ | ✅ 必须 | ❌(无法) |
当此技能需要向用户提问时,遵循以下规则:
scripts/check-mode.js:先跑这个,检测运行模式(A / B / C)scripts/generate.js:文本生图(仅 Mode A 使用)scripts/edit.js:基于原图 / 遮罩改图(仅 Mode A 使用)scripts/shared.js:共享请求、保存、环境变量读取逻辑references/:分层结构化提示词模板(A / B / C 三模式都用)按以下顺序读取配置:
process.env<cwd>/.env<cwd>/.gateway.env~/.gateway.env核心变量:
ENABLE_GARDEN_IMAGEGEN — 模式开关。1 / true / yes / on 时启用 Mode A;未设置或其它值则进入 Mode B / C。OPENAI_API_KEY — Mode A 必需;B / C 不需要。OPENAI_BASE_URL — 默认 https://api.openai.com/v1,可指向第三方兼容网关。OPENAI_IMAGE_MODEL — 默认 gpt-image-2,可换成网关支持的型号(如 gpt-image-1 / dall-e-3)。默认实现按 OpenAI 兼容接口工作,不写死任何第三方网关。
如果用户没有明确指定输出路径,统一使用当前工作区下的:
garden-gpt-image-2/prompt/(A / B / C 三种模式都建议用,方便复用与版本管理)garden-gpt-image-2/image/(仅 Mode A 使用;Mode B 由宿主决定,Mode C 不产生图)如果目录不存在,脚本(Mode A)必须自动创建;Mode B / C 在写 prompt 前手动 mkdir -p。
如果用户没有明确指定文件名,脚本应自动生成与当前任务相关的文件名,并追加当前时间戳,避免重名。
命名规则:
garden-gpt-image-2/prompt/<task-slug>-<timestamp>.mdgarden-gpt-image-2/image/<task-slug>-<timestamp>.png其中:
<task-slug>:根据当前用户要求自动提取一个相关短名称<timestamp>:当前时间戳,例如 20260424-153045示例:
garden-gpt-image-2/prompt/live-commerce-ui-20260424-153045.mdgarden-gpt-image-2/image/live-commerce-ui-20260424-153045.pnggarden-gpt-image-2/prompt/vr-headset-exploded-view-20260424-153102.mdgarden-gpt-image-2/image/vr-headset-exploded-view-20260424-153102.png| 模式 | 是否必须保存 prompt | 说明 |
|---|---|---|
| Mode A | ✅ 必须 | 进入实际生成 / 编辑流程必落盘 |
| Mode B | 推荐 | 默认建议保存方便复用;用户说"不用"就略过 |
| Mode C | ✅ 必须 | 用户拿走 prompt 自己执行,不落盘等于白干 |
通用规则(适用三种模式):
garden-gpt-image-2/prompt/。--prompt-output,则尊重用户指定路径。--image 或 --output,则尊重用户指定路径。garden-gpt-image-2/image/。Mode B 由宿主图像工具决定保存方式;Mode C 不产生图片。
node skills/gpt-image-2/scripts/check-mode.js
输出会告诉你当前是 Mode A / B / C,决定后续是否调用 generate.js / edit.js。下面 1~4 仅在 Mode A 下使用。
node skills/gpt-image-2/scripts/generate.js \
--prompt "A cute baby sea otter" \
--size 1024x1024 \
--quality high
node skills/gpt-image-2/scripts/generate.js \
--promptfile garden-gpt-image-2/prompt/poster-20260424-153045.md
node skills/gpt-image-2/scripts/edit.js \
--image assets/source.png \
--prompt "Replace the background with a clean studio scene"
node skills/gpt-image-2/scripts/edit.js \
--image assets/source.png \
--mask assets/mask.png \
--prompt "Replace only the masked area with a glass vase"
没有命令行入口——本 Skill 此时只是提示词工程指南:
image_generation 类工具(参数中传入 prompt)→ 拿到图。garden-gpt-image-2/prompt/<task-slug>-<timestamp>.md → 把内容直接展示给用户 → 提示用户在哪些图像工具中可以直接复用。当 references/ 中提供 JSON 模板时,按下面规则使用:
SKILL.md 找到最贴近的分类目录。{argument ...} 表示可替换参数。default 的,默认可以先用默认值。当模板缺少关键变量时,不要笼统地问“你想要什么风格?”。应当根据模板字段精确提问。
例如直播 UI 模板缺少主体时,应优先问:
缺少商品信息时应问:
按任务类型只读取最贴近的具体模板文件,不要一次性全读整个 references/。
先读:
references/prompt-writing.md适用于:
references/ui-mockups/)适合各种“界面 + 内容”的样机视觉。当前已落地:
live-commerce-ui.md — 电商直播带货截图样机(主播 + 聊天区 + 礼物区 + 商品卡)social-interface-mockup.md — 社交平台动态详情页样机(Twitter/X、小红书、微博、Threads 等)product-card-overlay.md — 落地页 hero / 详情页主图(人物 + 商品 + 卖点 + 价格)chat-interface-scene.md — 聊天 / 对话界面样机(iMessage、微信、群聊、AI 助手)short-video-cover-ui.md — 短视频封面 / 直播缩略图(YouTube、抖音、B 站、VTuber stream)landing-page-case-study.md — 深色 SaaS / 营销 case study 长页面 UI mockup(多 section + 滚动叙事 + 数据卡 + CTA)references/product-visuals/)适合“以商品为视觉中心”的图。当前已落地:
exploded-view-poster.md — 产品爆炸视图海报(主体垂直堆叠 + callout + 顶部 logo + 底部品牌区)white-background-product.md — 电商纯白底主图(单品 / 多角度 / 极简营销叠层)premium-studio-product.md — 高级影棚商业产品图(杂志广告级氛围)packaging-showcase.md — 礼盒 / 包装展示图(外盒 + 内容物展示)lifestyle-product-scene.md — 生活方式产品场景图(商品出现在真实场景中)ecommerce-marketing-board.md — 中式电商超复合销售看板(主图 + 详情页 + 卖点 + 使用步骤 + 场景 + TVC 分镜组合一图)references/maps/)适合“地图类视觉”(信息图已抽离到独立分类 17)。当前已落地:
food-map.md — 城市美食手绘地图(编号点位 + 图例 + 中心吉祥物)travel-route-map.md — 旅行路线图(多日行程 / 单日 city walk / 户外路线)illustrated-city-map.md — 城市风貌插画地图(地标 + 江山 + 文化元素)store-distribution-map.md — 品牌门店 / 服务覆盖分布图itinerary-day-trip-map.md — 一日游 split 海报(左 parchment 行程卡 + 右奇幻写实地图,5-7 站点严格对齐)references/slides-and-visual-docs/)适合“一页讲清楚一件事”的视觉文档。当前已落地:
dense-explainer-slides.md — Irasutoya × 霞关混合高密度讲解 Slidepolicy-style-slide.md — 政策 / 政府公告 / 白皮书风格说明 Slidevisual-report-page.md — 商业报告执行摘要 / 投资人简报 / 年报概览页educational-diagram-slide.md — 教学示意图(概念 / 机制 / 流程分解)references/poster-and-campaigns/)适合“品牌主视觉 + campaign + banner + 杂志封面”。当前已落地:
brand-poster.md — 品牌主海报(产品 / 人物 / 纯文字主张)campaign-kv.md — Campaign Key Visual + 衍生 layout 系统banner-hero.md — Web hero / 落地页 / app banner(横向构图 + CTA)editorial-cover.md — 杂志 / 期刊 / 出版物封面biomimetic-concept-poster.md — 仿生工业设计概念海报(自然原型 → 演化条 → hero render → 多视图技术图)vintage-editorial-infographic.md — 复古档案 / 1940s 编辑式信息图海报(人物 + 公式 + 时间轴 + 模型,Bell Labs 风)character-catalog-poster.md — 同一角色多版本信息图海报(星座 / 元素 / 朝代 / 人格系列卡片)lineup-comparison-poster.md — 系列产品 lineup 对比信息图海报(30+ SKU 同图 + 图例 + 等级 key)references/portraits-and-characters/)适合“人物视觉”。当前已落地:
professional-portrait.md — 职业级商务肖像(LinkedIn / 团队页 / 媒体配图)founder-portrait.md — 创始人媒体大片肖像(戏剧灯光 + 留标题位)virtual-host.md — VTuber / 虚拟主播个人卡 + 直播预览character-sheet.md — 角色综合设定稿(三视图 + 表情 + 服装 + 配色板)pose-reference-sheet.md — N×N 姿势 / 动作字典参考表(同一角色多姿势,舞蹈 / 战斗 / 健身)references/scenes-and-illustrations/)适合“氛围 + 故事 + 情绪”的插画类视觉。当前已落地:
healing-scene.md — 治愈系日常 / 季节场景插画concept-scene.md — 电影感概念大场景 / IP key artpicture-book-scene.md — 童书 / 绘本内页 / 节日卡片minimalist-mood-scene.md — 极简留白氛围图 / 文学性壁纸references/editing-workflows/)适合“基于现有图片做编辑”的图改任务(对应 scripts/edit.js)。当前已落地:
background-replacement.md — 背景替换(商品 / 人像 / 户外 / 棚景)local-object-replacement.md — 局部对象替换(配合或不配合蒙版)object-removal.md — 杂物 / 路人 / 电线 / 瑕疵去除product-retouching.md — 产品精修(光泽 / 标签 / 阴影 / 瑕疵)portrait-local-edit.md — 人像局部修改(发型 / 服装 / 妆容 / 配饰)references/avatars-and-profile/)适合“风格化头像 / 人设 / 网格 / 贴纸 / 系列肖像”等"个人形象"类视觉。当前已落地:
style-transfer-selfie.md — 把参考图人物转成 cosplay / 哥特 / 复古胶片 / 偶像写真等任意风格character-grid-portrait.md — 同一角色 n×n 网格肖像(多职业 / 多表情 / 多朝代 / 多风格)themed-3d-icon.md — Kawaii 3D / Minecraft / 拟物 3D 应用图标式头像sticker-set.md — 贴纸套装 / 表情包合集(独立元素 + 描边 + 标签)cultural-portrait-series.md — 朝代 / 神话 / 文学 / 民族系列肖像references/storyboards-and-sequences/)适合“多分镜 / 漫画 / 关系图 / 流程步骤”等"叙事性序列"类视觉。当前已落地:
four-panel-comic.md — 4 格漫画 / 讽刺漫画 / 段子漫画(起承转合 + 对话气泡)manga-spread-page.md — 单页 / 跨页漫画分镜(不规则格子 + 对话 + 心声)anime-key-visual.md — 单图动漫 KV / 轻小说封面 / IP 海报character-relationship-diagram.md — 角色关系图海报(卡片 + 关系连线 + 图例)recipe-process-flowchart.md — 食谱 / 教程 / 流程步骤图(编号 + 插图 + 说明)product-tvc-storyboard.md — 产品 TVC 商业广告分镜板(9-panel 实拍质感 + 镜头描述 + 时长)cinematic-storyboard-grid.md — 电影感叙事分镜 contact sheet(3×4 / 4×4,连续叙事 + cinematic still)process-photo-board.md — 真人 cinematic 流程板(装备穿戴 / 化妆 / 训练 / 操作分解,编号 + 步骤递进)references/grids-and-collages/)适合“多面板网格 / 拼贴 / 立项 board”类视觉。当前已落地:
banner-grid-2x2.md — 2×2 营销 banner 套装(一次出 4 张统一系列设计)lookbook-grid.md — 7 日 lookbook / 9 宫 self-care / TOP N 清单图mixed-style-multi-panel.md — 多风格混合拼贴(同一主体不同画风演绎)anime-pitch-board.md — 动漫 / 游戏 / 影视立项 pitch board(KV + 角色 + 世界观 + 文案)ad-banner-multi-grid.md — 多行业 / 多主题混合广告 banner 网格(每格独立行业 + 风格 + 文案)references/branding-and-packaging/)适合“品牌识别系统 / 吉祥物 / 包装设计”类视觉。当前已落地:
brand-identity-board.md — 品牌识别系统板(logo + 配色 + 字体 + 应用 mockup)mascot-brand-kit.md — 吉祥物多面板品牌识别套装(主形象 + 三视图 + 表情 + 应用)cosmetic-packaging.md — 化妆品 / 护肤品 单瓶 / 系列 / 礼盒包装beverage-label-design.md — 饮料 / 食品 / 调味品标签设计(国潮 / 日式 / 西式)full-mascot-brand-doc.md — 18+ 模块大型品牌识别 + 吉祥物全流程文档(DNA / moodboard / 草图 / 线稿 / 3D / 配色 / 材质 / 应用一图概览)character-merch-board.md — IP 角色 + 周边 / 包装 / 海报 / 社交 profile 多元素综合品牌板references/typography-and-text-layout/)适合“字面优先 / 双语版式”等"以文字为主视觉"的类型。当前已落地:
title-safe-poster.md — 大字主张型海报(日式高能量 / 瑞士极简 / 复古印刷)bilingual-layout-visual.md — 中英 / 中日双语版式视觉(文化 / 学术 / 跨文化品牌)references/assets-and-props/)适合“图标集 / 游戏截图”等"成套素材 / 游戏资产"类视觉。当前已落地:
retro-skeuomorphic-icons.md — 拟物 / Y2K / 像素 图标集(成套统一风格)game-screenshot-mockup.md — 游戏内截图 mockup(HUD + 字幕 + 任务面板)references/academic-figures/)适合“论文 / 顶会投稿 / 学术海报 / 答辩 PPT / 开题答辩 / 期刊投稿 Graphical Abstract”的配图。整体偏白底 + 出版物字体 + 几何精确 + 低饱和工程色(深蓝 / 灰蓝 / 黑灰为主,≤3 主色)+ 可单色印刷。严格禁止虚构定量数据(数值 / 等值线 / 色标范围 / 公式)。
CS / CV / ML 方向:
method-pipeline-overview.md — 方法总览图 / pipeline figure(多 stage 块 + 数据流;变体 4 提供工程类左/中/右 三段式技术路线图)neural-network-architecture.md — 神经网络架构图(layer 块 + tensor shape + 跳连)qualitative-comparison-grid.md — 多方法 qualitative 对比网格(行 = 样本,列 = 方法)工程 / 自然科学 / 答辩通用:
scientific-schematic.md — 概念 / 原理 / 实验装置示意图(自由度高,自然语言模板)mechanism-diagram.md — 机理示意图 / 因果链路 / 转化路径(中心对象 + 多阶段转化 + 结果区;含三段式因果链 / 循环自激发 / 多分支竞争 三种变体)multi-condition-comparison.md — 多工况 / 多条件结果对比图(同一对象在不同 condition 下的并列结果,2×2 / 1×N / M×N;强调 panel 间严格统一)publication-chart.md — publication-ready 数据图表(bar / line / scatter / heatmap / box)总览 / 摘要 / 答辩首页:
graphical-abstract.md — 期刊投稿 Graphical Abstract / 图形摘要(横向 4 段式 / 中心展开 / 方形 / 竖版四种变体)research-overview-poster.md — 开题 / 答辩 / 汇报首页研究总览图(上中下三层 + 五模块;含中心辐射 / 左右双栏 / 极简 三种变体)选择策略:CS/CV/ML 论文首选
method-pipeline-overview+qualitative-comparison-grid;工程 / 能源 / 化工 / 材料方向首选method-pipeline-overview变体 4 +mechanism-diagram+multi-condition-comparison;投稿期刊摘要图用graphical-abstract;答辩 PPT 首页用research-overview-poster。
references/infographics/)适合“信息图 / 高密度科普 / 手绘信息图 / KPI 仪表盘”等"信息可视化大图"。当前已落地:
legend-heavy-infographic.md — 高图例密度科普 / 因果链 / 演化 / 解剖图(双语)hand-drawn-infographic.md — 手绘风信息图(macaron / morandi / 黑板 / 牛皮纸;自然语言模板)bento-grid-infographic.md — 便当格模块化信息图(高密度多模块 widget 排布)comparison-infographic.md — 二元 / 多元对比信息图(A vs B / 套餐档位 / 误区 vs 正解)step-by-step-infographic.md — 步骤教程信息图(插画感、温暖;非工程流程图)kpi-dashboard-infographic.md — KPI 仪表盘式信息图(年度回顾 / Wrapped / 业务 dashboard)references/technical-diagrams/)适合“系统架构 / 流程 / 时序 / 状态机 / ER / 思维导图 / 网络拓扑”等工程示意图。统一暗色 grid 背景 + 等宽字体 + 角色编码配色,每个模板都附 light 变体。
⚠️ 注意:本目录生成的是 PNG 位图,不是可编辑 SVG;需要可编辑请改用 mermaid / draw.io / excalidraw / Figma。当前已落地:
system-architecture.md — 系统架构图(前端 + 后端 + DB + 缓存 + 队列 + 外部)flowchart-decision.md — 流程图 / 决策图(BPMN 形状语义 + Yes/No 分支)sequence-diagram.md — 时序图(actor + lifeline + 消息箭头 + 激活条)state-machine.md — 状态机 / 生命周期图(state + transition + guard / action)er-diagram.md — ER 图 / 数据模型图(实体 + 字段 + PK/FK + crow's foot 关系)mind-map-tech.md — 技术主题思维导图(中央 + 放射式分支)network-topology.md — 网络拓扑图(设备 glyph + zone / VPC + 带宽 / 协议标)无论 A / B / C,前 6 步是共用的;区别只在第 7-8 步如何"出图"。
check-mode.js 确定模式(A / B / C)。infographics/hand-drawn-infographic.md、academic-figures/scientific-schematic.md 等)使用「结构化自然语言 + 参数」混合形式,因为强行 JSON 会限制创作自由。到此 prompt 已渲染好。下面按模式分叉:
7-A. Mode A:把最终 prompt 保存到 garden-gpt-image-2/prompt/,调用 scripts/generate.js 或 scripts/edit.js,图片落到 garden-gpt-image-2/image/。
7-B. Mode B:把最终 prompt 直接传给宿主的图像工具调用;按需保存 prompt 副本到 garden-gpt-image-2/prompt/。
7-C. Mode C:把最终 prompt 保存到 garden-gpt-image-2/prompt/<task-slug>-<timestamp>.md,并把完整 prompt 在对话中展示给用户,附一句简短的"如何使用 / 推荐工具"建议。
通用:
仅 Mode A 适用:
data[0].b64_json 解析,也兼容 data[0].url只在这些信息缺失且会显著影响结果时提问:
除此之外,优先自己做合理默认并继续执行。