gpt-image-2-skill

Language: 中文 | English
面向 AI Agent 和桌面用户的 GPT Image 2 CLI、Tauri App 与 Skill。一个运行核心同时支持 OPENAI_API_KEY、OpenAI-compatible --openai-api-base,以及 Codex ~/.codex/auth.json 图片链路。CLI、Tauri App 与 Skill 共用 $CODEX_HOME/gpt-image-2-skill/config.json。
功能特性
images generate、images edit、transparent generate/extract/verify、request create
- OpenAI
gpt-image-2 与兼容服务端,支持自定义 --openai-api-base
- Codex
auth.json 图片链路,默认模型 gpt-5.4
-m/--model、--ref-image、--mask、透明 PNG 本地抠图与验证
--format png|jpeg|webp、--quality、--compression、--input-fidelity
--json stdout 结果与 --json-events stderr JSONL 进度事件
- 默认 3 次 retry,Codex
401 自动 refresh 后重试
2K、4K 尺寸别名与自定义 WIDTHxHEIGHT
config、secret、history 命令,覆盖共享配置、文件/env/Keychain 密钥来源和本地 SQLite 历史
- Tauri App 桌面端位于
apps/gpt-image-2-app,内置同版本 CLI sidecar,并复用同一套配置、Keychain/env/file 密钥解析与历史记录
- Docker Web 自托管运行时可从同一套 React UI 通过
/api 调用 Rust 后端,见 docs/docker-web.md
安装
桌面 App
macOS 用户可以通过 Homebrew Cask 安装桌面 App:
brew install --cask wangnov/tap/gpt-image-2
也可以从 GitHub Releases 下载对应平台安装包:
- macOS Apple Silicon:
GPT.Image.2_*_aarch64.dmg
- macOS Intel:
GPT.Image.2_*_x64.dmg
- Windows:
GPT.Image.2_*_x64-setup.exe
- Linux:
GPT.Image.2_*_amd64.AppImage、*.deb 或 *.rpm
macOS DMG 通过 Developer ID 签名并完成 Apple notarization。桌面 App 内置 Tauri 更新器;正式版发布后可在「设置 → 关于」里手动检查更新,启动时也会轻量提示新版本。桌面 App 会把输出图片、任务元数据和历史记录保存到 $CODEX_HOME/gpt-image-2-skill/,默认是 ~/.codex/gpt-image-2-skill/。
CLI
cargo install gpt-image-2-skill --locked
cargo binstall gpt-image-2-skill --no-confirm
brew install wangnov/tap/gpt-image-2-skill
npm install --global gpt-image-2-skill
本地开发安装:
just install-local
常用本地任务统一通过 justfile 管理,可运行 just --list 查看入口。
快速开始
OpenAI API Key 直连:
OPENAI_API_KEY=sk-... gpt-image-2-skill --json \
images generate \
--prompt "A studio product photo of a red apple on transparent background" \
--out ./apple.png \
--background transparent \
--format png \
--quality high \
--size 1024x1024
OpenAI-compatible Base URL:
OPENAI_API_KEY=sk-... gpt-image-2-skill --json \
--provider openai \
--openai-api-base https://api.duckcoding.ai/v1 \
images generate \
--prompt "A polished geometric app logo on transparent background" \
--out ./logo.png \
--background transparent \
--format png \
--size 2K
共享配置固定 provider:
gpt-image-2-skill --json config add-provider \
--name my-image-api \
--type openai-compatible \
--api-base https://example.com/v1 \
--api-key sk-... \
--set-default
gpt-image-2-skill --json config inspect
gpt-image-2-skill --json images generate \
--prompt "A polished geometric app logo on transparent background" \
--out ./logo.png
Codex auth.json 生图:
gpt-image-2-skill --json --json-events \
--provider codex \
images generate \
--prompt "A glossy red apple sticker on transparent background" \
--out ./apple.png
透明 PNG 交付:
gpt-image-2-skill --json --json-events \
--provider codex \
transparent generate \
--prompt "A glossy red apple sticker, centered, no text, no frame" \
--out ./apple-transparent.png \
--size 2K \
--quality high
对于玻璃、流光、烟雾等半透明素材,Agent 可以先生成黑底/白底源图,再用本地双背景抠图:
gpt-image-2-skill --json \
transparent extract --method dual \
--dark-image ./glow-black.png \
--light-image ./glow-white.png \
--out ./glow-transparent.png \
--profile glow \
--strict
交付前可用 profile 化质量门检查真实 alpha、假透明棋盘格、边缘贴边、残留碎点、matte 色污染和透明 RGB 清理:
gpt-image-2-skill --json \
transparent verify \
--input ./glow-transparent.png \
--profile glow \
--strict
如果素材来自 chroma 纯色底抠图,单独 verify 时要带上原始 matte 才会检查色边残留: