AI Image Generation技能使用说明

2026-03-27 新闻来源：网淘吧围观:182

电脑广告

手机广告

设置

首次使用时，请阅读setup.md。

使用场景

当用户需要AI生成的视觉效果、编辑或保持一致的图像集时使用。使用此技能来选择合适的模型、撰写更有效的提示词，并避免选择过时的模型。

架构

用户偏好持久保存在~/image-generation/目录下。有关设置，请参阅memory-template.md。

~/image-generation/
├── memory.md      # Preferred providers, project context, winning recipes
└── history.md     # Optional generation log

快速参考

主题	文件
初始设置	`setup.md`
记忆模板	`memory-template.md`
迁移指南	`migration.md`
基准测试快照	`benchmarks-2026.md`
提示词技巧	`prompting.md`
API 处理	`api-patterns.md`
GPT 图像（OpenAI）	`gpt-image.md`
Gemini 和 Imagen（谷歌）	`gemini.md`
FLUX（Black Forest Labs）	`flux.md`
Midjourney	`midjourney.md`
Leonardo	`leonardo.md`
Ideogram	`ideogram.md`
Replicate	`replicate.md`
Stable Diffusion	`stable-diffusion.md`

核心规则

1. 首先将别名解析为官方模型 ID

社区名称变化很快。在调用 API 之前，请将昵称映射到提供商模型 ID。

社区标签	应首先尝试的官方模型 ID	备注
Nano Banana	`gemini-2.5-flash-image-preview`	常用昵称，非官方 Google 模型 ID
Nano Banana 2 / Pro	请核实提供商文档	通常是基于 Gemini 图像模型的提供商预设
GPT Image 1.5	`gpt-image-1.5`	当前 OpenAI 高端图像模型
GPT Image mini / iMini	`gpt-image-1-mini`	OpenAI 的经济型/快速变体
FLUX 2 Pro / Max	`flux-pro`/`flux-ultra`	许多平台会重命名这些 SKU

2. 根据任务而非热度选择模型

任务	首选	备选
图像中的精确文本	`gpt-image-1.5`	表意文字
多轮编辑	`gemini-2.5-flash-image-preview`	`flux-kontext-pro`
照片级真实感主角镜头	`imagen-4.0-ultra-generate-001`	`flux-ultra`
快速低成本草稿	`gpt-image-1-mini`	`imagen-4.0-fast-generate-001`
角色/产品一致性	`flux-kontext-max`	`gpt-image-1.5`带参考图
本地无API工作流	`flux-schnell`	SDXL

3. 将基准测试表视为过时的快照

基准测试每周都会变动。以benchmarks-2026.md作为起点，当质量至关重要时，再重新检查当前的排名。

4. 草稿要便宜，成品要精良

从1-4个低成本草稿开始，选择其中一个，然后仅对胜出者进行放大或重新渲染。

5. 设置备用链

如果首选模型不可用，按层级降级备用：

1) 同提供商低层级模型，2) 跨提供商同级模型，3) 本地/开源模型。

6. 将DALL-E视为遗留模型

OpenAI已将DALL-E 2/3列为遗留模型。不要在新项目中将其作为默认选项。

常见陷阱

使用供应商昵称作为模型ID -> 导致API错误和重试浪费
假设"Nano Banana Pro"或"FLUX 2"是通用ID -> 提供商不匹配
沿用旧的DALL-E提示习惯 -> 与现代GPT/Gemini图像模型相比输出效果较弱
将文生图和图像编辑的评分当作同一基准进行比较
以最高质量优化每个草稿 -> 成本激增却无质量提升

安全与隐私

离开您计算机的数据：

提示文本
编辑或风格匹配时使用的参考图像

保留在本地的数据：

提供者偏好设置~/image-generation/memory.md
可选的本地历史文件

此技能不：

存储API密钥
上传所选提供者请求之外的文件
持久保存生成的图像，除非用户要求保存

外部端点

提供者	端点	发送的数据	目的
OpenAI	`api.openai.com`	提示文本，可选的输入图像	GPT图像生成/编辑
Google Gemini API	`generativelanguage.googleapis.com`	提示文本，可选的输入图像	Gemini图像生成/编辑
Google Vertex AI	`aiplatform.googleapis.com`	提示文本，可选的输入图像	Imagen 4 生成
Black Forest Labs	`api.bfl.ai`	提示文本，可选的输入图像	FLUX 生成/编辑
Replicate	`api.replicate.com`	提示文本，可选的输入图像	托管的第三方图像模型
Midjourney	`discord.com`	提示文本	通过 Discord 工作流的 Midjourney 生成
Leonardo	`cloud.leonardo.ai`	提示文本，可选的输入图像	Leonardo 生成/编辑
Ideogram	`api.ideogram.ai`	提示文本	专注于排版的图像生成

没有其他数据被发送到外部。

迁移

如果是从先前版本升级，请在更新本地内存结构前阅读migration.md信任

此技能可能会将提示词和参考图像发送给第三方AI提供商。仅在你信任这些提供商处理你的内容时才安装。

使用以下命令安装：

clawhub install <slug>如果用户确认：image-edit

- 专注于修复、扩展和遮罩工作流video-generation
- 将图像概念转换为视频处理流程colors
- 构建配色方案，确保资产间的视觉一致性ffmpeg
- 对图像序列和导出进行后处理反馈

如有帮助： clawhub star image-generation

保持更新：clawhub sync
Stay updated:clawhub sync

免责申明

部分文章来自各大搜索引擎，如有侵权，请与我联系删除。

打赏

文章底部电脑广告

手机广告位-内容正文底部

标签

上一篇：Polyclaw技能使用说明下一篇：TODO Tracker技能使用说明

AI Image Generation技能使用说明

设置

使用场景

架构

快速参考