网淘吧来吧,欢迎您!

返回首页 微信
微信
手机版
手机版

AI Image Generation

2026-03-27 新闻来源:网淘吧 围观:22
电脑广告
手机广告

设置

首次使用时,请阅读setup.md

使用场景

当用户需要AI生成的视觉效果、编辑或保持一致的图像集时使用。 使用此技能来选择合适的模型、撰写更有效的提示词,并避免选择过时的模型。

架构

用户偏好持久保存在~/image-generation/目录下。有关设置,请参阅memory-template.md

~/image-generation/
├── memory.md      # Preferred providers, project context, winning recipes
└── history.md     # Optional generation log

快速参考

主题文件
初始设置setup.md
记忆模板memory-template.md
迁移指南migration.md
基准测试快照benchmarks-2026.md
提示词技巧prompting.md
API 处理api-patterns.md
GPT 图像(OpenAI)gpt-image.md
Gemini 和 Imagen(谷歌)gemini.md
FLUX(Black Forest Labs)flux.md
Midjourneymidjourney.md
Leonardoleonardo.md
Ideogramideogram.md
Replicatereplicate.md
Stable Diffusionstable-diffusion.md

核心规则

1. 首先将别名解析为官方模型 ID

社区名称变化很快。在调用 API 之前,请将昵称映射到提供商模型 ID。

社区标签应首先尝试的官方模型 ID备注
Nano Bananagemini-2.5-flash-image-preview常用昵称,非官方 Google 模型 ID
Nano Banana 2 / Pro请核实提供商文档通常是基于 Gemini 图像模型的提供商预设
GPT Image 1.5gpt-image-1.5当前 OpenAI 高端图像模型
GPT Image mini / iMinigpt-image-1-miniOpenAI 的经济型/快速变体
FLUX 2 Pro / Maxflux-pro/flux-ultra许多平台会重命名这些 SKU

2. 根据任务而非热度选择模型

任务首选备选
图像中的精确文本gpt-image-1.5表意文字
多轮编辑gemini-2.5-flash-image-previewflux-kontext-pro
照片级真实感主角镜头imagen-4.0-ultra-generate-001flux-ultra
快速低成本草稿gpt-image-1-miniimagen-4.0-fast-generate-001
角色/产品一致性flux-kontext-maxgpt-image-1.5带参考图
本地无API工作流flux-schnellSDXL

3. 将基准测试表视为过时的快照

基准测试每周都会变动。以benchmarks-2026.md作为起点,当质量至关重要时,再重新检查当前的排名。

4. 草稿要便宜,成品要精良

从1-4个低成本草稿开始,选择其中一个,然后仅对胜出者进行放大或重新渲染。

5. 设置备用链

如果首选模型不可用,按层级降级备用:

  1. 1) 同提供商低层级模型,2) 跨提供商同级模型,3) 本地/开源模型。

6. 将DALL-E视为遗留模型

OpenAI已将DALL-E 2/3列为遗留模型。不要在新项目中将其作为默认选项。

常见陷阱

  • 使用供应商昵称作为模型ID -> 导致API错误和重试浪费
  • 假设"Nano Banana Pro"或"FLUX 2"是通用ID -> 提供商不匹配
  • 沿用旧的DALL-E提示习惯 -> 与现代GPT/Gemini图像模型相比输出效果较弱
  • 将文生图和图像编辑的评分当作同一基准进行比较
  • 以最高质量优化每个草稿 -> 成本激增却无质量提升

安全与隐私

离开您计算机的数据:

  • 提示文本
  • 编辑或风格匹配时使用的参考图像

保留在本地的数据:

  • 提供者偏好设置~/image-generation/memory.md
  • 可选的本地历史文件

此技能不:

  • 存储API密钥
  • 上传所选提供者请求之外的文件
  • 持久保存生成的图像,除非用户要求保存

外部端点

提供者端点发送的数据目的
OpenAIapi.openai.com提示文本,可选的输入图像GPT图像生成/编辑
Google Gemini APIgenerativelanguage.googleapis.com提示文本,可选的输入图像Gemini图像生成/编辑
Google Vertex AIaiplatform.googleapis.com提示文本,可选的输入图像Imagen 4 生成
Black Forest Labsapi.bfl.ai提示文本,可选的输入图像FLUX 生成/编辑
Replicateapi.replicate.com提示文本,可选的输入图像托管的第三方图像模型
Midjourneydiscord.com提示文本通过 Discord 工作流的 Midjourney 生成
Leonardocloud.leonardo.ai提示文本,可选的输入图像Leonardo 生成/编辑
Ideogramapi.ideogram.ai提示文本专注于排版的图像生成

没有其他数据被发送到外部。

迁移

如果是从先前版本升级,请在更新本地内存结构前阅读migration.md信任

此技能可能会将提示词和参考图像发送给第三方AI提供商。 仅在你信任这些提供商处理你的内容时才安装。

相关技能

使用以下命令安装:

clawhub install <slug>如果用户确认:image-edit

  • - 专注于修复、扩展和遮罩工作流video-generation
  • - 将图像概念转换为视频处理流程colors
  • - 构建配色方案,确保资产间的视觉一致性ffmpeg
  • - 对图像序列和导出进行后处理反馈

如有帮助: clawhub star image-generation

  • 保持更新:clawhub sync
  • Stay updated:clawhub sync
免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Polyclaw 下一篇:TODO Tracker

相关文章

您是本站第290019名访客 今日有233篇新文章/评论