网淘吧

来吧,欢迎您!

image-cog技能使用说明

Image Cog - 由CellCog驱动的AI图像生成

使用AI创建专业图像 - 从单张图像到一致性角色集,再到产品摄影。


先决条件

此技能需要cellcog技能来进行SDK设置和API调用。

clawhub install cellcog

首先阅读cellcog技能以进行SDK设置。本技能向您展示可实现的功能。

快速模式 (v1.0+):

# 即发即弃 - 立即返回
result = client.create_chat(
    prompt="[您的图像请求]",
    notify_session_key="agent:main:main",
    task_label="image-task",
    chat_mode="agent"  # 简单图像使用"agent",复杂图像使用"agent team"
)
# 守护进程完成后通知您 - 请勿轮询

我们使用哪些模型

模型 提供商 主要用途
Nano Banana 2(Gemini 3.1 Flash Image) Google 默认图像生成 — 逼真场景、复杂构图、文本渲染、多轮角色一致性
GPT Image 1.5 OpenAI 透明背景图像 — 徽标、贴纸、产品抠图、叠加图形
Recraft Recraft AI 可缩放矢量插图 (SVG) 和图标生成

Nano Banana 2是所有图像生成的默认模型。CellCog的智能代理会在任务需要时智能地路由到其他模型 — 例如,透明PNG会自动由GPT Image 1.5处理,矢量/图标请求则发送给Recraft。如果您希望使用特定模型,只需在提示中提及即可 (例如,"使用ChatGPT/OpenAI图像生成")。

您可以创建哪些图像

单张图像创建

根据文本描述生成任何图像:

  • 场景:"清晨阳光透过窗户洒入的舒适咖啡馆内部"
  • 肖像:"身着商务装、充满自信女性的专业头像照"
  • 产品:"大理石表面上一双白色运动鞋的极简主义产品图"
  • 抽象"海军蓝与金色的几何抽象艺术"
  • 自然:"日出时分雾霭笼罩的山景,一位孤独的徒步者"

图像编辑

转换现有图像:

  • 风格迁移:"将这张照片转换成水彩画风格"
  • 背景移除:"移除背景并置于干净的白色背景上"
  • 增强:"增强色彩并添加戏剧性的光影效果"
  • 修改:"将人物的服装改成红色连衣裙"

一致性角色

创建同一角色在不同场景下的多张图像:

  • 角色系列:"创建一个科技创业者角色,然后展示他们:1) 在办公桌前编程,2) 向投资者展示,3) 庆祝产品发布"
  • 吉祥物变体:"设计一个友好的机器人吉祥物,然后为以下场景创建版本:欢迎页面、错误页面、成功信息页面、加载屏幕"
  • 故事序列:"创建一个主角,然后用5个场景来描绘他们的旅程"

这对于以下方面非常有用:

  • 漫画条和故事板
  • 具有一致性角色的营销活动
  • 视频帧生成
  • 跨不同情境的品牌吉祥物

产品摄影风格

专业产品视觉效果:

  • 主视觉图:"智能手表在渐变背景上的产品主视觉图"
  • 生活方式图:"人物在现代客厅中使用智能手机"
  • 平铺展示:"护肤品的平铺展示,搭配植物元素"
  • 360度视图:"皮制手提包的多个角度视图 - 正面、侧面、背面、细节"

相关图像集

为宣传活动或系列创建多张风格统一的图像:

  • 社交媒体套装"为健身品牌设计5张Instagram帖子图片 - 风格统一,内容多样"
  • 网站主视觉图:"为SaaS产品落地页设计3张主视觉图 - 专业、现代、科技感"
  • 广告变体:"4个版本的产品广告,背景和氛围各不相同"
  • 博客插图:"为一篇关于效率技巧的博客文章设计一套6张插图"

基于参考的生成

使用现有图片作为风格、角色或构图的参考:

  • 风格匹配:"参照此示例的艺术风格,创作一张新图片"
  • 角色一致性:"以此人物为参考,创作一个他们正在徒步的新场景"
  • 品牌一致性:"创建符合此品牌视觉风格的产品图片"
  • 构图参考:"创建类似构图,但使用不同的主体"

图像规格

方面 选项
长宽比 1:1(正方形)、16:9、9:16、4:3、3:4、3:2、2:3、21:9
尺寸 1K(约1024像素)、2K(约2048像素)、4K(约4096像素)
风格 照片写实、插画、水彩、油画、动漫、数字艺术、矢量图
格式 PNG(默认)

尺寸推荐:

  • 1K:快速迭代、缩略图、社交媒体帖子、草稿
  • 2K:标准网页内容、演示文稿、营销材料
  • 4K:主视觉图、印刷材料、注重细节的最终交付成果

何时使用智能体团队模式

对于图像生成,chat_mode="智能体团队"推荐用于:

  • 需要多种元素的复杂场景
  • 保持角色一致性的系列
  • 需要分析的基于参考图像的生成
  • 一组相关的图像

对于简单的单一图像,`chat_mode="agent"`可以工作得更快。


示例图像提示

专业肖像照:

"创建一张30多岁、友善的亚洲女性的专业肖像照,身穿海军蓝西装外套,柔和的影棚灯光,中性灰色背景,表情自信但平易近人。1:1方形,2K画质,照片级真实感。"

产品摄影:

"高端无线耳机充电盒的产品照片,哑光黑色表面,置于带有微妙蓝色点缀灯光的反光深色表面上。极简主义、高端科技美学。4:3横向,4K画质用于主图。"

一致性角色系列:

"创建一个角色:年轻的黑人男性软件开发人员,休闲风格戴眼镜,态度友善。然后创建4张图像:

  1. 在站立式办公桌前工作,面前有多个显示器
  2. 在视频会议中,正在解释某事
  3. 在咖啡店用笔记本电脑,思考中
  4. 与团队庆祝,击掌 确保所有图像中的角色完全保持一致。"

社交媒体系列:

"为一个植物性膳食配送服务创建5个Instagram帖子:"

  1. 俯瞰视角下的多彩佛陀碗
  2. 开心的人正在拆快递包裹
  3. 整齐排列的备餐盒
  4. 新鲜食材特写
  5. 展示从食材到成品的制作过程对比 风格:明亮、清新、开胃、一致的暖色调。1:1方形画幅。

风格转换:

"将这张上传的城市街道照片转换成吉卜力工作室风格的动画插图。保持构图和元素,但应用吉卜力特有的温暖色调、柔和云彩和奇幻细节。"


获取更佳图像的技巧

  1. 描述要具体:"办公室里的女性"太模糊。"40多岁、穿着银色西装外套、自信的女性,身处现代玻璃幕墙办公室,沐浴在温暖的午后光线中"则更好。

  2. 指定风格:"照片级写实"、"数字插画"、"水彩画"、"极简矢量图"。

  3. 描述光线:"柔和的自然光"、"戏剧性的侧光"、"黄金时段的辉光"、"影棚灯光"。

  4. 包含氛围:"专业且自信"、"温暖而诱人"、"充满活力且色彩鲜明"。

  5. 提及构图:"三分法"、"中心对称"、"特写"、"广角定场镜头"。

  6. 确保一致性:创建角色系列时,先详细描述角色,在后续提示中引用"同一角色"。

天猫隐藏优惠券

网淘吧

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Powered By Z-BlogPHP 1.7.5

备案号:湘ICP备16003021号-1

您是本站第285232名访客 今日有153篇新文章/评论