网淘吧来吧,欢迎您!

Wan Image and Video Generation and Editting技能使用说明

2026-04-01 新闻来源:网淘吧 围观:19
电脑广告
手机广告

万相大模型

万相大模型由阿里巴巴集团推出,是一款广受欢迎的图像与视频生成及编辑模型,在全球范围内被广泛采用。本技能通过ModelStudio(百炼-阿里巴巴模型服务平台)集成了万相大模型的API。

文生图

根据文本提示生成图像

Wan Image and Video Generation and Editting

python3 {baseDir}/scripts/wan-magic.py text2image --prompt "一个女生站在楼顶的阳台上,夕阳照在她的脸上"
python3 {baseDir}/scripts/wan-magic.py text2image --prompt "一位长发女孩坐在书桌前,背对着镜头,戴着耳机。阳光透过窗户洒进房间,照亮了她和周围散落的书籍与杂物" --size 1280*1280
python3 {baseDir}/scripts/wan-magic.py text2image --prompt "女生优雅地倚在车门旁,身穿红色褶皱长裙,在复古色调的室内场景中缓慢转身看向镜头,霓虹光斑在玻璃窗上流动,轻微晃动,背景家具逐渐虚化凸显人物独白,画面带有电影胶片颗粒质感,港风朦胧光影映照出淡淡的忧伤情绪" --quantity 1

选项

  • --quantity: 生成图像数量(默认:1,最大:4)
  • --prompt: 用于图像生成的用户提示词
  • --size: 图像分辨率(默认:12801280,支持宽度和高度在512到1440像素之间的分辨率,前提是总像素数不超过14401440。常用分辨率:12801280,11041472,14721104,9601696,1696*960)

图生图(图像编辑)

基于图像生成图像(图像编辑)

python3 {baseDir}/scripts/wan-magic.py image-edit --prompt "参考图1的风格和图2的背景,生成一张全新的图片" \
  --images 'https://cdn.wanx.aliyuncs.com/tmp/pressure/umbrella1.png' \
  'https://img.alicdn.com/imgextra/i3/O1CN01SfG4J41UYn9WNt4X1_!!6000000002530-49-tps-1696-960.webp' \
  --size "1280*1280"
  python3 {baseDir}/scripts/wan-magic.py image-edit --prompt "参考图1的风格和图2的背景,生成一张全新的图片" \
  --images '/Users/yejianhongali/workDir/pic1.png' \
  '/Users/yejianhongali/workDir/pic2.webp' 
python3 {baseDir}/scripts/wan-magic.py image-edit --prompt "参考图1的风格和图2的背景,生成一张全新的图片" --images 'https://cdn.wanx.aliyuncs.com/tmp/pressure/umbrella1.png' 'https://img.alicdn.com/imgextra/i3/O1CN01SfG4J41UYn9WNt4X1_!!6000000002530-49-tps-1696-960.webp' --quantity 1

选项

  • --quantity: 图片数量(默认:1,最大:4)
  • --prompt: 图像编辑用户提示词
  • --images: 待编辑图片(最少1张,最多4张)。可以是图片URL或本地图片文件(wan-magic.py脚本会将本地图片转换为base64并传递给模型API)
  • --size: 图片分辨率(默认:12801280,支持宽度和高度在512到1440像素之间的分辨率,但总像素数不能超过14401440。常见分辨率:12801280,11041472,14721104,9601696,1696*960)

文生视频

根据文本提示词生成视频

文生视频任务-提交

python3 {baseDir}/scripts/wan-magic.py text2video-gen --prompt "一幅史诗级可爱的场景。一只小巧可爱的卡通小猫将军,身穿细节精致的金色盔甲,头戴一个稍大的头盔,勇敢地站在悬崖上。他骑着一匹虽小但英勇的战马,说:”青海长云暗雪山,孤城遥望玉门关。黄沙百战穿金甲,不破楼兰终不还。“。悬崖下方,一支由老鼠组成的、数量庞大、无穷无尽的军队正带着临时制作的武器向前冲锋。这是一个戏剧性的、大规模的战斗场景,灵感来自中国古代的战争史诗。远处的雪山上空,天空乌云密布。整体氛围是“可爱”与“霸气”的搞笑和史诗般的融合。" --duration 10 --size "1920*1080"

选项

  • --duration: 视频时长(秒)(默认:5,最大:15)
  • --prompt视频生成的用户提示
  • --size:图像分辨率(默认:19201080,支持720p和1080p的任何分辨率。要求:输入分辨率数值(例如1280720),而不是720p)

文本转视频任务-获取(轮询)

python3 {baseDir}/scripts/wan-magic.py text2video-get --task-id “<TASK_ID_FROM_VIDEO_GEN>”

图像转视频生成

以图像作为第一帧生成视频

图像转视频任务-提交

python3 {baseDir}/scripts/wan-magic.py image2video-gen --prompt "一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由他的rap构成,没有其他对话或杂音。" --image "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/wpimhv/rap.png" --duration 10 --resolution "720P"
python3 {baseDir}/scripts/wan-magic.py image2video-gen --prompt "一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由他的rap构成,没有其他对话或杂音。" --image "/Users/yejianhongali/workDir/rap.png" 

选项

  • --duration:视频时长(秒)(默认:5,最大:15)
  • --prompt:视频生成的用户提示
  • --image:作为待生成视频第一帧的图像。可以是图像URL或本地图像文件(wan-magic.py脚本会将本地图像转换为base64并传递给模型API)
  • --resolution:视频分辨率(默认:1080P,支持720P、1080P。要求:输入720P或1080P,而不是数值)

图像转视频任务-获取(轮询)

python3 {baseDir}/scripts/wan-magic.py image2video-get --task-id “<TASK_ID_FROM_VIDEO_GEN>”

参考图/视频生成视频

根据参考图像或/和视频生成视频

参考图/视频生成视频任务提交

python3 {baseDir}/scripts/wan-magic.py reference2video-gen  --prompt "character1 在海边漫步,微风吹拂头发" --reference-files "https://example.com/person.mp4"
python3 {baseDir}/scripts/wan-magic.py reference2video-gen  --prompt "character1 在咖啡厅看书" --reference-files "https://example.com/person.mp4/person.jpg" --duration 5
python3 {baseDir}/scripts/wan-magic.py reference2video-gen --prompt "Character2 坐在靠窗的椅子上,手持 character3,在 character4 旁演奏一首舒缓的美国乡村民谣。Character1 对Character2开口说道:“听起来不错”" --reference-files "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260129/hfugmr/wan-r2v-role1.mp4" "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260129/qigswt/wan-r2v-role2.mp4" "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260129/qpzxps/wan-r2v-object4.png" "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260129/wfjikw/wan-r2v-backgroud5.png" --duration 10
python3 {baseDir}/scripts/wan-magic.py reference2video-gen --prompt "character2 坐在窗边弹吉他,character1 在旁边听。character1 说:'弹得真好听。'" --reference-files "https://example.com/listener.mp4" "https://example.com/guitarist.mp4" --shot-type "multi" --duration 10 --size "1920*1080"

选项

  • --duration: 视频时长(秒)(默认值:5,最大值:10)
  • --prompt: 用于视频生成的用户提示。注意:使用 'character1' 指代参考文件中的第一个图像/视频,使用 'character2' 指代参考文件中的第二个图像/视频。
  • --reference-files: 用于视频生成的参考图像或/和视频(参考URL)。生成的视频通常会以参考文件中的角色/声音/场景为参考。参考图像和视频必须是URL。每个URL可以是一个图像或视频。图像数量:05张图像;视频数量:03个视频;图像+视频总数:少于5个。
  • --resolution: 视频分辨率(默认值:19201080,支持任何720P和1080P分辨率,例如:7201280,1280720,960960,1088832,8321088,19201080,10801920,14401440,16321248,1248*1632)
  • --shot-type: 视频的拍摄类型。"single"表示连续镜头,"multi"表示视频的智能多镜头(默认值:single)

reference2video tasks-get(round-robin)

python3 {baseDir}/scripts/wan-magic.py reference2video-get --task-id “<TASK_ID_FROM_VIDEO_GEN>”

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏

文章底部电脑广告
手机广告位-内容正文底部

相关文章

您是本站第393630名访客 今日有1篇新文章/评论