Wan Image and Video Generation and Editting技能使用说明
2026-04-01
新闻来源:网淘吧
围观:19
电脑广告
手机广告
万相大模型
万相大模型由阿里巴巴集团推出,是一款广受欢迎的图像与视频生成及编辑模型,在全球范围内被广泛采用。本技能通过ModelStudio(百炼-阿里巴巴模型服务平台)集成了万相大模型的API。
文生图
根据文本提示生成图像

python3 {baseDir}/scripts/wan-magic.py text2image --prompt "一个女生站在楼顶的阳台上,夕阳照在她的脸上"
python3 {baseDir}/scripts/wan-magic.py text2image --prompt "一位长发女孩坐在书桌前,背对着镜头,戴着耳机。阳光透过窗户洒进房间,照亮了她和周围散落的书籍与杂物" --size 1280*1280
python3 {baseDir}/scripts/wan-magic.py text2image --prompt "女生优雅地倚在车门旁,身穿红色褶皱长裙,在复古色调的室内场景中缓慢转身看向镜头,霓虹光斑在玻璃窗上流动,轻微晃动,背景家具逐渐虚化凸显人物独白,画面带有电影胶片颗粒质感,港风朦胧光影映照出淡淡的忧伤情绪" --quantity 1
选项
--quantity: 生成图像数量(默认:1,最大:4)--prompt: 用于图像生成的用户提示词--size: 图像分辨率(默认:12801280,支持宽度和高度在512到1440像素之间的分辨率,前提是总像素数不超过14401440。常用分辨率:12801280,11041472,14721104,9601696,1696*960)
图生图(图像编辑)
基于图像生成图像(图像编辑)
python3 {baseDir}/scripts/wan-magic.py image-edit --prompt "参考图1的风格和图2的背景,生成一张全新的图片" \
--images 'https://cdn.wanx.aliyuncs.com/tmp/pressure/umbrella1.png' \
'https://img.alicdn.com/imgextra/i3/O1CN01SfG4J41UYn9WNt4X1_!!6000000002530-49-tps-1696-960.webp' \
--size "1280*1280"
python3 {baseDir}/scripts/wan-magic.py image-edit --prompt "参考图1的风格和图2的背景,生成一张全新的图片" \
--images '/Users/yejianhongali/workDir/pic1.png' \
'/Users/yejianhongali/workDir/pic2.webp'
python3 {baseDir}/scripts/wan-magic.py image-edit --prompt "参考图1的风格和图2的背景,生成一张全新的图片" --images 'https://cdn.wanx.aliyuncs.com/tmp/pressure/umbrella1.png' 'https://img.alicdn.com/imgextra/i3/O1CN01SfG4J41UYn9WNt4X1_!!6000000002530-49-tps-1696-960.webp' --quantity 1
选项
--quantity: 图片数量(默认:1,最大:4)--prompt: 图像编辑用户提示词--images: 待编辑图片(最少1张,最多4张)。可以是图片URL或本地图片文件(wan-magic.py脚本会将本地图片转换为base64并传递给模型API)--size: 图片分辨率(默认:12801280,支持宽度和高度在512到1440像素之间的分辨率,但总像素数不能超过14401440。常见分辨率:12801280,11041472,14721104,9601696,1696*960)
文生视频
根据文本提示词生成视频
文生视频任务-提交
python3 {baseDir}/scripts/wan-magic.py text2video-gen --prompt "一幅史诗级可爱的场景。一只小巧可爱的卡通小猫将军,身穿细节精致的金色盔甲,头戴一个稍大的头盔,勇敢地站在悬崖上。他骑着一匹虽小但英勇的战马,说:”青海长云暗雪山,孤城遥望玉门关。黄沙百战穿金甲,不破楼兰终不还。“。悬崖下方,一支由老鼠组成的、数量庞大、无穷无尽的军队正带着临时制作的武器向前冲锋。这是一个戏剧性的、大规模的战斗场景,灵感来自中国古代的战争史诗。远处的雪山上空,天空乌云密布。整体氛围是“可爱”与“霸气”的搞笑和史诗般的融合。" --duration 10 --size "1920*1080"
选项
--duration: 视频时长(秒)(默认:5,最大:15)--prompt视频生成的用户提示--size:图像分辨率(默认:19201080,支持720p和1080p的任何分辨率。要求:输入分辨率数值(例如1280720),而不是720p)
文本转视频任务-获取(轮询)
python3 {baseDir}/scripts/wan-magic.py text2video-get --task-id “<TASK_ID_FROM_VIDEO_GEN>”
图像转视频生成
以图像作为第一帧生成视频
图像转视频任务-提交
python3 {baseDir}/scripts/wan-magic.py image2video-gen --prompt "一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由他的rap构成,没有其他对话或杂音。" --image "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/wpimhv/rap.png" --duration 10 --resolution "720P"
python3 {baseDir}/scripts/wan-magic.py image2video-gen --prompt "一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由他的rap构成,没有其他对话或杂音。" --image "/Users/yejianhongali/workDir/rap.png"
选项
--duration:视频时长(秒)(默认:5,最大:15)--prompt:视频生成的用户提示--image:作为待生成视频第一帧的图像。可以是图像URL或本地图像文件(wan-magic.py脚本会将本地图像转换为base64并传递给模型API)--resolution:视频分辨率(默认:1080P,支持720P、1080P。要求:输入720P或1080P,而不是数值)
图像转视频任务-获取(轮询)
python3 {baseDir}/scripts/wan-magic.py image2video-get --task-id “<TASK_ID_FROM_VIDEO_GEN>”
参考图/视频生成视频
根据参考图像或/和视频生成视频
参考图/视频生成视频任务提交
python3 {baseDir}/scripts/wan-magic.py reference2video-gen --prompt "character1 在海边漫步,微风吹拂头发" --reference-files "https://example.com/person.mp4"
python3 {baseDir}/scripts/wan-magic.py reference2video-gen --prompt "character1 在咖啡厅看书" --reference-files "https://example.com/person.mp4/person.jpg" --duration 5
python3 {baseDir}/scripts/wan-magic.py reference2video-gen --prompt "Character2 坐在靠窗的椅子上,手持 character3,在 character4 旁演奏一首舒缓的美国乡村民谣。Character1 对Character2开口说道:“听起来不错”" --reference-files "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260129/hfugmr/wan-r2v-role1.mp4" "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260129/qigswt/wan-r2v-role2.mp4" "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260129/qpzxps/wan-r2v-object4.png" "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260129/wfjikw/wan-r2v-backgroud5.png" --duration 10
python3 {baseDir}/scripts/wan-magic.py reference2video-gen --prompt "character2 坐在窗边弹吉他,character1 在旁边听。character1 说:'弹得真好听。'" --reference-files "https://example.com/listener.mp4" "https://example.com/guitarist.mp4" --shot-type "multi" --duration 10 --size "1920*1080"
选项
--duration: 视频时长(秒)(默认值:5,最大值:10)--prompt: 用于视频生成的用户提示。注意:使用 'character1' 指代参考文件中的第一个图像/视频,使用 'character2' 指代参考文件中的第二个图像/视频。--reference-files: 用于视频生成的参考图像或/和视频(参考URL)。生成的视频通常会以参考文件中的角色/声音/场景为参考。参考图像和视频必须是URL。每个URL可以是一个图像或视频。图像数量:05张图像;视频数量:03个视频;图像+视频总数:少于5个。--resolution: 视频分辨率(默认值:19201080,支持任何720P和1080P分辨率,例如:7201280,1280720,960960,1088832,8321088,19201080,10801920,14401440,16321248,1248*1632)--shot-type: 视频的拍摄类型。"single"表示连续镜头,"multi"表示视频的智能多镜头(默认值:single)
reference2video tasks-get(round-robin)
python3 {baseDir}/scripts/wan-magic.py reference2video-get --task-id “<TASK_ID_FROM_VIDEO_GEN>”
文章底部电脑广告
手机广告位-内容正文底部


微信扫一扫,打赏作者吧~