一、剧本分镜
先说一下我们为什么会选择《2012》这个题材, 由于我们深知AI 视频还是在 4s 时期。
在4秒时期,AI在处理人物细节方面还有提升的空间,但在营造伟大场面方面却表现得非常出色,这正是AI的强项。
我们制作视频的目标便是要发挥AI的这一上风。
想想看,过去要拍摄那些宏伟的场景,导演可能须要投入巨额资金和大量韶光,而现在有了AI的帮助,这些震荡的场景可以迅速且高效地呈现出来。
虽然AI在风雅掌握人物表现上还有待提高,但在制作大规模场景方面却已经非常出色。
因此,我们本着‘扬长避短’的原则,选择了灾害片这种类型,它们以伟大场景为主,人物刻画相对较少,这样可以更好地利用AI的上风,同时避免其目前的局限。
关于制作本钱和韶光。全体制作下来,算上所有环节,也就几个小时的功夫。
等我们更闇练了,这个韶光还能进一步缩短,说不定一两个小时就能搞定一部短片。
说到电影本身,我们得从写剧本开始。由于创作一个好剧本是比较难的,而我们又是对经典IP做AI化,以是我们决定,借鉴一下《2012》的原片预报片,这样能更快上手。
1、剪映法
分镜这块我们也是一比一按照原片进行复刻,利用到了剪映的“智能镜头分割”功能,非常好用。接着导出静帧画面。
一比一复刻只是个中一种方法,当你具备利用AI技能复刻的能力,有剧本和分镜,原创的能力不是自然而然,迎刃而解了么
2、Gemini 法
当然,这里还可以如果碰着心仪的视频,想拆解视频的镜头,可以利用利用 Gemini 1.5 Pro,做视频剖析和拆解 https://aistudio.google.com/
这里把《2012》原预报片丢进去剖析,镜头识别准确度很高,很好用。
拆解prompt如下
请你用极致详细的言语描述个中的每个镜头,包括个中有什么物体,在实行什么动作,产生什么形变,为什么这样设计分镜等等。
Gemini 1.5 Pro给出的全文如下,非常详细,可以用这个优化下做每个镜头的图片提示词。输出该当是这样:
二、AI出图
在谈论图片天生的工具选择时,我们决定采取Midjourney。相较于Dall-E和Stable Diffusion(SD),Midjourney在呈现电影感的审美方面表现得更为出色,目前它是唯一能够达到这种视觉效果的工具。
许多人对付如何授予图片电影感这一问题感到好奇,常问为什么他们制作的图像缺少这种电影式的质感。
事实上,创造出电影感的图像并非难事,这背后实在有一套详细的公式。
这包括了画幅的选择、镜头利用、景深掌握、构图技巧以及光影的处理。
详细而言,要实现电影感,须要在远景、近景和特写之间不断切换;
在展示主体时,背景应适当虚化以突出主体;在构图上,推举利用三分法来达到更加平衡和吸引人的视觉效果。
在关键词选择上,可以添加“cinematic scene --ar 21:9”来增强电影效果。
此外,画幅的选择也至关主要,推举利用21:9的宽幅比例,这不仅能够仿照电影银幕的宽阔视野,还能在编辑时保留高下黑边,便于在黑边区域添加字幕。
这样的细节处理将在后续的项目中得到更多关注和优化。
通过这些技能和创意的综合利用,我们能够创造出具有强烈电影感的视觉作品。
在天生图片的时候,我们采取了反推提示词、垫图、在 MJ 画廊找对标这三种办法:
1、反推提示词
反推提示词的方法便是/describe 指令,加上你上传的原图片,发送出去即可
很快就会根据上传的图片反推出 4 个提示词
可以点击下方的四个按钮,利用对应提示词天生图片
记得将这四个提示词改一下后缀,例如 --ar 21:9等,否则会根据原图的尺寸进行天生
或者直接复制提示词到autojourney插件中自动发送即可
利用 /describe 反推出来的提示词天生图片,效果不一定能达到咱们的预期,此时我们就可以选择第二种方案垫图
2、垫图
垫图的办法是先上传一张自己的图片,MJ 一次可以批量上传 9 张图
上传图片了之后点击大图,右键复制图片地址,即可。
之后用指令/imagine,在提示词张输入“图片地址链接 (空格) 笔墨提示词 --iw(可选,与原图的相似度,数值区间 0~2 ,默认是 1 )”
这里首先要放图片地址链接,接着空格,然后要输入笔墨提示词,必须要有笔墨提示词!
然后便是后面的参数了,完成之后直接回车发送即可。
这里利用垫图大家也可以多roll几次,有几率得到更好的效果,大家下载图片时,一定要打开大图,下载出来才是高清的,否则是标清图。
这边有一个小女孩在飞机舷窗里哭泣的镜头,我就roll了很多次,然后还改了改提示词,才终极得到了一张轻微满意的图
原图:
垫图:
3、MJ 画廊找对标
在 MJ 里也可以找对标的图片,https://www.midjourney.com/explore?
例如输入灾害片“Disaster films”
这样就能找到很多类似的图片了,可以选择适宜自己的,然后获取他的 prompt,自己修正一下,重新发给 MJ 即可。
4、人物同等性
在 Midjourney 更新到V6版本之后不久,又推出了 cref 命令来掌握人物同等性,实测下来非常好用
在原片中有这样一个须要人物连续涌现的场景
第一个镜头:父亲正在开车和女儿谈天的镜头
第二个镜头:父亲举头向上看陨石坠落
第三个镜头:父亲在烟尘中开车的镜头
这时候就须要利用到 --cref 命令,首先还是一样,结合之前的垫图,在整段命令的末了,加入 --cref 以及须要参考的图片地址。
首先第一个镜头是通过垫图得到,之后将第一个镜头作为参考图地址,天生第二个镜头、第三个镜头
第二个镜头:垫图 + 人物同等性 ,这里也须要多 roll 几次,才能得到一个较为满意的图片
镜头三
三、AI 图转视频
1、平台选择
在Sora平台推出之前,目前盛行的依然是利用4秒图像转换视频的技能。
由于用AI工具天生视频,紧张便是看运镜的效果、人物的动作幅度、画面的流畅性。
在这方面,我最常利用的AI工具是Runway和Dreamina,以下是一些常用工具的比拟。
工具
网址
用度
特点
Runway
https://runwayml.com/
收费
综合能力最强
Pika
https://pika.art/
收费
可控性强、可以对嘴型、可自动天生音效
SVD
https://stablevideo.com/
一天有4次免费额度,本地支配,完备免费
元素光芒不易变形
PixVerse
https://pixverse.ai/
免费
效果与Runway差不多,无明显短板
Dreamina
https://dreamina.jianying.com/
逐日免费60积分,一个视频12积分
运动幅度大,可控性不强
Dreamina,之前在其内测阶段由于积分较多,利用起来非常舒畅,现在公测之后逐日只有60积分。
在我制作的短片中,Runway和Dreamina的利用比例大约是90%对10%。
我更方向于利用Runway来制作视频,由于它的综合性能较强,尤其是在电影感的摄像运镜方面表现得非常出色。与之比较,Dreamina在处理大幅度人物动作方面有其独到之处,同时它对中文提示词的支持也更好,但其帧率较低,常日须要利用额外的补帧工具来优化输出。
Dreamina还拥有一个独特的功能——首尾帧技能,用户只需设定视频的首尾帧,AI便能自动补全中间的动作轨迹。这一功能非常有趣,预示着未来可能会发展出更多创新的运用办法。
接下来,我想详细先容一下Runway的利用技巧。在制作大型景不雅观的远景时,我常常采取顺着物体运动方向的摄像技巧。
2、镜头移动
在场景转换时,可以设置zoom来掌握相机的推进和拉远,可以更稳定的掌握视频效果。
其他镜头掌握:画面旁边移动,画面高下移动,画面顺时针逆时针旋转等等
3、运动强度
末了,为了保持视频的稳定性,我会将动态强度设置得较弱,防止画面过度运动导致崩盘。
运动强度:1~10,推举 1~3,比较稳定
4、运动笔刷
也可以利用运动笔刷涂抹我们须要运动的地方,点击 AUTO-detect area 可以开启自动选择区域,如果不开启就要手动涂抹了,之后可以设置相应的运动参数
这样,视频不仅展示了精细的视觉效果,还确保了不雅观看时的流畅性和舒适度。
四、音效
原片里的声音挺多样的,有车喇叭声、爆炸声,还有海啸声。
这些声音里,有些是可以直接用的,有些得重新做。
至于人说话和旁白的声音,我们可以用声音克隆的技能来搞定,这样听起来会更自然、更贴近原声。
1、音效获取
想要找音效挺方便的,有个网站专门供应各种音效,比如爆炸声、汽车声、火焰声等等,挺全的。
其余,剪映这个平台上也有很多音效资源,除了背景音乐(BGM),还有不少常用的音效可以下载利用。
例如:http://www.yinxiao.com
剪映这个软件用起来挺大略的,找音效的步骤大概是这样的:
打开剪映,进入它的音频库。在音频库里头,你会看到有音乐和音效两个部分。音乐部分便是各种背景音乐,音效部分则包含了很多不同的声音效果。如果你须要从视频中提取音频,剪映也支持这个功能,可以直接提取出来利用。2、elevenlabs声音克隆
我们打开这个网站:https:/elevenlabs.io/,点sign in登录(淘宝购买的直接输入登录即可)点击voices点击 add generative or cloned voices点击 instant voice cloning给项目随意命个名,把25个切割音频拖入,add voice等待几分钟音频克隆完成,选择use在文本框输入笔墨脚本,voice settings可以对克隆的声音进行设置五、剪辑
等我们所有的分镜视频制作完成后,就到了剪辑,
首先,这里我们也还是利用剪映的“智能镜头分割”功能,将我们的分镜与原篇的分镜对齐,
这里不乏一些分外的镜头无法做到,我们就可以适当忽略,或者做出适当调度,比如拉长分镜、删除分镜,或者利用其他分镜代替。
这样做还有一个好处,便是我们可以直策应用原篇的音频。
1、变速技巧
AI技能处理的视频在前4秒特殊稳,以是剪辑时可以倒着放,然后加个速率变革,让画面一开始就很有动感,先是快然后逐步变慢。接下来,用点殊效转场,让视频更流畅。有些大场景我们也可以加入闪进变速,使得画面更具冲击力,先快后慢。
2、转场技巧
在我们将分镜对齐完成之后,我们只须要根据原片的转场,添加对应的转场即可,比如闪黑、叠化、叠加
闪黑一样平常用在不同场景的切换,叠化叠加一样平常用在同场景的切换、或者是回顾、想法的过渡转场。
个中也会有一些高速切换的分镜无需转场,终极效果如下
3、音效技巧
音乐处理也很关键,开始时音量小点,然后逐步变大,这样不雅观众听起来会很自然。视频结束时,音量再逐步减小,给不雅观众留个回味的空间,不至于太突兀。然后在一些地震的场景上,添加轻微抖动的殊效,让画面看起来更生动立体。
如果视频里有别人的声音,可以用技能手段提取出来去掉,然后加上自己的声音,或者用自己处理过的声音替代,这样视频就更有自己的风格了。
4、字幕
在某些黑幕笔墨转场时,我们也添加相应的笔墨,调度笔墨样式、入场、出场动画。
字幕也可以批量进行操作,统一调度字幕的大小,只管即便小一点,然后放到离底部边缘近的地方,这样可以显得全体电影质感更高
5、封面设计
封面设计也特殊主要,尤其是像小红书和B站这样的平台。小红书的封面是竖着的,B站的是横的,以是要根据平台哀求来设计。封面要能突出视频的主题,字体大小要适中,既不能太大也不能太小。
到这里,全体AI《2012》短片的剪辑流程就已经全部结束了。
六、总结
坦率的讲,我们这次的短片《2012》,还是有很多可以优化的地方了。
但是朋友有一句话说的很好:
我们每个人当下的每一步都不是最完美的,但是都在进步,朝着完美的方向去努力!
人生又何尝不是缺憾的艺术呢。