最近,Sora的公布给所有行业的人带来了狠狠地Impact,所有从业者都在期待着AI动画/视频技能的改造,并为行业带来的效率提升。

本文将从游戏行业从业者的视角出发,谈谈当前对付AI动画/视频的一些思考。
BTW,目前AI技能日月牙异,本人对付某个领域的能力的AI技能认知可能有所滞后,欢迎示正。

一、游戏行业的美术资源

游戏行业是一个严重依赖美术资源的行业。
无论是在游戏的研发、营销还是运营过程中,都须要大量的美术资源。

1. 研发侧

在游戏研发阶段,策划设计游辱弄法和系统,将其交由美术团队进行角色、界面和场景设计,终极由开拓团队完成游戏的开拓和测试事情。
根据游戏类型的不同,所需的美术资源也会有所差异。

浅淡游戏行业当前的AI动画/视频对象

美术资源紧张分为:

2D美术资源(如角色设计、背景设计、道具设计、UI界面设计)3D美术资源(如角色建模、场景建模、动画设计、贴图纹理)动画资源(括角色动作、战斗效果、场景光影以及UI交互等)

根据东方财富证券的报告,游戏研发本钱占收入比约在 15%-35%,美术本钱一样平常占到游戏研发本钱的 50-70%。
根据伽马数据,2023年中国游戏市场实际发卖收入3029.64亿元。
因此,此处美术本钱约为200~800亿元。

数据来源:游戏工委、伽马数据(CNG)

2. 营销侧

在游戏开拓完成后,游戏公司须要进行游戏营销,以有限的本钱吸引更多精准的用户。
常见的获客手段包括投放广告、联合运营和品牌宣扬等。
在营销过程中,须要大量的营销美术资源,如图片、动图和视频,用于广告投放、联运商城以及品牌宣扬。
比如,我们常见的洗脑广告视频,这些是由真人拍摄的广告视频。

根据游戏新知的数据,营销一贯是游戏公司支出的主要部分,因此对美术资源的需求也非常高。

3. 运营侧

一旦吸引用户进入游戏,运营团队的紧张任务是促进用户生动、提高留存率并勾引用户进行付费转化。
在运营过程中,须要大量的美术资源,与营销所需的素材相似,但紧张用于运营活动和社群内容构建,包括图片、动图和视频等美术素材。

综上所述,游戏行业对美术资源的需求紧张分为3类:2D美术资源、3D美术资源和动画资源。

二、当前游戏行业美术对AI的运用

根据伽马数据的报告显示,自AI绘画技能问世以来,某游戏企业在美术方面取得了显著进展。
据称,该企业目前在美术方面的本钱节省率达到40%,文案创作效率提升超过50%,而未来在研发轫,整体本钱估量将低落30%。
以往须要两周完成的2D美术资源生产,如今仅需3天便可完成。

一个完全的2D美术资源的生产该当包含以下流程:

然而,由于当前AI技能的“可控性”和“稳定性”仍有提升空间,因此AI工具紧张在引发灵感、制作草稿以及需求确认等方面发挥浸染。

只管部分素材可以直接采取AI天生的成稿,但这仅适用于少数情形。
美术职员可以通过文生图/图生图等办法进行抽卡,引发创作灵感,并快速形成草稿,从而显著提高美术资源的生产效率。

同时,借助已天生的草稿,可以快速与需求方进行对齐。
或者,需求方可以通过AI工具天生样图,与美术职员进行需求确认。
这种办法可以大大减少由沟通问题导致的需求差异,从而减少返工情形,进一步提高美术资源的生产效率。

当前,虽然在3D美术资源领域已经涌现了一些能够快速天生资源的工具,但比较之下,仍未有2D美术资源的天生成熟,然而这方面的谈论将暂且搁置。
在美术资源的各个类型中,AI视频工具在动画美术资源的制作中发挥着一定的赞助浸染,只管也存在一些寻衅。
根据前文的剖析,游戏行业中动画素材的制作场景紧张涉及以下方面:

研发侧:角色动作、战斗效果、场景光影、UI交互等;营销侧:视频素材、动图素材;运营侧:活动/内容运营素材等;

所有这些方面都可以通过与AI动画/视频干系工具的结合来实现本钱降落、效率提升的目标。

我们先拆解下现在动画素材制作的流程,紧张有以下环节:

1. 探求灵感

在进行动画素材的制作之前,美术职员常日会利用第三方平台进行调研,以网络灵感和素材。

对付营销层面的视频素材的制作灵感网络,他们利用像DataEye、AppGrowing等网站,这些平台搜集了广告领域中最热门和最新的视频素材。
通过这些调研,制作者可以理解哪些素材在广告投放中效果良好、哪些是当前热门的素材,以及哪些具有潜力,从而辅导他们的视频素材创作。

然而,海量数据剖析是一项耗时耗力的事情。
动画/视频制作本身便是一个人力密集型的过程,如果还须要额外的韶光用于灵感网络,那将增加额外的本钱。

热门且效果良好的素材具有明显的数据特色,可以通过数据规则快速提取,但仍须要人工识别个中的参考内容。
而那些具有潜力的素材则每每没有明显的数据特色,因此只能在海量数据中进行挖掘,有些许像大海捞针。

假设我们能够运用AI技能来增强业务能力,通过AI动画/视频剖析,系统可以解构视频中的元素并进行标签分类,将这些分类信息存储在灵感库中,以便设计师快速提取灵感,同时也有助于快速创造潜力内容。
通过AI技能,我们可以将海量数据浓缩为高代价信息,从而提升业务生产效率。

目前,B站供应了AI视频剖析功能,但仅适用于部分视频。
没有配音或字幕的视频以及发布韶光早于24年的视频无法利用该功能。
估计B站的AI视频能力紧张通过OCR和语音识别技能提取视频文本内容,并将其提交给LLM进行总结。

然而,游戏的动画/视频素材生产,更多的是涉及没有文本内容的画面(角色动作、战斗效果、场景光影、UI交互、游戏实况视频等)。
类似于B站的视频剖析能力,目前还无法从这些画面中提取信息。
这就须要依赖基于视觉内容的AI剖析模型。
目前一些SaaS厂商供应了干系能力,但是要提炼出美术设计师所关心的内容仍旧具有一定难度,因此这些模型更多地用于视频内容审核。

图片来源于商汤(左)和网易易盾(右)

2. 制作草稿

动画素材本色上是2D/3D美术资源在韶光维度上的延续,因此动画的草稿相对繁芜,涉及脚本、分镜等设计内容,个中的沟通本钱和试错本钱远高于2D/3D美术资源。

目前存在几个方向的AI视频/动画工具,可以在制作草稿过程中发挥浸染:

1)素材搜索匹配:

在调研过程中,创造一类AI动画/视频工具,通过输入文本/图片,AI能够匹配干系度较高的视频素材并进行拼接,同时利用AI声音进行配音,快速天生干系动画/视频内容。

图中为度加创尴尬刁难象

这类AI动画/视频工具的核心在于素材搜索匹配能力。

通过对素材库中的视频进行剖析、拆解、打标签,再根据用户的提示词匹配最得当的动画/视频内容,从而拼接成动画/视频。
这个过程涉及到AI文本天生、语音合成、动画/视频剪辑等能力,可以归类为剪辑工具。

然而,当前这类工具可能存在以下问题:

i)素材高下文干系性:

由于视频是由多个素材拼接而成,若AI无法理解素材之间的关系,在动画/视频剪辑过程中利用了抵牾的素材,将影响终极成片效果。

ii)素材版权:

天生的动画/视频片段来源于其他视频素材,可能涉及版权问题。
工具须要办理和规避侵权内容的识别问题。

iii)素材库的大小:

素材库规模的大小直接影响这类视频天生工具的效果和天生的视频多样性。
弘大的素材库须要大量版权资源或内容平台支持,从而构建工具的“网络效应”,而较小的素材库会限定工具的效果。

因而,这个方向的AI工具,内容巨子企业才更随意马虎做得更好。

iv)搜索匹配的准确度:

动画/视频剖析AI对动画/视频内容的理解有限,导致搜索匹配结果准确度问题,与用户设想的画面可能存在一定差距。
在天生多个动画/视频片段拼接而成的视频时,准确率问题会叠加,使成品动画/视频偏离原始设想。

这些问题导致素材搜索匹配干系的AI产品工具,在当前并不是那么好用。

2)文/图生视频:

Sora属于文/图生视频的AI方向。
在Sora发布之前,市场上已有干系工具如Pika、RunwayGen2、Stable Video Diffusion,它们可以根据用户输入的文本或静态图片,天生几秒钟的视频/动画。

然而,目前市情上的文/图生视频AI工具存在明显毛病,例如:

i)未能理解物理天下:

正如Runway之前宣告要通用天下模型(General World Model),像Gen-2这样的视频天生AI,仅仅是天生了具有有一定运动的短视频,但是在处理摄像机运动或物体运动等问题上存在局限。

比如这里,我用张俩男孩斗殴的图片,天生的视频中,男孩挥出去的手反而贯穿了自己的脑袋。

虽然Sora也具备了通用天下模型的根本能力,但是也同样存在“对物理天下理解不敷”的问题,比如有名的“玻璃破碎”、“虚空椅子”。
这些演习数据不敷的情形,使得在多主体之间的运动无法被准确表达。

ii)主体同等性问题:

在AI天生的动画/视频中,人物外面、动作等可能随着人物动作的变革而发生变革,导致主体同等性问题,影响视频质量。
如下图的案例中,原来是天生马斯克的视频,但是在视频的末了几秒,马斯克变成了一个黄种女人。

视频素材来源于知乎用户sunny

iii)无法天生游戏行业垂直内容:

像是角色动作、战斗效果、场景光影、UI交互、游戏实况视频等内容,AI工具的天生效果极差。
因此对付游戏行业,大概率仅有视频类动画素材的生产过程才能用上这类AI工具。

3. 网络素材

制作视频类动画素材涉及网络素材的过程,个中须要结合分镜稿,网络足够的素材以供剪辑利用。
这一过程与制作草稿的工具需求大致相同,可以借助“素材搜索匹配”和“文/图生视频工具”的AI能力来赞助。

4. 成稿

一旦素材完好,下一步便是将所网络/制作的素材拼接成终极的成品稿。
这个过程涉及到多种类型的AI动画/视频工具,种类繁多且多样,较难逐一概括,以下是我不雅观察到的一些类型,而且大多都只能用在视频类型的素材剪辑上。

1)视频拆条:

这类工具旨在快速将视频按需求进行剪辑拆分和拼接。
举例来说,火山引擎供应了“视频拆条”功能,利用AI画面和语音识别自动将视频进行拆分,同时支持对视频进行进阶设置。
这种工具可用于对长视频进行分割处理,以便进行短视频合成。

又比如,“vidyo.ai”供应的视频拆条能力,在基于语音识别的根本上,还供应了针对不同内容平台的格式转化能力。

2)配音:

语音配音在制作视频类内容时扮演着重要的角色。
只管在严格意义上,配音并不属于AI视频工具的范畴,但却是制作视频内容不可或缺的一环。
当前的AI天生语音技能已经相称成熟,以剪映官方为例,他们供应了完善的配音音色功能,用户可以通过输入文本天生对应的音频内容。

3)字幕:

视频制作中不可或缺的一环是字幕。
随着技能的发展,字幕天生技能也日趋成熟,例如,剪映已经具备了自动天生字幕的能力。

4)画面编辑:

我以为很多视频工具都可以归到这一类里面,比如视频剪辑软件里面都会配备的滤镜能力,通过运用特定的滤镜效果,使视频呈现出特定风格和视觉效果。

同时,市情上也有能将够稳定将视频转换成其他风格的工具,如Ebsynth。

Runway里面除了视频天生能力,还供应了像是一键删除背景、一键修复、一键模糊等效果编辑AI。

perfectly-clear供应的编辑能力可用于改进视频的色彩、提高比拟度、肃清噪点、改进视频的清晰度,以及肃清视频中的抖动和模糊。

腾讯云供应的AI换脸技能将真人视频中的人脸更换成其他人脸。

5)数字人:

险些所有紧张厂商都在积极探索并运用这一技能。
其核心在于利用AI天生个性化的数字人物,并结合专属的AI音色,使得这些AI数字人可以替代用户进行视频讲授。
在直播带货等场景中,这种技能不仅可以提高效率,还能有效节省人力本钱。

四、小结

结合我的调研,目前游戏行业干系的AI视频/动画工具可分为4大类:

动画/视频剖析:利用人工智能的剖析和理解能力,提炼出美术设计所关注的核心信息,将大量信息压缩成关键要点,从而提高探求灵感的效率。
素材搜索匹配:基于视频剖析的AI技能,通过对素材库中的视频进行剖析、解构和标记,再根据用户供应的关键词匹配最适宜的动画/视频内容,提高视频类动画资源制作的效率。
动画/视频天生:基于天生式AI技能,能够通过文本和图像内容天生动画视频内容。
剪辑工具类:赞助动画资源的制作,提高制作效率。

目前的AI视频/动画工具更多倾向于视频类动画素材的生产,更适用于与营销干系的业务生产,由于这方面对于大型模型的定制化哀求较低。
然而,对付与动效干系的动画生产,可能须要游戏行业垂直领域大型模型能力的进一步发展。

我将网络到的AI视频/动画工具给到美术设计,他们的回答是:“彷佛什么都能做,但是又彷佛做不好的觉得。
总不能为了这碗醋(利用AI),才包的这顿饺子吧(做动画/视频)。
”阐发个中的缘故原由,紧张是:

素材搜索匹配、视频天生类当前AI工具对付游戏行业垂直程度不足高,无法天生足够高准度的内容。
而且动画素材有别于图片素材,AI图片天生内容的准确度不高时候,美术还可以上手修正,但是当AI视频天生的准确度不高的时候,逐帧修正本钱过高,不具有可行性。
工具分散,未能较好贴合生产流程。
大部分的AI工具分布在不同的平台上,“网络灵感”——“制作草稿”——“网络素材”——“剪辑成稿”的过程须要跳转的平台过多,同时各种工具的更新和版本调度也须要人力去跟进和掩护,再加上大部分工具利用场景很小,单独购买性价比不高。
整体须要耗费过多的精力和本钱,这有碍于AI工具对付制作的提效。
由于工具利用都是分散在各种工具平台上,AI工具的利用不能进行AI资产的积累,无法形成工具利用的“边际本钱递减”。
(比如文/图生图的AI利用,可以通过低模型演习、参数调试的办法,快速将AI工具变成业务的形状,提高生产效率)目前网络到的大部分AI视频/动画工具,普遍都是须要收费的。
要么按要求量收费,要么是会员制,动则每个月上百块。
结合前文提到的AI准确度不高和工具分散问题,业务可能须要在多个平台多次“抽卡”(调侃准确度不高,就彷佛游戏抽卡那样,须要N次才能出来想要的结果),这个过程大大加大了本钱的花费,使得AI的利用本钱乃至可能高于人肉。

随着越来越多AI公司的入局,以上提到的问题一定会被办理,正如万物摩尔定律所描述,本钱问题也会越来越低。
Sora的涌现,无疑是对这个过程的加速。

但是我也想谈谈我对未来展望的一些不雅观点,我以为未来的AI动画/视频工具一定是背靠视频剪辑/动画制作工具的,并集成大多数的AI工具(All in one),由于:

1.工具集成&贴合事情流带来的用户体验上风:

视频剪辑/动画制作工具本身便是贴合用户事情流程的产品形态。
当AI工具集成在一起时,用户可以直策应用AI能力进行生产,无需研究各种AI工具,减少额外精力花费。
同时,基于用户利用习气,产品可以供应AI数据资产积累能力,定制化模型,更贴合用户利用习气,构成用户的沉没本钱。

2.用户增长上风:

现有视频剪辑/动画制作工具已有一批虔诚用户群体,发展AI能力时无需从零开始用户增长。
在成熟工具上构建AI能力,加固了产品壁垒。

3.更随意马虎构建数据飞轮,构建数据壁垒:

借助平台原有的用户积累,能够利用弘大的素材积累、数据积累演习精良的大模型,打造优质的视频产品功能,从而吸引更多用户,构建数据飞轮,构建自身的壁垒。

4.工具更具有可控性问题的办理方案:

AI动画/视频天生工具是具有实质上的抵牾的,文本是低维信息,却须要准确表达动画/视频这种高维信息,这个过程必定伴随信息的失落真。
文生视频必定是不能100%传达制作者的想法的。
这个过程就须要编辑工具的存在,通过人工编辑的接入,将内容准确表达。
而且,通过编辑工具,我们也能通过人力填补AI的准确度问题,使得在AI能力能准确天生我们须要的内容之前,我们也能利用AI进行效率的提升。

因此背靠视频剪辑/动画制作工具,更随意马虎进行编辑工具构建,从而办理可控性问题。

专栏作家

柠檬饼干净又卫生,公众年夜众号:柠檬饼干净又卫生,大家都是产品经理专栏作家。
一名游戏行业的B端产品,卖力过游戏行业内CRM 、风控、BI、SDK、AI干系的内容,定期输出个人思考或总结文章~

本文原创发布于大家都是产品经理,未经容许,禁止转载

题图来自Unsplash,基于CC0协议

该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。