斯坦福大学的研究团队,推出了个对口型AI视频天生工具-Herdra,他能将一张照片和一个音频,天生表情/动作丰富的口播短视频。
让任何一张照片像真人一样,开口说话,比较之前的那种图片数字人,Herdra在动作/神态上提升巨大,效果已经逼近视频数字人。
亮点:
①口型能对的上
②时长能达到30秒
③表情神态丰富,高度拟真!
用来做意见意义配音视频,切实其实是绝配,本钱极低,操作方便。
中秋到了,看个我拿它做的小品《大话三国之中秋送礼》
视频加载中...
把稳看,三国视频中人物的动作、表情、眨眼、眉毛等细节,很真实自然,完备觉得不出来是用图片天生的,如果不是画面中还存在一些异动瑕疵,就真的能以假乱真了。
制作事情流:
①手写剧本
②用fish.audio配音{教程》》仅需10秒,用AI克隆任何人声音!
}
③百度找人物图片
④频Herdra天生视频素材
这类古装置音恶搞视频,过去做起来还是挺麻烦的,这个事情流就比较大略了。
更牛的是,连非真人的“兵马俑”,Herdra同样能它活拨乱跳
这是兵马俑+关羽的结合体。
视频加载中...
表情动作管理同样出色,真的像活了一样。
背景大略,轮廓光鲜突出的图片,效果会更好,这个兵马俑明显瑕疵比三国版更少。如果有高质量的真人照片,效果会更好。
利用解释
01注册
电脑浏览器打开官网注册
地址 https://www.hedra.com/
可选择
①谷哥登录
②邮箱注册(支持QQ邮箱,亲测可用)
把稳了:邮箱注册,一定要先点sign up
02天生视频
注册登录后,首页点Create,进入制作界面。
然后,这里上传音频和图片即可,3步即可天生视频,目前最长30秒。
把稳:第一步左侧,Generate,这里可以在线输入文案,然后制作口播音频。当然了,声音就只能用系统自带音色了。
如果想要分外音色,还是得先真人配音,或其他AI音频工具天生后,再上传。
天生解释:
①视频画面为1:1,上传图片会自动裁切。
②免费版有水印,每天只能天生5个视频,多注册几个账号,基本可以白嫖。
我的觉得,hedra像是通义千问全民舞王和D-ID得结合体,全民舞王的高拟真动作神态,再加上D-ID的图片数字人。目前效果确实还不错,只不过背景繁芜一点的图片,还是会有画面瑕疵,时长也还不足长。
假以时日,图片数字人,大概能替代视频数字人,大幅降落视频制作门槛。
原文详情》》AI对口型视频天生神器!
让图片像“真人”一样说话