斯坦福大学的研究团队,推出了个对口型AI视频天生工具-Herdra,他能将一张照片和一个音频,天生表情/动作丰富的口播短视频。

让任何一张照片像真人一样,开口说话,比较之前的那种图片数字人,Herdra在动作/神态上提升巨大,效果已经逼近视频数字人。

亮点:

①口型能对的上

AI对口型视频生成神器让图片像真人一样措辞

②时长能达到30秒

③表情神态丰富,高度拟真!

用来做意见意义配音视频,切实其实是绝配,本钱极低,操作方便。

中秋到了,看个我拿它做的小品《大话三国之中秋送礼》

视频加载中...

把稳看,三国视频中人物的动作、表情、眨眼、眉毛等细节,很真实自然,完备觉得不出来是用图片天生的,如果不是画面中还存在一些异动瑕疵,就真的能以假乱真了。

制作事情流:

①手写剧本

②用fish.audio配音{教程》》仅需10秒,用AI克隆任何人声音!
}

③百度找人物图片

④频Herdra天生视频素材

这类古装置音恶搞视频,过去做起来还是挺麻烦的,这个事情流就比较大略了。

更牛的是,连非真人的“兵马俑”,Herdra同样能它活拨乱跳

这是兵马俑+关羽的结合体。

视频加载中...

表情动作管理同样出色,真的像活了一样。

背景大略,轮廓光鲜突出的图片,效果会更好,这个兵马俑明显瑕疵比三国版更少。
如果有高质量的真人照片,效果会更好。

利用解释

01注册

电脑浏览器打开官网注册

地址 https://www.hedra.com/

可选择

①谷哥登录

②邮箱注册(支持QQ邮箱,亲测可用)

把稳了:邮箱注册,一定要先点sign up

02天生视频

注册登录后,首页点Create,进入制作界面。

然后,这里上传音频和图片即可,3步即可天生视频,目前最长30秒。

把稳:第一步左侧,Generate,这里可以在线输入文案,然后制作口播音频。
当然了,声音就只能用系统自带音色了。

如果想要分外音色,还是得先真人配音,或其他AI音频工具天生后,再上传。

天生解释:

①视频画面为1:1,上传图片会自动裁切。

②免费版有水印,每天只能天生5个视频,多注册几个账号,基本可以白嫖。

我的觉得,hedra像是通义千问全民舞王和D-ID得结合体,全民舞王的高拟真动作神态,再加上D-ID的图片数字人。
目前效果确实还不错,只不过背景繁芜一点的图片,还是会有画面瑕疵,时长也还不足长。

假以时日,图片数字人,大概能替代视频数字人,大幅降落视频制作门槛。

原文详情》》AI对口型视频天生神器!
让图片像“真人”一样说话