据悉,智谱AI于7月26日发布AI生视频「清影」并上线智谱清言APP,可30秒将任意文图天生视频。
资料显示,CogVideoX开源模型包含多个不同尺寸大小的模型,目前智谱将开源CogVideoX-2B。
它在FP-16精度下的推理仅需18GB显存,微调则只须要40GB显存,这意味着单张4090显卡即可进行推理,而单张A6000显卡即可完成微调。
CogVideoX-2B的提示词上限为226个token,视频长度为6秒,帧率为8帧/秒,视频分辨率为720480。
智谱表示,为视频质量的提升预留了广阔的空间,期待开拓者们在提示词优化、视频长度、帧率、分辨率、场景微调以及环绕视频的各种功能开拓长进献开源力量。
(8900276)