据悉,CogVideoX不仅丰富了智谱清言的AI视频生成功能「清影」的能力,更在内容连贯性、可控性等方面实现了显著提升。
该模型的核心技能亮点在于其高效的三维变分自编码器构造,这一创新设计有效降落了视频数据的存储与处理本钱,同时增强了模型在韶光维度上对帧间关系的捕捉能力,确保了视频内容的连贯与自然。

在可控性方面,CogVideoX采取了一款前辈的端到端视频理解模型,能够深度解析用户输入的文本指令,并据此生成精准匹配的视频内容。
这一功能尤实在用于处理繁芜且冗长的prompt指令,显著提升了用户创作的自由度与满意度。

值得把稳的是,CogVideoX还引入了全新的三维领悟transformer架构,该架构通过摒弃传统的cross attention模块,转而采取Expert Block与Full Attention机制,实现了文本、韶光与空间三者的无缝领悟,进一步优化了模态间的交互效果,使得天生的视频更加生动、逼真。

「清影」作为CogVideoX在智谱清言平台上的直接应用,其快速天生能力尤为引人瞩目。
用户仅需等待30秒,即可得到一段6秒长的视频作品。
此外,「清影」还展现出了卓越的指令遵照能力和内容连贯性,能够准确捕捉并还原物理天下中的繁芜运动过程。
同时,其灵巧的画面调度功能也为用户供应了更多创意表达的空间。

智谱推出AI视频大年夜模型清影 30秒将随便率性文字生成视频

为了更好地做事企业和开拓者用户,智谱大模型开放平台bigmodel.cn也已支配了「清影」功能。
通过API调用办法,企业和开拓者可以轻松接入并体验「清影」的文本天生视频和图像天生视频做事,进一步拓展AI视频创作的边界与可能。