快速导读:微软的研究职员开拓了VASA-1,这是一个AI工具,可以仅利用静态图像创建逼真的人物视频。只管该工具整体上令人印象深刻,但它在渲染牙齿方面存在困难,导致视频呈现出卡通般的外不雅观。该模型通过将静态照片或AI天生的面部与音频文件同步,以产生具有自然面部细微差异的视频。只管存在毛病,VASA-1可以快速天生高质量的视频,延迟仅为0.17秒。然而,微软目前没有立即发布该工具的操持,强调了负任务利用和监管的必要性。
令人印象深刻的视频天生,但有一个毛病
微软开拓的VASA-1 AI工具可以仅利用静态图像天生令人信服的人物视频。通过向工具供应音频文件,它可以将面部细微差异和自然动作与图像同步,从而天生逼真的视频。然而,该工具在渲染牙齿方面存在困难,与别的视频的超逼真质量比较,牙齿可能呈现出卡通般的外不雅观,不太折衷。只管存在这个毛病,VASA-1可以在仅利用单个NVIDIA RTX 4090 GPU的台式电脑上快速天生高质量的视频,延迟仅为0.17秒。
负任务的利用和未来潜力只管VASA-1 AI工具在天生逼真视频方面显示出潜力,微软目前没有立即发布它的操持。研究职员意识到潜在的危险,并强调了负任务利用和遵守监管的必要性。他们承认该技能在增强教诲公正性、改进可访问性以及供应陪伴或治疗支持方面的好处。然而,在他们确信该技能将被负任务利用之前,微软不会发布在线演示、API或任何干系产品。这种谨慎的态度是为了防止潜在的敲诈和技能滥用。
在AI天生虚假内容的时刻日制潜在危害随着AI天生虚假内容的遍及,对付像微软这样的大公司来说,采纳方法限定潜在危害至关主要。研究职员对与这项技能干系的危险的认识在他们决定不急于发布它时表现得很明显。虚假信息的威胁以及在各种背景下进行操纵的潜力,包括政治选举,凸显了负任务的开拓和监管的必要性。随着技能的不断进步,优先考虑人类福祉并确保AI天生的虚假内容不毁坏对数字领域的信赖至关主要。