MGIE模型(mllm勾引的图像编辑),可以运用于大略和更繁芜的图像编辑任务,比如修正照片中的特定物体,使它们具有不同的形状或更亮。该模型稠浊了多模态措辞模型的两种不同用法。首先,它学习如何阐明用户提示。然后,它会“想象”编辑后的样子。例如,哀求在照片中添加更蓝的天空,就会增加图像中天空部分的亮度。
MGIE不是大略而模糊的辅导,而是衍生出明确的视觉感知意图,并导致合理的图像编辑。我们从各个编辑方面进行了广泛的研究,并证明我们的MGIE在保持竞争效率的同时有效地提高了性能。我们也相信mllm辅导的框架可以为未来的视觉和措辞研究做出贡献,”研究职员在论文中说。
与微软、Meta或谷歌不同,苹果在天生式AI领域并不是一个大玩家,但苹果首席实行官蒂姆·库克表示,该公司希望今年在其设备中添加更多人工智能功能。2023年12月,苹果研究职员发布了一个名为MLX的开源机器学习框架,使在苹果硅芯片上演习AI模型变得更随意马虎。