量子位 出品 | "大众年夜众号 QbitAI

如何一键减少修图时的拼接感?不如看看这篇CVPR 19论文怎么说。

来自马里兰大学、马克斯·普朗克信息学研究所、Adobe的研究职员提出了一种新型纹理稠浊器Texture Mixer。

他们利用深度学习和GAN实现了用户可控的纹理图像插值,领悟两种不同类型的纹理样式,过渡丝滑自然。

老虎斑马杂交长啥样CVPR19论文开源的纹理混淆器告诉你

就像下面这样:

你以为只领悟纹理就完了?它还有更多好玩的运用,比如这个已经实现的纹理画笔功能,轻松合成出你想要花纹的笔墨:

乃至,还能预览不同物种的动物组合后皮毛图案的渐变。

狗+熊≠狗熊:

原来长颈鹿+豹子的皮毛花色拼凑起来也不违和:

老虎和斑马皮毛和纹理也能自然过渡:

这么有趣的研究,干系资源也是共享状态。

目前,更多展示、代码、演习测试数据集、已演习好的模型和补充材料都已经在项目GitHub上放出了。

在潜在空间动刀

在论文Texture Mixer: A Network for Controllable Synthesis and Interpolation of Texture里,研究职员揭秘了纹理稠浊的诀窍。

他们通过样本可控性和在任意数量的纹理样本之间进行插值,提出了新型纹理稠浊器Texture Mixer。

这是一种用重修任务和天生任务演习过的神经网络,可将样本的纹理投射到潜在空间,并被线性插值并投射到图像域中,从而确保直不雅观掌握和实际天生结果的质量。

全体合成流程的示意图如下:

上图中,箭头和圆圈表示对张量数据的运算,背景颜色突出显示的是不同阶段的任务,梯形表示可演习的组件,如果名称能匹配得上则这些组件可共享权重。

考虑到潜在张量,Texture Mixer利用了3种直觉潜在空间运算:平铺(tiling)、插值(interpolation)和多级混洗(shuffling)。

三种运算办法各有任务,平铺运算用来将空间上的纹理扩展到任意大小,插值运算将两个及以上潜在域中纹理的结合在一起,多级混洗预算将将相邻潜在张量中的小方块互换减少重复,然后对这些新的潜在张量进行解码得到插值。

结果显示,这种纹理稠浊方法优于许多基准, 研究职员进一步展示了视觉编辑运用的实际效果,并用纹理溶解(texture dissolve)、纹理画笔(texture brush)、和动物杂交(animal hybridization)任务进行测试。

在动物纹理数据集上进行纹理溶解任务,开始是这样的:

末了的合成结果是这样的:

在纹理画笔任务中,研究职员在1024×1024调色板上分别选取四块原纹理区域,随后用不同纹理进行新的字母绘画创作。

比如天生CVPR四个字母,不用纹理之间的差异还是很明显的:

在动物杂交任务中,研究职员将狗和熊两种动物皮毛的纹理领悟,末了就合成了一幅狗+熊≠狗熊的动物。

末了,研究职员利用地球纹理和动物纹理数据集对合成纹理的质量进行定量评估,加粗代表最好的结果,下划线代表第二好的结果,赤色代表每个指标中很高的数值。

结果显示,在可掌握性、平滑程度、真实性等维度,Texture Mixer的表现都还不错。

末了,研究职员用雷达图将测试结果可视化。

前四种是基线方法,后三种是溶解候选方法,结果显示,这种新方法在所有指标上都高于基线性能,并在各个维度取得了比较高的成绩。

作者团队

论文一作于宁是一位华人,本科毕业于华中科技大学,目前是读于美国马里兰大学和德国马克斯普朗打算机研究所(Max Planck Institute for Informatics)的一名博士生。

于同学个人主页显示,紧张研究打算机视觉、打算机图形学和深度学习,想建立视觉和图形问题之间的互补性。

除了于同学外,还有来自Adobe的研究员Connelly Barnes、Eli Shechtman、Sohrab Amirghodsi和Michal Lukac。

传送门

论文地址:

https://arxiv.org/abs/1901.03447

GitHub地址:

https://github.com/ningyu1991/TextureMixer

— 完 —

诚挚招聘

量子位正在招募编辑/,事情地点在北京中关村落。
期待有才华、有激情亲切的同学加入我们!
干系细节,请在量子位公众年夜众号(QbitAI)对话界面,回答“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技能和产品新动态