此外,为了实现更好的效果,研究人员还采用了 ClipUp 优化器。
从对比中可以看到,使用优化器后迭代 1 万次后的效果比基本算法迭代 56 万次后的还要好。
同时,与基于梯度的渲染方法对比,ES 算法的表现也可圈可点。
渲染方法会更侧重于纹理和颜色上的细化,而 ES 算法会更加侧重于如何布局这些三角形。
那么给出文本指令生成的效果如何呢?
在“Self”、“Human”、“Walt Disney World(迪士尼乐园)”几个案例中,算法的表现依旧很优秀。
在体现关键字主题精髓的情况下,随着构图三角形数量的增多,算法给出的结果细节也就更为丰富。
但是在“picture of Tokyo”这个例子中,它的表现就不那么好了。
研究人员认为这是由于算法在生成阴影较深的三角形上还存在困难,所以造成了这一结果。
而且面对命题作业,算法也会尽可能给出不同的答案。
在这几个案例的重复 4 次测试中,我们可以看到生成的图像都存在明显的区别。
Demo 可试玩其实这并不是 CLIP 第一次“指挥”别的 AI 作画了。
此前与 GAN 配合,就让图像变成了 CG 艺术风。