ThinkChat🤖让你学习和工作更高效,注册即送10W Token,即刻开启你的AI之旅 广告
**风格**(style)是指图像中不同空间尺度的纹理、颜色和视觉图案,**内容**(content)是指图像的高级宏观结构 ### **内容损失:** 网络更靠底部的层激活包含关于图像的**局部**信息,而更靠近顶部的层则包含更加**全局**、更加**抽象**的信息 **两个激活之间的 L2 范数:** * 预训练的卷积神经网络更靠顶部的某层在目标图像上计算得到的激活 * 同一层在生成图像上计算得到的激活 ### **风格损失:** * 层激活的**格拉姆矩阵**(Gram matrix),即某一层特征图的内积 * 可以被理解成表示该层特征之间相互关系的映射 ### **原理:** * 在目标内容图像和生成图像之间保持相似的**较高层激活**,从而能够**保留内容**。卷积神经网络应该能够“看到”目标图像和生成图像包含相同的内容。 * 在**较低层**和**较高层**的激活中保持类似的**相互关系**(correlation),从而能够**保留风格**。 * 特征相互关系捕捉到的是**纹理**(texture)生成图像和风格参考图像在不同的空间尺度上应该具有相同的纹理。 ### **一般过程:** * [ ] 创建一个网络,它能够同时计算风格参考图像、目标图像和生成图像的 VGG19 层激活。 * [ ] 使用这三张图像上计算的层激活来定义之前所述的损失函数,为了实现风格迁移,需要将这个损失函数最小化。 * [ ] 设置梯度下降过程来将这个损失函数最小化。 **注意**:需要将所有图像的高度调整为 400 像素 ![](https://img.kancloud.cn/02/1a/021acfd72547f4bf6dcf97ec4a87db9a_933x443.png)