这节内容我们将深入探讨Stable Diffusion图生图技术,学习如何将三次元照片转化为二次元动漫头像。
这不仅是一个技术挑战,也是一次创意的飞跃。如果你曾在淘宝上、拼多多上、闲鱼上看到过9块9的头像转换订单,那么今天的内容将帮助你理解背后的工作流程,并实现初步的头像转换。
一、图生图的由来与原理
在我们深入实操之前,让我们先来了解图生图的由来和原理。在以往的文生图学习中,文字的表达信息是有限的。图生图功能的出现,为我们提供了一个新的维度,让我们可以通过参考图片来传输更多的信息,从而获得更满意的生成结果。
图生图技术的核心在于结合文字提示和参考图片来生成新的图像。这一过程可以分解为以下几个关键步骤:
- 噪点的添加:首先,在参考图片上添加一层噪点。噪点的密度由“重绘幅度”参数决定,该参数控制着噪点的分布程度。重绘幅度较小时,噪点较少,图片保留更多原图特征;重绘幅度较大时,噪点多,图片变化更明显。
- 去噪过程:添加噪点后,系统会通过去噪过程来生成新的图像。这个过程中,文字提示词起到了指导作用,决定了去噪后图像的最终样式和内容。
- 参数的影响:重绘幅度和随机种子共同决定了噪点的分布,而提示词则指导着图像的生成方向。这个过程类似于在文生图的基础上增加了一个维度的控制,使得生成的图像更加符合用户的预期。
- 图像的微调:通过调整重绘幅度,我们可以控制图像的变化程度,从而在保留原图特征和进行创新之间找到平衡。这使得图生图技术在复制和创新之间具有强大的灵活性。
二、为什么要使用图生图?
以奢侈品香水静物图为例,我们可以看到,仅使用文生图很难复刻复杂的构图。
但是,通过图生图功能,我们可以将参考图片和提示词结合起来,生成更高质量的图片。
这不仅提高了图片的清晰度和质感,还在提示词的基础上进行了独特的设计。
三、图生图的参数设置
接下来,我们将学习图生图的关键参数设置:
1.参考图片
选择你想要生成结果接近的图片。
2.图生图提示词
根据参考图片编写提示词,或者使用AI反推功能来辅助编写。
- Clip反推:反推出句子类型的提示词
- DeepBooru反推(淘汰):反推出单词类型的提示词
注意
无论哪种反推方式,都无法避免反推的不全面、不准确。需要手动进行调整、补充。
3.缩放模式
根据需要调整图片的尺寸,有仅调整大小、裁剪后缩放、缩放后填充空白等选项。
- 仅调整大小:图片拉伸压缩,导致图片变形
- 裁剪后缩放:裁剪参考图片,只显示相应尺寸内的内容
- 缩放后填充空白:参考图整张图片都缩小后囊括,再自动填充空白部分
- 调整大小(潜空间放大):图片拉伸压缩,导致图片变形
4.重绘幅度
控制噪点的密度,影响生成图片的变化程度。
0.1-0.4:整体不变
0.4-0.7:画面大修
0.8-1:回炉重造
5.重绘尺寸/重绘尺寸倍数
四、三次元照片转为二次元动漫头像
现在,让我们来看如何将三次元照片转化为二次元动漫头像:
上传图片:将客户的照片上传到Stable Diffusion界面。
选择大模型:选择一个适合二次元风格的大模型,如anything v5。
编写正面提示词:使用反推功能获取提示词,并根据需要进行调整。
设置参数:选择合适的缩放模式,调整重绘幅度,以保持原图的构图和颜色,同时实现卡通化效果。
生成头像:通过多次尝试不同的重绘幅度,选择最满意的头像。
五、总结
通过今天的学习,我们已经掌握了将三次元照片转化为二次元动漫头像的基本方法。
当然,这只是一个起点,后续我们还可以结合更多的插件和技术,进一步提升生成效果。
希望这篇文章能帮助你更好地理解Stable Diffusion技术,并激发你的创造力。