继上节内容,我们探讨了Stable Diffusion的基础参数后,今天我们将继续深入学习更多高级参数,这些参数将帮助大家更精细地控制AI绘画过程,并提升画面效果。本文将详细讲解图片尺寸设置、高清修复、多张图片生成、提示词引导系数和随机种子等关键知识点。
一、图片尺寸设置
在AI绘画中,图片尺寸的设置至关重要,它直接影响到画面的布局和质量。
- 尺寸限制:Stable Diffusion在生成图片时,宽度和高度建议设置在512到768像素之间,以保持结构的基本正确。这是因为模型在训练时使用的图片尺寸是512像素乘以512像素,超出这个范围可能导致画面比例不协调或质量下降。
- 性能考量:更高的分辨率会占用更多的显存,对电脑配置有更高要求。例如,6GB显存的电脑在设置宽度和高度超过512像素时可能会遇到显存不足的问题。
- 构图关系:图片尺寸应与构图相匹配。512x512适合特写,512x768适合全身像,而更宽的比例如768x512则适合风景题材。
二、高分辨率修复
在AI绘画中,高分辨率修复是一个关键功能,它允许我们从较低分辨率的图像生成高清晰度的图像。
1、高分辨率修复的重要性
- 分辨率限制:Stable Diffusion在默认设置下,生成的图像分辨率有限,尤其在面部细节和整体清晰度上可能不尽人意。
- 提升质量:高分辨率修复通过增加图像的像素数量,改善画面的清晰度和细节,尤其是对于面部特征的精细刻画。
2、高分辨率修复的工作原理
- 放大图像:首先,将初始低分辨率图像放大到更高的尺寸,通常是两倍或更多。
- 添加噪点:在放大后的图像上添加噪点,模拟原始低分辨率图像的噪点状态。
- 去噪过程:利用Stable Diffusion的去噪能力,从添加噪点的高分辨率图像中生成清晰的图像。
- 细节恢复:通过上述过程,恢复和增强图像的细节,尤其是面部等重要部分。
3、高分辨率修复的参数设置
- 放大倍数:设置放大图像的倍数,常见的设置是2倍或3倍,但可以根据需要调整。
- 放大算法:选择合适的算法来处理放大过程中新像素的颜色赋值。对于三次元图像,推荐使用R-ESRGAN 4x算法;对于二次元图像,推荐使用R-ESRGAN 4x+ anime6B算法。
- 高分迭代步数:先设置15步保底,如果效果好无需提高,一般20步左右即可获得较好的效果。0则表示与迭代步数保持一致,
- 重绘幅度:控制添加噪点的密度,从而影响画面的修改程度。较低的重绘幅度主要用于细节修复,而较高的重绘幅度可能导致画面结构的大幅改变。
- • **0.1-0.4:**基本保持画面结构,细节调整逐步增加 。
- • **0.4-0.8:**画面大修,但还会参照之前的构图 。
- • **0.8-0.9:**基本重画,与原画面几乎没关系了 。
- • **1:**和原图没关系了,重画。
三、多张图片生成
在实际应用中,我们往往需要生成多张图片以供选择。
- 单批数量:一次生成多张图片可以提高效率,但会增加显存占用。根据电脑配置,可以适当调整单批数量。
- 总批次数:通过设置总批次数,我们可以控制生成图片的总数。例如,单批数量为4,总批次数为3,就可以生成12张图片。
四、提示词引导系数
提示词引导系数,Classifier-Free Guidance(CFG值)决定了图片受提示词影响的程度。
- 效果影响:CFG值越高,画面对提示词的刻画越用力。但过高的CFG值可能导致画面崩坏,因此建议保持在5到9之间。不要超过12,画面会崩。
- 过拟合问题:如果画面出现过度刻画的问题,可以适当调低CFG值。
五、随机种子
随机种子决定了初始噪声图的噪声分布,进而决定了生成图片的随机性。
- 固定与随机:设置为**-1**时,每次生成的图片都会有所不同。如果需要固定生成特定风格的图片,可以设置一个特定的随机种子值。
- 参数测试:固定随机种子可以帮助我们在改变其他参数时,准确观察画面的变化。
六、总结
学习完本节内容后,大家可以尝试以下练习:
- 制作一张横屏的风景图片和一张竖屏的人物肖像。
- 如果电脑配置允许,尝试开启高清修复功能,体验其对画面质量的提升效果。
- 尝试不同的CFG值,观察画面细节的变化。
- 通过调整随机种子,体验画面的随机性和可控性。
以上就是我们今天课程的全部内容。希望通过这篇文章,大家能够更深入地理解Stable Diffusion的高级参数,并将其应用到实际创作中。
声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。