在之前的文章《【AI绘图】从0开始快速入门SD(Stable Diffusion)》中,我们介绍了Stable Diffusion的基本概念,并通过对快速出图的实战体验,初步了解了SD的运作方式。
在本文中,我将继续与大家探讨SD绘图中常见的参数。理解这些参数,并合理设置它们,将有助于SD生成更符合我们预期的图像。
请注意,本文的目标是协助初学者迅速掌握SD的参数。在解释这些参数时,我会避免使用专业术语,而是依据我个人对SD的理解,用通俗易懂的语言来描述。也会尽量避免深入探讨参数的细节,以免分散读者的注意力。
参数介绍
在介绍参数之前,先放上SD webUI的界面操作图,依旧是以哩布哩布AI平台为例,让我们对照操作界面看参数会更加直观。
- CHECKPOINT
CHECKPOINT是SD的大模型,也叫底膜,出图必须选择一个大模型。要出写实类的图片就选写实大模型,二次元图片就选择二次元大模型。
写实类大模型也有许多种不同的画风,例如麦橘写实MAX,写实通用大模型,如果是画人,适合画亚洲人;再例如realisticVision V60大模型,也是一款很强的写实类大模型,如果是画人,适合画欧美人。
如果你出图总是得不到满意的画风,可以尝试换个大模型再试试。
- VAE
指的是变分自编码器(Variational Autoencoder)。这个大家了解一下就行,不需要设置,按默认即可。
- Clip Skip
clip 让提示词与图片建立关系。值越高越偏离提示词,默认保持2,建议在[2-4]。
提示词示例:
一个女孩,大大的蓝眼睛,黑头发。白色的洛丽塔裙,看着镜头,手臂在背后,纯色的背景。
不同Clip下的效果如下:
- 提示词(prompt)
1.提示词就是对画面的描述,你想要什么样的图片就写什么提示词。
需要注意的是,SD提示词风格和Midjourney、可灵的风格是不同的。Midjourney、可灵的提示词是多个句子组成。SD对于单词或少量句子组成的提示词更容易理解。
例如,Midjourney提示词:
这是一个现代咖啡馆的标志,一只北极熊幼崽端着咖啡,在一个阳光明媚、下雪的早晨,位于一座砖砌建筑外的标志上。
SD提示词:
写实,肖像,1个女孩,个展,美丽的脸,精致的眼睛,露肩纱裙,((红色背景,蓝色背景,渐变背景,)),
通过对比,是不是能明显感觉到SD提示词不同于其他AI绘图工具的提示词风格?
2.SD提示词需要是英文形式 (哩布哩布AI平台有自动翻译功能)
3.提示词权重
前面说过提示词是对画面的描述,那么描述肯定是存在先后顺序的,排在前面的提示词其权重是最高的,对画面的影响也是最大的。
我们也可以使用小括号“()”和数字来改变提示词的权重,权重高的提示词有较大概率出现在画面中。
提示词示例:
美丽的女士,灿烂的笑容,红宝石般的眼睛,(长长的卷发:1.2),深色的妆容,超精细的摄影,柔和的光线,头肩肖像,(雀斑),贝雷帽。
(长长的卷发:1.2):表示将这个提示词权重提升1.2倍;(雀斑):表示将这个提示词权重提升1.1倍。
- 负向提示词(Negative Prompt)
用来描述不需要出现的特征和元素的提示词,例如畸形的手、模糊、低质量、水印等。
在这里给大家提供通用的负向提示词:
EasyNegative, ng_deepnegative_v1_75t, badhandv4,(worst quality:2), (low quality:2),(normal quality:2), lowres, ((monochrome)), ((grayscale)), bad anatomy,DeepNegative,skin spots, acnes, skin blemishes,(fat:1.2),facing away, looking away,tilted head,lowres,bad anatomy,bad hands,missing fingers,extra digit, fewer digits,bad feet,poorlydrawn hands,poorly drawn face,mutation,deformed,extra fingers,extra limbs,extraarms,extra legs,malformed limbs,fused fingers,too many fingers,long neck,cross-eyed ,mutated hands,polar lowres,bad body,bad proportions,gross proportions,missingarms,missing legs,extra digit, extra arms, extra leg, extra foot,teethcroppe,signature,watermark, username,blurry,cropped,jpeg artifacts,text,error
- 采样方法 (Sampler method)
可以选择采样器,采样器是指Al绘画时所采用的不同算法。在其它参数不变的情况下,单独改变采用方法也会影响到出图的效果。
采样方法没有绝对的好坏,我们只需知道常用的采样方法,例如Euler a和 DPM++ 2M Karras;
也可以采用模型作者推荐的参数,例如哩布哩布AI平台,在模型详情页可看到参数推荐:
- 选代步数 (Sampling Steps)
就比如我们人类画画,是一笔一笔画出来的,如果只允许我们画10笔,那么我们只能画出很简陋的图,如果允许我们画100笔,那么我们能画出更精致的图,相应的需要画图的时间也就越长。
AI也是一样的,这个迭代步数可以理解成AI画的笔数,迭代步数为1就画1笔,迭代步数为20,就画20笔,迭代步数越高画的越精致,所需的时间也就越长。
迭代步数一般20-30之间就好,过高效果不一定会更好。
我们演示一下参数相同的情况下,不同迭代步数所画出来的效果如何:
从以上的结果中也可看出迭代步数在20-30之间是比较合适的,当然,这个数值只是建议,你可以在绘图过程中自己多去尝试,总结经验。
- 宽度和高度
指的就是图片的长、宽。
需要注意的是,分辨率(宽高比)过大会出现”连体人“的问题。
例如AI在学习时,提供给AI的素材大多都是基于512分辨率。如果分辨率超过512,那么AI就会开始自由发挥,就可能导致意料之外的结果。
所以文生图分辨率一般不超过1024。
给大家演示一下正常分辨率和分辨率过大的效果。
正常分辨率,画面正常:
分辨率896x768,画面也是正常的:
我们再看看将分辨率调大会怎样,当分辨率超过1024时,能明显感觉到画风开始变异。
- 提示词引导系数(CFG scale)
一般7-12为较为安全的取值范围,默认是7,数值越高,提示词和图片相关度越高;数值越低,提示词和图片相关度越低。
数值过大或过小均可能导致出图效果异常。
- 随机种子(Seed)
默认为-1,就是随机生成种子值,点击骰子图标,也是随机生成种子值。如果需要某张图片的种子值,可以复制过来填写在文本框中。如果是需要固定上一张图片的种子值,点击绿色循环箭头。
结语
我们已经概述了SD的常见参数,通过跟随本文的实践指导并亲自操作SD界面,您将能够轻松掌握这些知识点。合理的进行参数设置,更容易让SD画出令人满意的图。