> 海外 >

当前关注:AI绘画Tag测试|附图包

时间:2023-04-20 15:54:22       来源:哔哩哔哩

写在前面

在测试模型中抽出时间来做了一下tag测试,在测试anything立绘和cutesmix就觉得tag是个很玄学的东西,有时候写的多了画面效果反而不好,有时候明明写了某个tag画面却一点都没变化,tag究竟怎么去影响画面内容的,我觉得这些问题一定不止困扰着我,因此去测试了一下tag对画面的影响度,希望对大家的魔法吟唱有所帮助。

这次测试把重点放在了单个tag对画面的影响度,以及不同种类的tag对画面的影响度。照例叠个甲,本测试结果仅针对相同条件下的测试,对其他不同参数的测试仅供参考,得出结论仅基于测试结果,不代表实际结果。


(资料图片)

测试参数

选择用anything立绘进行测试的原因,一是我之前已经测试过,比较熟悉,大家也可以根据我前几期专栏去获得模型;二是anything立绘比较稳定和基础,是一个能比较直观地看出变化的模型。

anything立绘测试:

Tag分析

正面Tag:

((masterpiece)), ((an extremely detailed and delicate)), (8k cg wallpaper), best quality, highly detailed, Amazing, finely detail, extremely detailed CG unity 8k wallpaper, a beautiful girl,

1girl, blue eyes, solo,  bare legs,  pink hair, blue jacket, white shirt, fetal position, twin braids, french braid,  elite ii (arknights),hood, looking at viewer, underwater, long sleeves, bangs, suspenders, black shorts, hooded jacket, parted lips, open jacket, open clothes, water, short shorts, air bubble, suspender shorts, bubble, small breasts, thighs, blush, full body,

dynamic angle, flowing detailed colorful ribbon, beautiful detailed crystal water,((Crystallize texture body)),Gem body, as clear as jewels,((crystals texture skin)),sparkle, lens flare, light leaks, Broken glass, crystals texture flowers,

负面Tag:

simple background, leaves, vague, owres, bad anatomy, bad hands, bad face, extra fingers, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,missing fingers,bad hands,one hand with more than 5 fingers, one hand with less than 5 fingers,(mutated hands and fingers:1.5), missing arms, long neck, extra thighs, missing thighs, extra arms, missing arms, liquid thighs, liquid arms

一般我会将tag分成四类:质量tag,人物tag,画面tag,负面tag。

质量tag:控制画面质量的tag,常用的有masterpiece,an extremely detailed and delicate, 8k cg wallpaper,best quality等

人物tag:决定你要生成的内容的tag,具体包括人物tag,动作tag,场景tag,细分下去还有表情tag,服饰tag,发型tag等等,一般通过图片tag反推也是反推出这一部分的内容,可以用人物Lora,动作Lora等代替

画面tag:决定你要生成的画风,包括色调tag,光线tag,质感tag等等,这部分比较难写,可以先从网上搜集一些好的画面tag,再尝试修改添加成自己需要的tag,可以用一些画风Lora代替

负面tag:控制不想让画面出现的内容

接下来进行tag分析:

首先是质量tag:

((masterpiece)), ((an extremely detailed and delicate)), (8k cg wallpaper), best quality, highly detailed, Amazing, finely detail, extremely detailed CG unity 8k wallpaper, a beautiful girl,

质量tag没什么好说的,网上一搜一堆,有些tag网站也会提供设定好的质量控制tag集,直接复制粘贴就行了

其次是人物tag:

1girl, blue eyes, solo,  bare legs,  pink hair, blue jacket, white shirt, fetal position, twin braids, french braid,  elite ii (arknights),hood, looking at viewer, underwater, long sleeves, bangs, suspenders, black shorts, hooded jacket, parted lips, open jacket, open clothes, water, short shorts, air bubble, suspender shorts, bubble, small breasts, thighs, blush, full body,

人物tag基本来源于tag反推,通过一张你想生成人物的图片,去反推出tag,优点是省时省力不用自己写,且会根据权重排序,缺点是太过死板,基本上会根据原图生成,想要有一定发挥空间得自己微调。一般我的流程为:tag反推,获取tag到文生图,生成图像,复制tag到翻译软件(英语不好……),根据生成的图像添加,移动,删除tag,再次生成,循环到满意的图为止。

一般人物的外形tag不用改,包括发型发色,一些标志tag,服饰tag根据需要修改,场景tag,姿势tag一般是肯定要改的,不然出的图就会和原图元素雷同了。

即使是这样,光靠tag固定人物其实还是不太现实,真要画出某一人物还得靠lora。

然后是画面tag:

dynamic angle, flowing detailed colorful ribbon, beautiful detailed crystal water,((Crystallize texture body)),Gem body, as clear as jewels,((crystals texture skin)),sparkle, lens flare, light leaks, Broken glass, crystals texture flowers,

画面tag一般人写不出来,需要有一定的美术功底,熟知各类画风,光线,构图,色调等等画面要素,一般建议网上找,然后根据自己的需要修改,我这个tag实现的是一种水晶宝石质感(其实也是网上找的)。

最后是负面tag:

simple background, leaves, vague, owres, bad anatomy, bad hands, bad face, extra fingers, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,missing fingers,bad hands,one hand with more than 5 fingers, one hand with less than 5 fingers,(mutated hands and fingers:1.5), missing arms, long neck, extra thighs, missing thighs, extra arms, missing arms, liquid thighs, liquid arms

也没什么好说的,网上也有负面tag集,复制一下就行了

测试结论

为啥直接上结论了?

因为结论就是没有任何规律!!!

从上图测试表的略缩图大概也可以发现,单个tag的改变有时对画面没有影响,有时又能直接改变画面,不同例子之间改变画面的tag也不尽相同。

但其实倒也不是说完全没规律,大范围的规律还是有点端倪的,但具体到某一个tag上,似乎又显得不那么正确。

做完测试后,我纠结了相当长一段时间要不要写这篇专栏,毕竟给出一个毫无规律的结论是很不负责任的,仔细想想还是写了,毕竟测都测了,没有结论也是结论嘛。

其实倒也不能说完全没有规律,毕竟算法是固定的,随机的只是种子而已,就像计算机随机数本质也是算法产生的伪随机而已,规律肯定是有的,只不过表现得很隐晦而已,我能力有限,也不能直接通过底层算法摸清其中的逻辑,更多的还是通过出图的结果去反推内部的逻辑。

闲话就到此为止,下面讲一下推测的结论:

1,tag影响画面与哪些因素有关?

影响tag影响画面多少的因素有很多,下面一一分析:

首先是权重,权重算是广为人知的画面控制方式了,具体控制权重有三种方式,tag前后顺序,tag加括号{}(),tag加权重值。越靠前,括号加得越多,权重值越大的tag,在画面中呈现的概率和比重也会越大。由于是众所周知的知识,这里就不详细阐述了。可以看一下下面两张对比图:

前者是添加人物tag中后5个tag的迭代图,后者是添加画面tag中前五个tag的迭代图。

这么描述可能有点难理解,简单来说,就是靠后的tag对画面产生的影响较小,从前者可见在人物tag后添加了5个tag并没有对画面产生较大影响,而后者在仅质量tag的情况下添加了五个画面tag,每添加一次tag都会对画面产生较大影响。(具体迭代表在文后附上链接,从中可以看出前期添加tag会对画面产生较大影响,而后期则基本不会。)

其次是tag意义,什么是tag意义呢?简单来说,就是tag所蕴含的意思。就像我前面为tag分成了四类一样,一些tag只有抽象的含义,譬如质量tag中的masterpiece, an extremely detailed and delicate,这些词的含义是相当抽象的,并没有代表某一种具体事物,因此他们对于画面的影响就会比较少,就算将他们写在了tag的最前面;而相反,诸如1girl, blue eyes, solo,  bare legs,  pink hair,之类的,有实际事物表示的具体名词,就会对画面产生较大影响。

从上图测试表也可以观察到这个规律,质量tag和负面tag的加入基本没有对画面产生影响,而人物tag和画面tag却能有效影响画面,也是因为人物和画面tag多为具体tag,而质量和负面tag多为抽象tag。

另外,即使同是具体tag,也会对画面有不同的影响,这就得根据tag的具体内容决定,比如,场景,大幅度动作姿势类tag一定会比一些小细节tag更容易影响画面。

上方对比图,前者是加了blue eyes的前后对比,后者是加了underwater的前后对比,即使在tag中blue eyes的位置比underwater要高出十几位,但underwater对画面的影响程度显然比blue eyes更大。

最后是tag训练集量。即你所写的tag在模型的训练集中有多少符合的。我曾想画个阿拉克涅,按理说,这种即是具体tag又是影响画面结构较大的tag,我还把它放在第一位,就应该能够画出至少长得像阿拉克涅的妹子,然而事实是别说阿拉克涅,一点魔物娘的元素都没有。为什么会出现这种情况?因为模型训练的时候就根本没有阿拉克涅的图,某些模型为了保证出图的质量,大幅度缩减了训练集的大小,导致某些元素实际上根本无法画出,或是只能画一点点。这也是影响tag在画面中占比的一个重要因素。这样也就能明白前两期模型推荐中阿米娅不像阿米娅,风笛不像风笛的原因了,因为模型训练集中的阿米娅图片少,更别说风笛了,要是换个冷门譬如暴雨慑砂什么的,那更是完蛋。要是去试试甘雨,不用任何描述词,仅需一个ganyu,模型也能精准画出椰羊来,无他,训练集中甘雨的图片可比阿米娅多上几倍。

2,应该如何去写tag?

每个人都有自己写tag的方式,这里分享一下我写tag的心得:

1,在脑中构建好自己想要表现的画面

这一步对没有美术基础的小伙伴来说可能有些困难(我也没有),如果只是想生成好看的图,不在乎出图内容的后面可以别看了。就算用ai出图,其实对美术功底也有很高的要求。

2,分解构图

这步更是考验美术功底,ai绘画tag原理其实和绘画步骤十分相似,首先要打好轮廓,再一步步细化,1girl,underwater,fetal position, 这些tag显然是构图打草稿时就能确定的,因此应该写在前面,而blue eyes,pink hair这类tag在上色时才会表现,因此可以稍稍向后放。

3,把构图步骤转化为tag

这一步其实在上一步中已经说了大半了,将构图步骤用一个个tag表示出来,不熟悉tag的可以去各大tag网站上搜索,或者用tag反推。到这一步时,人物tag基本就写完了。

4,添加其他tag

质量负面tag网上搜搜就行了,说实话对画面影响真不是很大,如果你其他tag写的多的话。就像你在负面tag里写个bad hand,ai还是画不好手一样,有时候改三条腿还是三条腿,一坨手还是一坨手,救不回来的。画面tag就比较困难了,如不会写可以不写,那画风就跟着模型走,非需要某种画风不可的话,也建议加lora。

5,测试tag

这时候tag已经写的差不多了,可以导出几张图看看效果了,再根据出图效果去修改tag。

有些实在表现不出来的,要不换模型,要不加Lora。

后话

这一期写的很烂,没什么有用的信息,就不求大家点个赞了。大家看过当个乐呵就行。毕竟tag这方面的水很深,我把握不住。这期废话那么多,还是给大家看几张图养养眼吧,图包测试表照例放在最后,实际上也没多少有用的东西,大家没必要也就不用下载了。

图包链接:

链接:https://pan.baidu.com/s/1VB8wtRRlLVsiotAjg9ACnQ?pwd=6oen 

提取码:6oen

前几期模型测评:

关键词:
精彩推送