前言
上一节课程中介绍如何快速高效整理数据集相关知识,
下面我们就进入到数据集预处理步骤的实操阶段。 介绍5种超好用的tag工具。
本文知识点
本节课程我们将讲解
- 数据集预处理阶段 介绍5种超好用的tag工具
数据集预处理的步骤
下面我们就进入到数据集预处理步骤的实操阶段。
首先就是根据之前讲述的内容,先确定我们要训练哪种类型的LoRA模型。
比如我们要训练一个画风类型的LoRA模型(其他类型的训练操作一样),用之前的模型风格作品进行案例操作,那我们就需要搜集此类统一风格或者尽量贴近此类元素的相关绘画作品。
比如我们现在自创的梦幻女孩的这个模型,名称尽量和自己要训练的模型贴近,这样既有利于模型识别,也方便后期管理维护(因为后期可能还会在此基础上继续训练更高版本的模型,比如V1.0,V2.0等)。
那么,关于这个梦幻女孩画风的LoRA模型,我们想要它就像字面意思一样,通过最终训练的LoRA模型调用,效果图可以充满灵动、梦幻、仙气、高贵的那种感觉
如下素材图示例:
(素材图示例)
我们就可以根据自己的想法,搜集此类风格的素材图。搜集素材图之前,我们先按照以下方式进行操作,创建素材库:
1、新建一个文件夹,命名为LoRA_train_dreamgirl(名称仅做示例参考,可以自创,以下类同)
2、在新建的LoRA_train_dreamgirl文件夹中再次新建两个文件夹,一个命名为train,一个命名为out。
3、将所有搜集或者生成的素材图全部放入新建的train文件夹中。
自此,我们就完成了素材图的搜集整理。
接着,我们就可以来到SD软件界面,如上图所示,依次找到“训练”—“图像预处理”,各项参数释义如下:
- 源目录:存放原素材图的完整路径名称。
如:D:\LoRA_train_dreamgirl\train(我们刚才新建的train文件夹路径)
- 目标目录:待存放预处理图像和Tag标签文本的完整路径名称。
如:D:\LoRA_train_dreamgirl\out(我们刚才新建的out文件夹路径)
- 宽度高度:图片训练尺寸,保持默认即可。也可以调整为其他64的倍数尺寸,比如768,960,1024等,但是一般建议保持默认512即可,对后期出图会起到正向积极作用。
如果素材图统一都是长宽不等的矩形图,如素材图原尺寸是512*768,那么可以改为512、768,或者保持默认512即可。
- “对已有标注的txt文件操作”:共有4个选项,可按字面意思理解即可。
ignore无视忽略,即自动创建新的Tag标签。
copy复制,即复制已有的Tag标签。
prepend前置,即将自动生成的新的Tag标签在已有文本基础上前置。
append追加,即将自动生成的新的Tag标签在已有文本基础上后置。
由于我们是第一次预处理图像,没有Tag标签文本,因此选择默认的ignore无视忽略即可。
- 保持原始尺寸:预处理后的素材图保持原始尺寸。
- 创建水平翻转副本:适用于素材图较少或追求左右镜像平衡。可以自动新建水平翻转的素材图到数据集文件夹。素材图数量足够时,不建议开启,因为会导致某些特征位置出错(比如一颗痣原本长在左脸,镜像翻转后就会出现在右脸)。
- 分割过大图像:分割图像,不用则无需开启。其中包含图像分割阈值和分割图像重叠比率,如将图像分割阈值设置1,分割图像重叠比率设置0,则会将原素材图完全分割成上半部和下半部两张图片,然后和原素材图一起保存在数据集中。
- 自动面部焦点裁剪:可自动识别人物面部焦点,裁剪成以人物面部为中心的512*512的素材图保存至数据集中。训练人像时,可以根据需求决定是否勾选。
- 自动按比例裁剪缩放:包含最大和最小分辨率等参数设置,勾选后会按照输入的参数进行中心裁剪缩放。
- 使用BLIP生成标签:参照之前讲解内容——《关于Tag标签文本,需要注意的重点知识》
- 使用Deepbooru生成标签:参照之前讲解内容——《关于Tag标签文本,需要注意的重点知识》
了解了以上内容和参数意义后,我们即可按照以下操作进行图像预处理操作:
- 进入SD软件—训练—图像预处理,输入正确的源目录和目标目录。
- 保持宽高度为默认的512*512。
- 保持默认的ignore文本标签处理方式。
- 勾选“保持原始尺寸”、“使用BLIP生成标签”两个选项即可(因为我们搜集并生成了足够数量的素材图,因此不必勾选水平镜像翻转选项),其他保持默认。
- 点击预处理按钮,等待右方预览界面(如上图示例)出现Preprocessing finished的字样,即完成了图像预处理。
- 打开之前预先创建好的out文件夹(D:\LoRA_train_dreamgirl\out),即可看到已经处理完成的素材图和对应的Tag标签提示词文本(如下图示例),然后根据图片实际内容进行增加、删除、修改不符合、重复或者错误的标签文本内容:
标签tag优化
方法一:保留全部标签;不做删标处理, 直接用于训练。在训练画风,或想省事快速训练人物模型时使用。需要输较多tag 来调用、训练时需把epoch训练轮次调高,导致训练时间变长;
方法二:删除部分标签
比如训练某个特定角色,要保留某特征作为其自带特征,那么就要将其绑定标签删除
一般需要删掉的标签:如人物特征 long hair,blue eyes 这类。不需要删掉的标签:如人物动作 stand,run 这类,人物表情 smile,open mouth 这类,背景 simple background,white background 这类,画幅位置等 full body,upper body,close up 这类。
- 添加触发词
如上图所示,在每个修改后的Tag标签文本内容中,我们还要前置输入一个触发词作为LoRA模型的唯一身份识别,这样,在调用最终成品模型时,模型才能知道我们需要调用它。这个触发词可以是自创并且有意义的,也可以用文件名,比如用作为触发词添加到Tag标签文本中。同时,需要避免使用1girl、1man、bird、flower等特别简单宽泛的字词作为触发词,因为这些字词可能会和底模大模型素材词重合受到污染,从而使得LoRA模型不起作用或者效果变差。
至于最后在SD中调用训练好的LoRA模型时,需不需要在正向提示词中再次写触发词,根据目前的使用情况,可以写,可以不写。但是如果不写触发词,模型出图效果较弱,那就在正向提示词中尝试再次书写上触发词。
至此,我们便完成了素材图像预处理的操作过程。
上面我们讲述了常见2种WebUI集成打标工具,下面继续讲解其他几种方法
第三种方式:
安装 tagger 标签器插件,进行 tags 打标签;
地址:http://github.com/toriato/stable-diffusion-webui-wd14-tagger
第四种方式:
sd-webui编辑标签
导入自动打标后的图片
首先在所有tag前面加一个风格tag: cike567
第五种方式:
批量tag工具
打开BooruDatasetTagManager工具,
点击软件左上角的FILE,接着点击load folder,
复制你的训练集文件夹地址,
粘贴到点击 load folder后弹出的文件选择框中,回车,再点击选择文件夹。
打开后,从左往右四个框分别是:
图片展示栏,该图片的现有文本内容,工具栏,该文件夹的所有文本内容。
双击该图片的现有文本内容进行修改;
工具栏加号为添加新的词条;
双击该文件夹的所有文本内容部分,词条快速添加到当前图片对应的文本框内。
修改完成后,点击“√”进行保存,
或点击File,再点击save all changes,保存结束。
RA/SD 衍生者AI训练营。发布者:chris,转载请注明出处:https://www.shxcj.com/archives/8373