对图片和视频进行智能标签(对图片物体进行识别做标签的方法)

以下是关于对图片和视频进行智能标签的相关内容:

用 SD 训练一套贴纸 LoRA 模型的打标方法

点击左侧菜单【WD1.4 标签器】。 在 path 中粘贴素材文件夹的根目录路径。 将阈值设置为 0.35(生成尽可能多的标签来描述图片内容,阈值是指 AI 理解图片内容给出关键词的评分,分数越大越确定,一般阈值设大于 0.35)。 选择公认成熟稳定的 Tagger 模型作为训练 lora 的底模,其它设置基本不用更改调试。 点击【启动】,会为目标文件夹里的图像素材自动打标,自动打标完成后,会在素材原文件直接生成对应图像的 txt 打标文件。

【SD】提示词标签选择器 Easy Prompt Selector 的使用

按顺序选择一些标签词,如女孩、白头发、蓝眼睛、兔子耳朵等。 选择画质和视角,如最好的质量、杰作、高度详细等。 选择艺术风格,如皮克斯动画、轮廓光。 在负面提示词中进行选择并点击选框结尾的“负面”。 选择模型,如“revAnimated”,调整尺寸后点击生图。

用 SD 训练一套贴纸 LoRA 模型的打标优化方法

方法一:保留全部标签。对标签不做删标处理,直接用于训练。一般在训练画风,或想省事快速训练人物模型时使用。优点是不用处理 tags 省时省力,过拟合的出现情况低;缺点是风格变化大,需要输入大量 tag 来调用、训练时需要把 epoch 训练轮次调高,导致训练时间变长。 方法二:删除部分特征标签。训练某个特定角色时,要保留蓝眼睛作为其自带特征,那么就要将 blue eyes 标签删除,以防止将基础模型中的 blue eyes 引导到训练的 LoRA 上。一般需要删掉的标签如人物特征 long hair,blue eyes 这类;不需要删掉的标签如人物动作 stand,run 这类,人物表情 smile,open mouth 这类,背景 simple background,white background 这类,画幅位置等 full body,upper body,close up 这类。优点是调用方便,更精准还原特征;缺点是容易导致过拟合,泛化性降低。过拟合会导致画面细节丢失、画面模糊、画面发灰、边缘不齐、无法做出指定动作、在一些大模型上表现不佳等情况。

0
分享到:
没有账号? 忘记密码?