学习率是指 AI 学习图片或进行训练时的效率。以下是关于学习率的一些重要特点和相关内容:
学习率过高会导致过拟合,即生成的图片与素材过于相似;学习率过低会出现不拟合,图片和素材没有关系。 学习率指的是一次迭代(即输入一个样本对它学习,并用此次学习的经验调整神经网络)的步长。这个值越大,表明一次学习对模型的影响越大。为了让学习循序渐进,学习率不应该太高,需要 AI 在训练中反复总结经验,最终累积为完整的学习成果。合理的学习率会让学习过程收敛,使 Loss 达到足够低。学习率太低,容易出现局部最优解;学习率太高,容易使得模型不收敛,找不到解。 如果想追求品质最好的模型效果,可以参考青龙圣者提出的黄金学习率计算方法。详情可看:[https://www.bilibili.com/video/BV15j411F7nJ/?spm_id_from=333.999.0.0] 。根据可视化学习曲线图可以观测到一个最佳的学习率值,取最高值除 3 即可得出一个最佳学习率数值然后填到 Lr、unet_lr、text_encoder_l 对应的参数上。这是一个玄学方法,感兴趣的可以自己去深入研究,其目的也是能够让模型最终效果更好。关于 Tensorboard(可视化学习曲线),首先需要安装 GIT:[https://git-scm.com/download/win] 。安装方法:在训练脚本根目录鼠标右键点击 Git bash here –在指令窗口输入 pip install tensorboard 安装依赖。使用方法:首先开始跑第一次训练,跑不跑完都可以,然后找到 LoraTrain\lora-scripts\logs 路径内找到最新时间戳的文件夹名称,在这个文件夹内鼠标右键再次唤出 Git bash here 指令窗口输入。 1e-4 是一种程序里的数学表达,实际上就是 1 除以 10 的 4 次方,即:1e-4 = 1/10000 = 0.0001 ;1e-5 = 1/100000 = 0.00001 。