[基础知识] 训练参数的意义和作用

admin · 发表于 2024-8-23 22:39:45

[模型结构参数]

分辨率(Resolution):  人脸的大小，越高越清晰、需要的显存和运算量越大
模型架构(Archi): 模型的结构类型 vdf/viae
编码器维度（EncoderDims）:  编码器的模型参数维度大小
解码器维度（DecoderDims）:  解码器的模型参数维度大小
中间特征维度（InterDims）:  中间层潜变量的参数维度大小（特征码的维度）
-----------------------------------------------------------------------------
[Train程序界面板块分布】

XFaceKit-train界面

Train程序界面如上图，对不清楚的参数代表什么，可以把鼠标停在按钮或标签上，会显示中文提示。

左上方板块是模型信息，右上方板块是素材设置，下方板块是训练参数的设置

--------------------------------------------------

[素材设置]

SrcFace: Src人脸存放的目录，该目录必须要包含切脸文件。可以点击open按钮，在文件浏览器查看该文件夹中的文件。

（本选项为必选项，必须设置）

DstFace: Dst人脸存放的目录，该目录必须要包含切脸文件。可以点击open按钮，在文件浏览器查看该文件夹中的文件。

（本选项为必选项，必须设置）

ShareDir: src和dst共享的人脸素材文件夹。该文件夹中的素材会同时被添加到src和dst。（本选项可以不设置）

需要选中use按钮才会启用。对于中高级用户，src素材不足需要训练口腔的时候可以采用

Occlude: 用于遮挡增强的素材文件夹。该文件夹中的遮挡素材会随机缩放旋转添加到人脸素材上。

选中src复选框会添加到src素材，选中dst复选框会添加到src素材。

[Schedule]训练规划参数

TargetIter:目标迭代数，训练到这个迭代数之后训练自动停止

PreviewRow:预览行数，但最终显示行数同时受到模型分辨率影响

AutoSaveIter:每隔多少个训练迭代自动保存模型

BackupIter : 每隔多少个训练迭代自动备份模型，备份保存在模型目录的backup文件夹下面

PreviewIter :训练多少个迭代更新一下训练预览图

PreviewSave: 训练多少个迭代之后保存一次预览图。（在开启保存预览选项开启后才会起效）

[备注：模型备份文件保存在模型的同目录的backup文件夹中，备份文件的文件名中会带有备份时的迭代数]

-----------------------------------------------------------------------------------------------------

【训练素材增强参数】

Src FlipHori: 对Src素材进行左右随机翻转。适合Src的素材脸部对称，一侧角度较少的情况。Src脸部不对称，比如

一侧脸部有明显的痣，则不要开启。

Dst FlipHori:对Dst素材进行左右随机翻转，可以增加dst的素材多样性。建模默认开启。

Src ScaleRot: 对Src素材进行小幅度的随机缩放和旋转。

Shift HSV : 对图片随机进行色调和明度的改变。

Random Warp :对素材进行随机的扭曲。增加表情的泛化程度。在预训练的早期都需要开启。

Warp Power: 扭曲的强度，一般用默认值即可。

EyeMouth Prio: 增加眼睛和嘴部区域的权重。此选项开启，Loss值会变大。因为额外将嘴部和眼睛区域的像素差异loss新加入了总loss值

Train InMask: 训练遮罩内像素。勾选此选项之后，将忽略人脸遮罩外的像素差异，只学习

人脸遮罩区域内的像素特征.

NeuroDropout: 随机置零部分神经元的比例。用于增加模型的的健壮性.

Learning Rate: 学习率，表示每一次迭代中调整参数的幅度。过小会导致学习变慢，过大可能会导致无法收敛到最优点，在训练初期可以稍大一些，后期可以调小一

Batch Size: 每一个训练迭代加载的样本数量。

【高级选项】

Retrain HighLoss: 对loss值高的素材进行重新训练。常规训练的时候，每个素材训练的机会是均等的。

训练到一定程度以后，比如某些角度和表情已经训练得很好了，而某些大角度或者少见表情可能

还没有学习满意，这时候可以启用该选项，来增加高loss的样本的

Retrain FaceNum: 重新训练的人连数目。也就是前多少张人脸需要重新训练。

Norm TrainIter：正常训练迭代数

Retrain IterNum : 高Loss重训练的迭代数

SharpGan: 启用清晰度增强的GAN训练

[高Loss重训的流程: 先进行正常训练，进行 NormTrain Iter次之后，开始进入High Loss重训练模式，从loss排序中的前 Retrain FaceNum个素材中，每次随机挑选batch size个素材来训练，训练 Retrain IterNum的迭代之后，又开始常规正常训练。如此循环】

loss实时

--------------------------------

【训练预览图】

预览图一共分为六列，所有分辨率的模型都是六列，前两列是src的原图和重建图，3-4列为dst的输入图和重建图

第五列为dst换为src的重建，第六列为merge之后的融合图（遮罩来源于dst素材）

		自动登录	找回密码
密码			立即注册

[基础知识] 训练参数的意义和作用

浏览过的版块