本期我来教大家来炼制属于自己的人脸多人模型。所用到的工具是秋叶大佬的一键训练包,新手也可以很好的理解并训练模型。炼制一个人脸模型,首先我们需要准备十五到二十张人脸图,我今天是做一个演示,所以没有准备很多。拿我们哥哥的人脸举例,当我做一个人脸裸裸的时候,最好是只保留脸部分,其他多余部分不要留。
并且分辨率设置为五百一十二乘五百一十二,或者是五百一十二乘七百六十八。训练罗了不需要很高的分辨率,但是一定要保证图片足够清晰。然后我们来裁剪图片,保留哥哥脸的部分。这里我用到的工具是美图秀秀,因为它可以在裁剪的同时可以放大或者缩小。
裁剪完毕后,我们需要把图片放到根目录下的train里面。在train里面我们还会创建一个文件夹。这个命名的含义我会在后面设置参数的时候给大家做讲解。放置好之后,接下来是我们训练。
中最重要的一环了就是打标签。我们点击gb u d一点四标签器,把我们前面放在train里面的图片路径复制一下,放到文件夹路径这里,然后设置一下阈值,我长设置为零点六五,然后点击启动。等加载完之后你就会发现在我们图片旁边多了一个t x t文件。我们打开它之后,其实就是a i为我们把图片中的提示词给反推了一下。
一般人脸是不需要更改的,但是大家也可以看一下,如果有奇怪的提示词可以修改一下。因为我们是需要人脸,所以可以把人脸除外的提示词尽量描述清楚,防止污染。标签打好之后,我们就来开始调整参数训练模型了。这里有一个新手和一个专家,我就直接教大家用专家模式从第一参数开始讲解训练种类我们选择s d laura就行。
底模文件路径。这里其实就是我们的lol需要根据一个大模型去训练模型。如果你是二次元的就选择二次元。底膜如果你是写实的,你就选择写实底膜。
那一这里不用管v r,这里默认训练集路径,这里就是我们放图片的地方。但是这里有一个关键点,就是我们不要复制最里面的路径,我们需要复制外面这一层路径。后面我会告诉大家为什么接着正则化,这里比较复杂,我就先不多说了,默认就行。图片分辨率这里也就是我前面和大家说过的五幺二逗号。
五幺二就是五百一十二乘五百一十二。如果你是五百一十二乘七百六十八,你就把后面改成七百六十八就行,不要超过一千零二十四。下面这些参数保持默认即可。文件名大家可以自己设置,不要设置中文。
等模型弄好之后,自己再去改成默认就行。保存文件夹,这里默认就好,一般是会自动保存在根目录的output这里,下面这些保持默认就行。下面这个最大训练轮数意思就是说我们每张图片a i确认一遍,默认就是之前和。大家说的这个文件夹名字格式的意思呢,其实前面的数字代表需要a i学习多少步。
比如我这里写三十下划线就代表着要ai学习三十步。一般精细的图片,我们需要学习的步数越高,模型才会越好像人脸。我建议大家三十到五十步即可,下面这些大家保持默认就好。然后我们来到这个网络维度这里,它和下面这个常用值是一体的,具体的我就不和大家解释了。
一般的普通模型我们就设置为网络维度六十四,常用值三十二就行,常用值要是网络维度的一半,人脸的可以大一点,设置幺二八和六十四,它的内存就是一百四十四mb像我们平时看到的洛瑞模型,从内存你就可以看出它这里的值是多少,像七十二的就是六十四和三十二,下面的常用值不要超过一百二十八就行。上面也是好了,之后的参数我们全部保持默认即可,我们点击开始默认,然后。我们这里也可以看到后台这里有一个加在数值,可以看到正在运行。训练好之后呢,大家就可以在output文件夹里面看到自己的模型啦。