yohooo
发表于 2023-5-31 12:25:27
一个人太慢了,要是有 几个一起搞,每个人分一个模块写就块多了。
jiko73lz
发表于 2023-5-31 22:19:41
其实你只要把各种参数代表的意思表达清楚就可以了,至于其他的不用太复杂
张疾风
发表于 2023-6-1 16:25:18
大佬问一下3.多G的和7.多G的基础模型有什么区别,用哪个比较好
若苗瞬
发表于 2023-6-1 17:29:53
确实文章很长内容很多。
站长可以考虑一下,用整合包作者,秋叶做的GUI。
相对来说简化不少(当然也有高级模式)。
对新手比较友好。
最后我还是推荐低repeat加多epoch,这样方便对比模型。
高repeat加1个epoch有赌的成分。。。{:13:}
PhiltreX
发表于 2023-6-2 02:43:26
张疾风 发表于 2023-6-1 16:25
大佬问一下3.多G的和7.多G的基础模型有什么区别,用哪个比较好
7G的对训练更友好一些,如果不想训练的话,只下载3G的即可。
PhiltreX
发表于 2023-6-2 02:45:58
若苗瞬 发表于 2023-6-1 17:29
确实文章很长内容很多。
站长可以考虑一下,用整合包作者,秋叶做的GUI。
1.整合包目前站内收到的相关问题反馈太多了,而且因为这个不是我写的,所以很多相关问题我这里是没有问题办法给出解决方案的。
2.关于repeat的确是有赌的成分,现在目前教程讲太多的内容怕新手消化不了,所以会在后续增加如何调整loss和repeat搭配epoch通过xyz图表对比效果的内容。
建议非常中肯,感谢。
PhiltreX
发表于 2023-6-2 02:46:42
jiko73lz 发表于 2023-5-31 22:19
其实你只要把各种参数代表的意思表达清楚就可以了,至于其他的不用太复杂 ...
已经写完啦,但毕竟是训练嘛,所以还是希望能够让大家懂的更全面一些哈。
PhiltreX
发表于 2023-6-2 02:46:54
yohooo 发表于 2023-5-31 12:25
一个人太慢了,要是有 几个一起搞,每个人分一个模块写就块多了。
好建议,等我有钱了就雇人,哈哈。
若苗瞬
发表于 2023-6-2 10:13:03
PhiltreX 发表于 2023-6-2 02:45
1.整合包目前站内收到的相关问题反馈太多了,而且因为这个不是我写的,所以很多相关问题我这里是没有问题 ...
主要是用作者的启动器,启动器本身没啥问题挺方便的,特别是更新和国内源这块……
整合包问题似乎是插件有问题,不过我不太清楚了。
整合包这种方式,其实只适合新手。
稍微熟悉一点的最好还是拉代码,建虚拟环境。
不过我主要是说`秋叶`它的训练部分 web GUI,站长有空可以看看,真的挺清晰的,好用。
而且训练那部分也是开源的。
marcobanana
发表于 2023-6-3 11:36:53
学习中,希望能走出一条不错的路