yohooo 发表于 2023-5-31 12:25:27

一个人太慢了,要是有 几个一起搞,每个人分一个模块写就块多了。

jiko73lz 发表于 2023-5-31 22:19:41

其实你只要把各种参数代表的意思表达清楚就可以了,至于其他的不用太复杂

张疾风 发表于 2023-6-1 16:25:18

大佬问一下3.多G的和7.多G的基础模型有什么区别,用哪个比较好

若苗瞬 发表于 2023-6-1 17:29:53

确实文章很长内容很多。

站长可以考虑一下,用整合包作者,秋叶做的GUI。
相对来说简化不少(当然也有高级模式)。
对新手比较友好。

最后我还是推荐低repeat加多epoch,这样方便对比模型。
高repeat加1个epoch有赌的成分。。。{:13:}

PhiltreX 发表于 2023-6-2 02:43:26

张疾风 发表于 2023-6-1 16:25
大佬问一下3.多G的和7.多G的基础模型有什么区别,用哪个比较好

7G的对训练更友好一些,如果不想训练的话,只下载3G的即可。

PhiltreX 发表于 2023-6-2 02:45:58

若苗瞬 发表于 2023-6-1 17:29
确实文章很长内容很多。

站长可以考虑一下,用整合包作者,秋叶做的GUI。


1.整合包目前站内收到的相关问题反馈太多了,而且因为这个不是我写的,所以很多相关问题我这里是没有问题办法给出解决方案的。
2.关于repeat的确是有赌的成分,现在目前教程讲太多的内容怕新手消化不了,所以会在后续增加如何调整loss和repeat搭配epoch通过xyz图表对比效果的内容。
建议非常中肯,感谢。

PhiltreX 发表于 2023-6-2 02:46:42

jiko73lz 发表于 2023-5-31 22:19
其实你只要把各种参数代表的意思表达清楚就可以了,至于其他的不用太复杂 ...

已经写完啦,但毕竟是训练嘛,所以还是希望能够让大家懂的更全面一些哈。

PhiltreX 发表于 2023-6-2 02:46:54

yohooo 发表于 2023-5-31 12:25
一个人太慢了,要是有 几个一起搞,每个人分一个模块写就块多了。

好建议,等我有钱了就雇人,哈哈。

若苗瞬 发表于 2023-6-2 10:13:03

PhiltreX 发表于 2023-6-2 02:45
1.整合包目前站内收到的相关问题反馈太多了,而且因为这个不是我写的,所以很多相关问题我这里是没有问题 ...

主要是用作者的启动器,启动器本身没啥问题挺方便的,特别是更新和国内源这块……
整合包问题似乎是插件有问题,不过我不太清楚了。

整合包这种方式,其实只适合新手。
稍微熟悉一点的最好还是拉代码,建虚拟环境。

不过我主要是说`秋叶`它的训练部分 web GUI,站长有空可以看看,真的挺清晰的,好用。
而且训练那部分也是开源的。

marcobanana 发表于 2023-6-3 11:36:53

学习中,希望能走出一条不错的路
页: 1 [2] 3
查看完整版本: 汇报一下站长的工作进度