找回密码
 立即注册
查看: 1892|回复: 2

一款很有前途的完全开源的大语言模型RWKV,可以本地部署

[复制链接]

3

主题

3

回帖

22

积分

新手上路

积分
22
发表于 2023-5-31 22:16:34 | 显示全部楼层 |阅读模式
本帖最后由 FireShark 于 2023-6-1 11:19 编辑

推荐一下,这个模型完全开源,兼具RNN和Transformer的优点,已经被 hugging face 纳入模型库。
效果也挺好.

https://huggingface.co/BlinkDL


https://zhuanlan.zhihu.com/p/618011122

目前 RWKV 有大量模型,对应各种场景,各种语言,请选择合适的模型:

Raven 模型:适合直接聊天,适合 +i 指令。有很多种语言的版本,看清楚用哪个。适合聊天、完成任务、写代码。可以作为任务去写文稿、大纲、故事、诗歌等等,但文笔不如 testNovel 系列模型。
Novel-ChnEng 模型:中英文小说模型,可以用 +gen 生成世界设定(如果会写 prompt,可以控制下文剧情和人物),可以写科幻奇幻。不适合聊天,不适合 +i 指令。
Novel-Chn 模型:纯中文网文模型,只能用 +gen 续写网文(不能生成世界设定等等),但是写网文写得更好(也更小白文,适合写男频女频)。不适合聊天,不适合 +i 指令。
Novel-ChnEng-ChnPro 模型:将 Novel-ChnEng 在高质量作品微调(名著,科幻,奇幻,古典,翻译,等等)。
最近RWKV发了一篇N多合作者一起完成的论文,是关于RWKV第一篇正式论文:

作者对该模型的最新介绍:

https://www.zhihu.com/question/602564718/answer/3042600470


站长写的 ChatRWKV 安装使用教程:

https://openai.wiki/chatrwkv.html


68

主题

382

回帖

1047

积分

管理员

积分
1047

最佳新人活跃会员热心会员推广达人宣传达人灌水之王突出贡献优秀版主荣誉管理论坛元老

QQ
发表于 2023-6-1 02:51:55 | 显示全部楼层
最近在写LoRA的训练教程,下次有时间折腾一下语言模型训练的教程。

点评

细分起来,语言模型可以选择的训练方向太多了。  详情 回复 发表于 2023-6-1 11:17

3

主题

3

回帖

22

积分

新手上路

积分
22
 楼主| 发表于 2023-6-1 11:17:41 | 显示全部楼层
PhiltreX 发表于 2023-6-1 02:51
最近在写LoRA的训练教程,下次有时间折腾一下语言模型训练的教程。

细分起来,语言模型可以选择的训练方向太多了。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|openAI维基百科论坛 ( 京ICP备2021019752号-5|京公网安备 11010502051430号 )

GMT+8, 2024-11-21 17:09 , Processed in 0.103189 second(s), 31 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表