目前推荐使用ai00_server
来运行,RWKV-Runner
没跑起来。
- hf上下载的
.pth
文件需要转换为.st
文件,我使用converter
一直失败,切换到python的convert_ai00.py
可以用 - 可以使用BNF来指定输出格式,如json
- 不支持多卡推理
- 不支持CUDA,要使用Vulkan,Linux下要安装Vulkan驱动
- 界面Bug很多,不建议使用
参考链接:
- https://ai00-x.github.io/ai00_server/doc-guide/FAQ
- https://rwkv.cn/RWKV-Fine-Tuning/LoRA-Fine-Tuning