lxylxy123321 93e4e3d07c 增加PPO方法 3 days ago
..
__init__.py a33a6c3bfb 初始化仓库 2 weeks ago
background_task.py a95623c0f8 增加样本中心接口,改为单卡训练 6 days ago
common.py 9a25fae9d2 训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora 6 days ago
dataset.py 39dbc3320b 支持数据集从平台下载 2 weeks ago
deployment.py a95623c0f8 增加样本中心接口,改为单卡训练 6 days ago
evaluation.py a95623c0f8 增加样本中心接口,改为单卡训练 6 days ago
model.py a33a6c3bfb 初始化仓库 2 weeks ago
model_test.py 3b8acd9769 增加模型测试功能 2 weeks ago
sample_center.py d1809811a0 新增样本中心样本源 6 days ago
training.py 93e4e3d07c 增加PPO方法 3 days ago