lxylxy123321 93e4e3d07c 增加PPO方法 hai 4 días
..
__init__.py a33a6c3bfb 初始化仓库 hai 2 semanas
background_task.py a95623c0f8 增加样本中心接口,改为单卡训练 hai 1 semana
common.py 9a25fae9d2 训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora hai 1 semana
dataset.py 39dbc3320b 支持数据集从平台下载 hai 2 semanas
deployment.py a95623c0f8 增加样本中心接口,改为单卡训练 hai 1 semana
evaluation.py a95623c0f8 增加样本中心接口,改为单卡训练 hai 1 semana
model.py a33a6c3bfb 初始化仓库 hai 2 semanas
model_test.py 3b8acd9769 增加模型测试功能 hai 2 semanas
sample_center.py d1809811a0 新增样本中心样本源 hai 1 semana
training.py 93e4e3d07c 增加PPO方法 hai 4 días