lxylxy123321 93e4e3d07c 增加PPO方法 hai 5 días
..
api a95623c0f8 增加样本中心接口,改为单卡训练 hai 1 semana
core 93e4e3d07c 增加PPO方法 hai 5 días
engines 93e4e3d07c 增加PPO方法 hai 5 días
peft a3e748d3c9 adalora初始化total_step赋默认值 hai 5 días
preprocessors 9a25fae9d2 训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora hai 1 semana
schemas 93e4e3d07c 增加PPO方法 hai 5 días
services 93e4e3d07c 增加PPO方法 hai 5 días
__init__.py a33a6c3bfb 初始化仓库 hai 2 semanas
config.py 866c90d0cb 修改env hai 5 días