lxylxy123321 93e4e3d07c 增加PPO方法 před 2 dny
..
api a95623c0f8 增加样本中心接口,改为单卡训练 před 5 dny
core 93e4e3d07c 增加PPO方法 před 2 dny
engines 93e4e3d07c 增加PPO方法 před 2 dny
peft a3e748d3c9 adalora初始化total_step赋默认值 před 3 dny
preprocessors 9a25fae9d2 训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora před 5 dny
schemas 93e4e3d07c 增加PPO方法 před 2 dny
services 93e4e3d07c 增加PPO方法 před 2 dny
__init__.py a33a6c3bfb 初始化仓库 před 2 týdny
config.py 866c90d0cb 修改env před 3 dny