lxylxy123321 93e4e3d07c 增加PPO方法 5 روز پیش
..
api a95623c0f8 增加样本中心接口,改为单卡训练 1 هفته پیش
core 93e4e3d07c 增加PPO方法 5 روز پیش
engines 93e4e3d07c 增加PPO方法 5 روز پیش
peft a3e748d3c9 adalora初始化total_step赋默认值 5 روز پیش
preprocessors 9a25fae9d2 训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora 1 هفته پیش
schemas 93e4e3d07c 增加PPO方法 5 روز پیش
services 93e4e3d07c 增加PPO方法 5 روز پیش
__init__.py a33a6c3bfb 初始化仓库 2 هفته پیش
config.py 866c90d0cb 修改env 5 روز پیش