lxylxy123321 93e4e3d07c 增加PPO方法 6 hari lalu
..
api a95623c0f8 增加样本中心接口,改为单卡训练 1 Minggu lalu
core 93e4e3d07c 增加PPO方法 6 hari lalu
engines 93e4e3d07c 增加PPO方法 6 hari lalu
peft a3e748d3c9 adalora初始化total_step赋默认值 6 hari lalu
preprocessors 9a25fae9d2 训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora 1 Minggu lalu
schemas 93e4e3d07c 增加PPO方法 6 hari lalu
services 93e4e3d07c 增加PPO方法 6 hari lalu
__init__.py a33a6c3bfb 初始化仓库 2 minggu lalu
config.py 866c90d0cb 修改env 6 hari lalu