lxylxy123321
|
c31c29de96
修复ppo报错
|
1 день назад |
lxylxy123321
|
383056165f
修复ppo报错
|
1 день назад |
lxylxy123321
|
44d0a1c8f6
修复ppo不能被整除问题
|
1 день назад |
lxylxy123321
|
0cae43e09c
修复ppo报错
|
1 день назад |
lxylxy123321
|
5980af33a7
修复ppo训练报错
|
1 день назад |
lxylxy123321
|
8eade0ee3d
trl降级
|
1 день назад |
lxylxy123321
|
feb01ed135
关闭torch.compile
|
1 день назад |
lxylxy123321
|
a91c8c230e
修复ppo报错
|
1 день назад |
lxylxy123321
|
34d10f36cd
修复ppo报错
|
1 день назад |
lxylxy123321
|
7f95860175
修复ppo问题
|
1 день назад |
lxylxy123321
|
a03105a4fd
修复ppo报错
|
1 день назад |
lxylxy123321
|
659fceaef8
修复 PPO 训练无法导入 PPOConfig/PPOTrainer 的问题
|
1 день назад |
lxylxy123321
|
487151fa5f
接入标注平台,修复DPO报错
|
2 дней назад |
lxylxy123321
|
5aebcc61f8
优化记录显示,使用单卡推理
|
2 дней назад |
lxylxy123321
|
c2382c3c64
修复151上训练
|
2 дней назад |
lxylxy123321
|
e98a6918c8
修复多卡训练报错问题
|
2 дней назад |
lxylxy123321
|
eafbed2c7a
修复多卡执行报错
|
3 дней назад |
lxylxy123321
|
401e3d5ac3
新增多卡执行
|
3 дней назад |
lxylxy123321
|
93e4e3d07c
增加PPO方法
|
3 дней назад |
lxylxy123321
|
5ac3275c5e
修复total_step报错
|
3 дней назад |
lxylxy123321
|
89483a3666
调整step问题
|
3 дней назад |
lxylxy123321
|
4a1ae29f62
确保max_steps 至少为 1
|
3 дней назад |
lxylxy123321
|
0b255898ad
修复adalora报错问题
|
3 дней назад |
lxylxy123321
|
3c049f18db
使用qlora回退lora+FP16,MUSA不支持
|
3 дней назад |
lxylxy123321
|
5a57edb1d8
沐曦生态不支持 BitsAndBytes
|
3 дней назад |
lxylxy123321
|
bc062579dd
修复qlora报错
|
6 дней назад |
lxylxy123321
|
9a25fae9d2
训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora
|
6 дней назад |
lxylxy123321
|
a95623c0f8
增加样本中心接口,改为单卡训练
|
6 дней назад |
lxylxy123321
|
6e9f8e7903
优化训练过程
|
6 дней назад |
lxylxy123321
|
21699f9c42
修改GPU识别错误
|
6 дней назад |