lxylxy123321
|
cf83f1a1bf
修复dpo报错
|
1 день назад |
lxylxy123321
|
0d10c166f4
修复dpo报错
|
1 день назад |
lxylxy123321
|
a8d133631d
修复dpo报错
|
1 день назад |
lxylxy123321
|
d4bf36ebcf
修复dpo报错
|
1 день назад |
lxylxy123321
|
10e8f5649f
修复dpo报错
|
1 день назад |
lxylxy123321
|
910aed9111
修复路径问题
|
1 день назад |
lxylxy123321
|
029e5ccb97
修复报错
|
1 день назад |
lxylxy123321
|
c31c29de96
修复ppo报错
|
1 день назад |
lxylxy123321
|
383056165f
修复ppo报错
|
1 день назад |
lxylxy123321
|
44d0a1c8f6
修复ppo不能被整除问题
|
1 день назад |
lxylxy123321
|
0cae43e09c
修复ppo报错
|
1 день назад |
lxylxy123321
|
5980af33a7
修复ppo训练报错
|
1 день назад |
lxylxy123321
|
8eade0ee3d
trl降级
|
1 день назад |
lxylxy123321
|
feb01ed135
关闭torch.compile
|
1 день назад |
lxylxy123321
|
a91c8c230e
修复ppo报错
|
1 день назад |
lxylxy123321
|
34d10f36cd
修复ppo报错
|
1 день назад |
lxylxy123321
|
7f95860175
修复ppo问题
|
1 день назад |
lxylxy123321
|
a03105a4fd
修复ppo报错
|
1 день назад |
lxylxy123321
|
659fceaef8
修复 PPO 训练无法导入 PPOConfig/PPOTrainer 的问题
|
1 день назад |
lxylxy123321
|
487151fa5f
接入标注平台,修复DPO报错
|
2 дней назад |
lxylxy123321
|
5aebcc61f8
优化记录显示,使用单卡推理
|
2 дней назад |
lxylxy123321
|
c2382c3c64
修复151上训练
|
3 дней назад |
lxylxy123321
|
e98a6918c8
修复多卡训练报错问题
|
3 дней назад |
lxylxy123321
|
eafbed2c7a
修复多卡执行报错
|
3 дней назад |
lxylxy123321
|
401e3d5ac3
新增多卡执行
|
3 дней назад |
lxylxy123321
|
93e4e3d07c
增加PPO方法
|
3 дней назад |
lxylxy123321
|
5ac3275c5e
修复total_step报错
|
3 дней назад |
lxylxy123321
|
89483a3666
调整step问题
|
3 дней назад |
lxylxy123321
|
4a1ae29f62
确保max_steps 至少为 1
|
3 дней назад |
lxylxy123321
|
0b255898ad
修复adalora报错问题
|
3 дней назад |