lxylxy123321
|
0cae43e09c
修复ppo报错
|
преди 1 ден |
lxylxy123321
|
5980af33a7
修复ppo训练报错
|
преди 1 ден |
lxylxy123321
|
8eade0ee3d
trl降级
|
преди 1 ден |
lxylxy123321
|
feb01ed135
关闭torch.compile
|
преди 1 ден |
lxylxy123321
|
a91c8c230e
修复ppo报错
|
преди 1 ден |
lxylxy123321
|
34d10f36cd
修复ppo报错
|
преди 1 ден |
lxylxy123321
|
7f95860175
修复ppo问题
|
преди 1 ден |
lxylxy123321
|
a03105a4fd
修复ppo报错
|
преди 1 ден |
lxylxy123321
|
659fceaef8
修复 PPO 训练无法导入 PPOConfig/PPOTrainer 的问题
|
преди 1 ден |
lxylxy123321
|
487151fa5f
接入标注平台,修复DPO报错
|
преди 2 дни |
lxylxy123321
|
5aebcc61f8
优化记录显示,使用单卡推理
|
преди 2 дни |
lxylxy123321
|
c2382c3c64
修复151上训练
|
преди 3 дни |
lxylxy123321
|
e98a6918c8
修复多卡训练报错问题
|
преди 3 дни |
lxylxy123321
|
eafbed2c7a
修复多卡执行报错
|
преди 3 дни |
lxylxy123321
|
401e3d5ac3
新增多卡执行
|
преди 3 дни |
lxylxy123321
|
93e4e3d07c
增加PPO方法
|
преди 3 дни |
lxylxy123321
|
5ac3275c5e
修复total_step报错
|
преди 3 дни |
lxylxy123321
|
89483a3666
调整step问题
|
преди 3 дни |
lxylxy123321
|
4a1ae29f62
确保max_steps 至少为 1
|
преди 3 дни |
lxylxy123321
|
0b255898ad
修复adalora报错问题
|
преди 3 дни |
lxylxy123321
|
3c049f18db
使用qlora回退lora+FP16,MUSA不支持
|
преди 3 дни |
lxylxy123321
|
5a57edb1d8
沐曦生态不支持 BitsAndBytes
|
преди 3 дни |
lxylxy123321
|
bc062579dd
修复qlora报错
|
преди 6 дни |
lxylxy123321
|
9a25fae9d2
训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora
|
преди 6 дни |
lxylxy123321
|
a95623c0f8
增加样本中心接口,改为单卡训练
|
преди 6 дни |
lxylxy123321
|
6e9f8e7903
优化训练过程
|
преди 6 дни |
lxylxy123321
|
21699f9c42
修改GPU识别错误
|
преди 6 дни |
lxylxy123321
|
25e2de0635
修改内存不足问题,更改平台名称
|
преди 6 дни |
lxylxy123321
|
4128ea1efe
修复模型微调显存占用过大问题
|
преди 6 дни |
lxylxy123321
|
f797647427
优化界面,修复训练列名报错问题,优化训练进度条
|
преди 6 дни |