Commit History

Автор SHA1 Съобщение Дата
  lxylxy123321 d4bf36ebcf 修复dpo报错 преди 2 дни
  lxylxy123321 10e8f5649f 修复dpo报错 преди 2 дни
  lxylxy123321 910aed9111 修复路径问题 преди 2 дни
  lxylxy123321 029e5ccb97 修复报错 преди 2 дни
  lxylxy123321 c31c29de96 修复ppo报错 преди 2 дни
  lxylxy123321 383056165f 修复ppo报错 преди 2 дни
  lxylxy123321 44d0a1c8f6 修复ppo不能被整除问题 преди 2 дни
  lxylxy123321 0cae43e09c 修复ppo报错 преди 2 дни
  lxylxy123321 5980af33a7 修复ppo训练报错 преди 2 дни
  lxylxy123321 8eade0ee3d trl降级 преди 2 дни
  lxylxy123321 feb01ed135 关闭torch.compile преди 2 дни
  lxylxy123321 a91c8c230e 修复ppo报错 преди 2 дни
  lxylxy123321 34d10f36cd 修复ppo报错 преди 2 дни
  lxylxy123321 7f95860175 修复ppo问题 преди 2 дни
  lxylxy123321 a03105a4fd 修复ppo报错 преди 2 дни
  lxylxy123321 659fceaef8 修复 PPO 训练无法导入 PPOConfig/PPOTrainer 的问题 преди 2 дни
  lxylxy123321 487151fa5f 接入标注平台,修复DPO报错 преди 3 дни
  lxylxy123321 5aebcc61f8 优化记录显示,使用单卡推理 преди 3 дни
  lxylxy123321 c2382c3c64 修复151上训练 преди 4 дни
  lxylxy123321 e98a6918c8 修复多卡训练报错问题 преди 4 дни
  lxylxy123321 eafbed2c7a 修复多卡执行报错 преди 4 дни
  lxylxy123321 401e3d5ac3 新增多卡执行 преди 4 дни
  lxylxy123321 93e4e3d07c 增加PPO方法 преди 4 дни
  lxylxy123321 5ac3275c5e 修复total_step报错 преди 4 дни
  lxylxy123321 89483a3666 调整step问题 преди 4 дни
  lxylxy123321 4a1ae29f62 确保max_steps 至少为 1 преди 4 дни
  lxylxy123321 0b255898ad 修复adalora报错问题 преди 4 дни
  lxylxy123321 3c049f18db 使用qlora回退lora+FP16,MUSA不支持 преди 4 дни
  lxylxy123321 5a57edb1d8 沐曦生态不支持 BitsAndBytes преди 4 дни
  lxylxy123321 bc062579dd 修复qlora报错 преди 1 седмица