История коммитов

Автор SHA1 Сообщение Дата
  lxylxy123321 c31c29de96 修复ppo报错 1 день назад
  lxylxy123321 383056165f 修复ppo报错 1 день назад
  lxylxy123321 44d0a1c8f6 修复ppo不能被整除问题 1 день назад
  lxylxy123321 0cae43e09c 修复ppo报错 1 день назад
  lxylxy123321 5980af33a7 修复ppo训练报错 1 день назад
  lxylxy123321 8eade0ee3d trl降级 1 день назад
  lxylxy123321 feb01ed135 关闭torch.compile 1 день назад
  lxylxy123321 a91c8c230e 修复ppo报错 1 день назад
  lxylxy123321 34d10f36cd 修复ppo报错 1 день назад
  lxylxy123321 7f95860175 修复ppo问题 1 день назад
  lxylxy123321 a03105a4fd 修复ppo报错 1 день назад
  lxylxy123321 659fceaef8 修复 PPO 训练无法导入 PPOConfig/PPOTrainer 的问题 1 день назад
  lxylxy123321 487151fa5f 接入标注平台,修复DPO报错 2 дней назад
  lxylxy123321 5aebcc61f8 优化记录显示,使用单卡推理 2 дней назад
  lxylxy123321 c2382c3c64 修复151上训练 2 дней назад
  lxylxy123321 e98a6918c8 修复多卡训练报错问题 2 дней назад
  lxylxy123321 eafbed2c7a 修复多卡执行报错 3 дней назад
  lxylxy123321 401e3d5ac3 新增多卡执行 3 дней назад
  lxylxy123321 93e4e3d07c 增加PPO方法 3 дней назад
  lxylxy123321 5ac3275c5e 修复total_step报错 3 дней назад
  lxylxy123321 89483a3666 调整step问题 3 дней назад
  lxylxy123321 4a1ae29f62 确保max_steps 至少为 1 3 дней назад
  lxylxy123321 0b255898ad 修复adalora报错问题 3 дней назад
  lxylxy123321 3c049f18db 使用qlora回退lora+FP16,MUSA不支持 3 дней назад
  lxylxy123321 5a57edb1d8 沐曦生态不支持 BitsAndBytes 3 дней назад
  lxylxy123321 bc062579dd 修复qlora报错 6 дней назад
  lxylxy123321 9a25fae9d2 训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora 6 дней назад
  lxylxy123321 a95623c0f8 增加样本中心接口,改为单卡训练 6 дней назад
  lxylxy123321 6e9f8e7903 优化训练过程 6 дней назад
  lxylxy123321 21699f9c42 修改GPU识别错误 6 дней назад