提交历史

作者 SHA1 备注 提交日期
  lxylxy123321 910aed9111 修复路径问题 21 小时之前
  lxylxy123321 029e5ccb97 修复报错 21 小时之前
  lxylxy123321 c31c29de96 修复ppo报错 21 小时之前
  lxylxy123321 383056165f 修复ppo报错 21 小时之前
  lxylxy123321 44d0a1c8f6 修复ppo不能被整除问题 22 小时之前
  lxylxy123321 0cae43e09c 修复ppo报错 22 小时之前
  lxylxy123321 5980af33a7 修复ppo训练报错 22 小时之前
  lxylxy123321 8eade0ee3d trl降级 22 小时之前
  lxylxy123321 feb01ed135 关闭torch.compile 23 小时之前
  lxylxy123321 a91c8c230e 修复ppo报错 1 天之前
  lxylxy123321 34d10f36cd 修复ppo报错 1 天之前
  lxylxy123321 7f95860175 修复ppo问题 1 天之前
  lxylxy123321 a03105a4fd 修复ppo报错 1 天之前
  lxylxy123321 659fceaef8 修复 PPO 训练无法导入 PPOConfig/PPOTrainer 的问题 1 天之前
  lxylxy123321 487151fa5f 接入标注平台,修复DPO报错 1 天之前
  lxylxy123321 5aebcc61f8 优化记录显示,使用单卡推理 1 天之前
  lxylxy123321 c2382c3c64 修复151上训练 2 天之前
  lxylxy123321 e98a6918c8 修复多卡训练报错问题 2 天之前
  lxylxy123321 eafbed2c7a 修复多卡执行报错 2 天之前
  lxylxy123321 401e3d5ac3 新增多卡执行 2 天之前
  lxylxy123321 93e4e3d07c 增加PPO方法 2 天之前
  lxylxy123321 5ac3275c5e 修复total_step报错 3 天之前
  lxylxy123321 89483a3666 调整step问题 3 天之前
  lxylxy123321 4a1ae29f62 确保max_steps 至少为 1 3 天之前
  lxylxy123321 0b255898ad 修复adalora报错问题 3 天之前
  lxylxy123321 3c049f18db 使用qlora回退lora+FP16,MUSA不支持 3 天之前
  lxylxy123321 5a57edb1d8 沐曦生态不支持 BitsAndBytes 3 天之前
  lxylxy123321 bc062579dd 修复qlora报错 5 天之前
  lxylxy123321 9a25fae9d2 训练方法保留 SFT、DPO、PPO,PEFT 方法保留 lora、qlora、adalora 5 天之前
  lxylxy123321 a95623c0f8 增加样本中心接口,改为单卡训练 5 天之前