Historial de Commits

Autor SHA1 Mensaje Fecha
  lxylxy123321 75c46db7e1 修复dpo报错 hace 1 día
  lxylxy123321 397974ca55 修复dpo报错 hace 1 día
  lxylxy123321 cf83f1a1bf 修复dpo报错 hace 1 día
  lxylxy123321 0d10c166f4 修复dpo报错 hace 1 día
  lxylxy123321 a8d133631d 修复dpo报错 hace 1 día
  lxylxy123321 d4bf36ebcf 修复dpo报错 hace 1 día
  lxylxy123321 10e8f5649f 修复dpo报错 hace 1 día
  lxylxy123321 910aed9111 修复路径问题 hace 1 día
  lxylxy123321 029e5ccb97 修复报错 hace 1 día
  lxylxy123321 c31c29de96 修复ppo报错 hace 1 día
  lxylxy123321 383056165f 修复ppo报错 hace 1 día
  lxylxy123321 44d0a1c8f6 修复ppo不能被整除问题 hace 1 día
  lxylxy123321 0cae43e09c 修复ppo报错 hace 1 día
  lxylxy123321 5980af33a7 修复ppo训练报错 hace 1 día
  lxylxy123321 8eade0ee3d trl降级 hace 1 día
  lxylxy123321 feb01ed135 关闭torch.compile hace 1 día
  lxylxy123321 a91c8c230e 修复ppo报错 hace 1 día
  lxylxy123321 34d10f36cd 修复ppo报错 hace 1 día
  lxylxy123321 7f95860175 修复ppo问题 hace 1 día
  lxylxy123321 a03105a4fd 修复ppo报错 hace 1 día
  lxylxy123321 659fceaef8 修复 PPO 训练无法导入 PPOConfig/PPOTrainer 的问题 hace 1 día
  lxylxy123321 487151fa5f 接入标注平台,修复DPO报错 hace 2 días
  lxylxy123321 5aebcc61f8 优化记录显示,使用单卡推理 hace 2 días
  lxylxy123321 c2382c3c64 修复151上训练 hace 3 días
  lxylxy123321 e98a6918c8 修复多卡训练报错问题 hace 3 días
  lxylxy123321 eafbed2c7a 修复多卡执行报错 hace 3 días
  lxylxy123321 401e3d5ac3 新增多卡执行 hace 3 días
  lxylxy123321 93e4e3d07c 增加PPO方法 hace 3 días
  lxylxy123321 5ac3275c5e 修复total_step报错 hace 3 días
  lxylxy123321 89483a3666 调整step问题 hace 3 días