Bladeren bron

添加禁用Flash Attention

lxylxy123321 1 week geleden
bovenliggende
commit
1082dfcf82
1 gewijzigde bestanden met toevoegingen van 9 en 0 verwijderingen
  1. 9 0
      backend/main.py

+ 9 - 0
backend/main.py

@@ -1,3 +1,12 @@
+import os
+
+# 禁用 FlashAttention,解决沐曦显卡共享内存不足问题
+# 必须放在最开头,在任何库导入之前设置
+os.environ["PYTORCH_NO_FLASH"] = "1"
+os.environ["FLASH_ATTENTION_ENABLED"] = "0"
+os.environ["USE_FLASH_ATTENTION"] = "0"
+os.environ["TORCH_FLASH_ATTN"] = "0"
+
 from contextlib import asynccontextmanager
 
 from fastapi import FastAPI