Преглед изворни кода

fix: 使用系统 Chromium 替代 Playwright 下载,解决国内构建慢问题

kinglee пре 1 недеља
родитељ
комит
464f5f78c2
2 измењених фајлова са 4 додато и 2 уклоњено
  1. 3 2
      Dockerfile
  2. 1 0
      app/spider/engine.py

+ 3 - 2
Dockerfile

@@ -6,6 +6,7 @@ RUN apt-get update && apt-get install -y --no-install-recommends \
     build-essential \
     curl \
     libpq-dev \
+    chromium \
     && rm -rf /var/lib/apt/lists/*
 
 COPY pyproject.toml uv.lock ./
@@ -20,8 +21,8 @@ RUN pip install --no-cache-dir uv && \
 
 COPY . .
 
-# 安装 Playwright Chromium 浏览器(Crawl4AI 依赖
-RUN .venv/bin/python -m playwright install --with-deps chromium
+# 安装 Playwright 系统依赖(不下载 Chromium,使用系统 chromium 包
+RUN .venv/bin/python -m playwright install-deps chromium
 
 RUN chmod +x entrypoint.sh
 ENTRYPOINT ["./entrypoint.sh"]

+ 1 - 0
app/spider/engine.py

@@ -42,6 +42,7 @@ class GenericSpiderEngine:
             headless=True,
             verbose=False,
             java_script_enabled=True,
+            channel="chromium",
         )
         run_config = CrawlerRunConfig(
             cache_mode=CacheMode.BYPASS