deploy_agent.sh 16 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433
  1. #!/bin/bash
  2. #!/bin/bash
  3. # ============ 强制要求 Bash 执行 ============
  4. if [ -z "$BASH_VERSION" ]; then
  5. echo "****************************************************************"
  6. echo "* 错误:此脚本必须使用 bash 执行,不支持 sh/dash!"
  7. echo "* 请使用以下任一方式运行:"
  8. echo "* 1. 赋予执行权限后: ./deploy_agent.sh"
  9. echo "* 2. 显式指定 bash: bash deploy_agent.sh"
  10. echo "****************************************************************"
  11. exit 1
  12. fi
  13. # ==========================================
  14. # ================= 配置区域 =================
  15. # 源代码路径
  16. SOURCE_DIR="/home/lq/lq_workspace/LQAgentServer/source/LQAgentPlatform"
  17. # Docker Compose 运行路径
  18. DOCKER_APP_DIR="/home/lq/lq_workspace/LQAgentServer/app/docker"
  19. # 配置文件名称
  20. COMPOSE_FILE="docker-compose.yml"
  21. # 镜像名称 (Repository)
  22. IMAGE_NAME="lq_agent_platform_server_dev"
  23. # Git 凭证
  24. GIT_USER="WangXuMing"
  25. GIT_PASS="123456"
  26. # 代理配置(用于加速依赖下载)
  27. PROXY_HOST="127.0.0.1" # 宿主机代理地址,配合 --network host 使用
  28. PROXY_PORT="7890" # 代理端口
  29. # ================= 辅助函数 =================
  30. # 打印带时间戳的日志
  31. log_info() {
  32. echo -e "\033[32m[INFO] $(date '+%Y-%m-%d %H:%M:%S') - $1\033[0m"
  33. }
  34. log_error() {
  35. echo -e "\033[31m[ERROR] $(date '+%Y-%m-%d %H:%M:%S') - $1\033[0m"
  36. }
  37. log_warn() {
  38. echo -e "\033[33m[WARN] $(date '+%Y-%m-%d %H:%M:%S') - $1\033[0m"
  39. }
  40. # 检查命令执行状态,如果失败则退出
  41. check_status() {
  42. if [ $? -ne 0 ]; then
  43. log_error "$1 执行失败,脚本终止。"
  44. exit 1
  45. fi
  46. }
  47. # 询问是否使用代理(默认不使用)
  48. ask_use_proxy() {
  49. USE_PROXY=false
  50. PROXY_URL=""
  51. # 非交互终端直接跳过
  52. if [ ! -t 0 ]; then
  53. log_info "非交互终端,默认不使用代理"
  54. return
  55. fi
  56. echo ""
  57. echo "============================================"
  58. echo " 是否使用代理加速依赖下载?"
  59. echo " 默认: 不使用代理(直接走清华镜像源)"
  60. echo "============================================"
  61. read -p "使用代理 [y/N]: " proxy_choice
  62. case "$proxy_choice" in
  63. [yY][eE][sS]|[yY])
  64. USE_PROXY=true
  65. # 确定代理宿主机地址
  66. if [ -z "$PROXY_HOST" ]; then
  67. PROXY_HOST=$(hostname -I | awk '{print $1}')
  68. fi
  69. PROXY_URL="http://${PROXY_HOST}:${PROXY_PORT}"
  70. log_info "已启用代理: ${PROXY_URL}"
  71. # 检测代理端口是否可达
  72. if ! curl -s --connect-timeout 2 "http://${PROXY_HOST}:${PROXY_PORT}" > /dev/null 2>&1; then
  73. echo ""
  74. echo "[WARN] 代理端口 ${PROXY_HOST}:${PROXY_PORT} 未响应,可能尚未启动"
  75. echo " 请在另一个终端执行: clashctl on"
  76. echo ""
  77. read -p "确认代理已开启后按回车继续,或 Ctrl+C 退出: "
  78. fi
  79. ;;
  80. *)
  81. log_info "不使用代理,走默认镜像源"
  82. ;;
  83. esac
  84. }
  85. # 版本号比较函数
  86. # 返回: 0=相等, 1=第一个大于第二个, 2=第二个大于第一个
  87. compare_versions() {
  88. v1=$(echo "$1" | sed 's/v//')
  89. v2=$(echo "$2" | sed 's/v//')
  90. if [ "$(echo "$v1 == $v2" | bc)" -eq 1 ]; then
  91. return 0
  92. elif [ "$(echo "$v1 > $v2" | bc)" -eq 1 ]; then
  93. return 1
  94. else
  95. return 2
  96. fi
  97. }
  98. # ================= 步骤 1: Git 拉取代码 (带重试+强制拉取) =================
  99. log_info "步骤 1: 进入源码目录并拉取最新代码..."
  100. if [ ! -d "$SOURCE_DIR" ]; then
  101. log_error "源码目录不存在: $SOURCE_DIR"
  102. exit 1
  103. fi
  104. # 检查目录进入权限并修复
  105. if [ ! -x "$SOURCE_DIR" ]; then
  106. log_error "源码目录无进入权限!正在修复..."
  107. sudo chmod +x "$SOURCE_DIR"
  108. sudo chown -R lq:lq "$SOURCE_DIR"
  109. fi
  110. cd "$SOURCE_DIR" || {
  111. log_error "进入源码目录失败!路径:$SOURCE_DIR"
  112. log_error "可能原因:1. 目录权限不足 2. 路径含特殊字符 3. 目录被删除"
  113. exit 1
  114. }
  115. check_status "进入源码目录" # 双重保障
  116. # 检查是否为 Git 仓库
  117. if [ ! -d ".git" ]; then
  118. log_error "当前目录不是 Git 仓库!路径:$SOURCE_DIR"
  119. exit 1
  120. fi
  121. log_info "检查本地是否存在可能与远程冲突的已修改文件..."
  122. HAS_CONFLICT_FILES=$(git status --porcelain | grep -v "^??")
  123. if [ -n "$HAS_CONFLICT_FILES" ]; then
  124. log_info "发现以下文件存在本地修改(将被远程最新代码覆盖):"
  125. echo "$HAS_CONFLICT_FILES" | awk '{print " - " $2}'
  126. log_info "正在强制丢弃本地修改,确保同步远程最新代码..."
  127. # 强制丢弃修改
  128. git checkout -- . # 仅丢弃已跟踪文件的本地修改(冲突风险文件)
  129. log_info "本地冲突文件修改已丢弃,准备拉取远程最新代码..."
  130. else
  131. log_info "本地无可能冲突的已修改文件,直接拉取远程最新代码..."
  132. fi
  133. # 组装 Git 认证 URL(保留原逻辑)
  134. ORIGIN_URL=$(git remote get-url origin 2>/dev/null)
  135. if [ $? -ne 0 ]; then
  136. log_error "获取 Git 远程地址失败!请检查 remote 配置"
  137. exit 1
  138. fi
  139. # 初始化认证 URL(默认使用 origin 远程)
  140. CLEAN_URL=${ORIGIN_URL#*://}
  141. AUTH_URL="http://${GIT_USER}:${GIT_PASS}@${CLEAN_URL}"
  142. # 定义备用远程(upstream)及认证 URL
  143. UPSTREAM_URL=$(git remote get-url upstream 2>/dev/null)
  144. if [ $? -ne 0 ]; then
  145. log_warn "未配置 upstream 远程,503 时无法切换备用源"
  146. UPSTREAM_AVAILABLE=0
  147. else
  148. UPSTREAM_CLEAN_URL=${UPSTREAM_URL#*://}
  149. UPSTREAM_AUTH_URL="http://${GIT_USER}:${GIT_PASS}@${UPSTREAM_CLEAN_URL}"
  150. UPSTREAM_AVAILABLE=1
  151. fi
  152. MAX_RETRIES=3
  153. COUNT=0
  154. GIT_SUCCESS=0
  155. CURRENT_AUTH_URL="$AUTH_URL" # 当前使用的认证 URL
  156. while [ $COUNT -lt $MAX_RETRIES ]; do
  157. log_info "正在执行 Git Pull (第 $((COUNT+1)) 次尝试) - 强制拉取 dev 分支最新代码..."
  158. log_info "当前使用远程地址:${CURRENT_AUTH_URL}"
  159. # 执行 git pull 并捕获错误输出
  160. PULL_OUTPUT=$(git pull "$CURRENT_AUTH_URL" dev --force --allow-unrelated-histories 2>&1)
  161. PULL_EXIT_CODE=$?
  162. if [ $PULL_EXIT_CODE -eq 0 ]; then
  163. # 拉取成功:输出结果并退出循环
  164. GIT_SUCCESS=1
  165. LATEST_COMMIT=$(git log -1 --format="%h - %s ")
  166. log_info "Git Pull 成功!当前部署提交版本:$LATEST_COMMIT"
  167. break
  168. else
  169. # 拉取失败:判断错误类型(新增 returned error: 503 匹配规则)
  170. if echo "$PULL_OUTPUT" | grep -qiE "503 Service Unavailable|503 Unavailable|returned error: 503" && [ $UPSTREAM_AVAILABLE -eq 1 ]; then
  171. # 错误类型:503 服务不可用 + 有备用 upstream 远程
  172. log_error "Git Pull 失败:当前远程(origin)返回 503 不可达,切换到备用远程(upstream)重试..."
  173. log_error "错误详情:$PULL_OUTPUT"
  174. CURRENT_AUTH_URL="$UPSTREAM_AUTH_URL" # 切换为 upstream 认证 URL
  175. COUNT=$((COUNT+1))
  176. sleep 3
  177. elif echo "$PULL_OUTPUT" | grep -qiE "503 Service Unavailable|503 Unavailable|returned error: 503" && [ $UPSTREAM_AVAILABLE -eq 0 ]; then
  178. # 错误类型:503 但无备用源
  179. log_error "Git Pull 失败:远程返回 503 不可达,但未配置 upstream 备用源,无法切换..."
  180. log_error "错误详情:$PULL_OUTPUT"
  181. COUNT=$((COUNT+1))
  182. sleep 3
  183. else
  184. # 其他错误(如认证失败、网络不通、分支不存在等):按原逻辑重试
  185. log_error "Git Pull 失败(非 503 错误),准备重试..."
  186. log_error "错误详情:$PULL_OUTPUT"
  187. COUNT=$((COUNT+1))
  188. sleep 3
  189. fi
  190. fi
  191. done
  192. # 所有重试失败后的处理
  193. if [ $GIT_SUCCESS -eq 0 ]; then
  194. log_error "Git Pull 已重试 $MAX_RETRIES 次,全部失败!"
  195. exit 1
  196. fi
  197. # ================= 步骤 2: 关闭当前容器 =================
  198. log_info "步骤 2: 关闭正在运行的容器..."
  199. if [ ! -d "$DOCKER_APP_DIR" ]; then
  200. log_error "Docker 运行目录不存在: $DOCKER_APP_DIR"
  201. exit 1
  202. fi
  203. cd "$DOCKER_APP_DIR"
  204. check_status "进入 Docker 运行目录"
  205. docker compose down
  206. # 即使 down 失败(例如没启动),也继续执行,只记录错误
  207. if [ $? -ne 0 ]; then
  208. log_error "警告: Docker Compose Down 返回非零状态,尝试继续..."
  209. fi
  210. # ================= 步骤 3: 获取当前运行版本并计算新版本号 =================
  211. log_info "步骤 3: 查找当前运行版本并计算新版本号..."
  212. # 获取当前 docker-compose 中指定的镜像版本
  213. CURRENT_CONFIG_TAG=$(grep "image: ${IMAGE_NAME}:" "$DOCKER_APP_DIR/$COMPOSE_FILE" | sed "s|.*image: ${IMAGE_NAME}:||")
  214. if [ -z "$CURRENT_CONFIG_TAG" ]; then
  215. CURRENT_CONFIG_TAG="v0.01"
  216. log_warn "未在配置文件中找到版本号,使用默认版本: $CURRENT_CONFIG_TAG"
  217. else
  218. log_info "当前配置文件中的版本: $CURRENT_CONFIG_TAG"
  219. fi
  220. # 计算新版本号
  221. # 提取版本号数字 (去掉 'v'),例如 v0.13 -> 0.13
  222. VERSION_NUM=$(echo "$CURRENT_CONFIG_TAG" | sed 's/v//')
  223. # 计算新版本号 (这里设置为 +0.01,即 0.13 -> 0.14)
  224. NEW_VERSION_NUM=$(echo "$VERSION_NUM" | awk '{printf "%.2f", $1 + 0.01}')
  225. NEW_TAG="v$NEW_VERSION_NUM"
  226. log_info "计算出的新版本号为: $NEW_TAG"
  227. # ================= 步骤 4: 删除上上次的镜像版本 =================
  228. log_info "步骤 4: 清理旧镜像(保留最新版本,删除上上次版本)..."
  229. # 获取所有历史镜像,按创建时间降序排列
  230. # 使用 docker images --format 获取完整信息
  231. HISTORY_IMAGES=$(docker images --filter "reference=${IMAGE_NAME}:*" --format "{{.Tag}} {{.ID}} {{.CreatedAt}}" | sort -r)
  232. if [ -n "$HISTORY_IMAGES" ]; then
  233. # 转换为数组
  234. mapfile -t IMAGE_ARRAY <<< "$HISTORY_IMAGES"
  235. log_info "发现 ${#IMAGE_ARRAY[@]} 个历史镜像版本:"
  236. for ((i=0; i<${#IMAGE_ARRAY[@]}; i++)); do
  237. TAG=$(echo "${IMAGE_ARRAY[$i]}" | awk '{print $1}')
  238. IMAGE_ID=$(echo "${IMAGE_ARRAY[$i]}" | awk '{print $2}')
  239. CREATED=$(echo "${IMAGE_ARRAY[$i]}" | awk '{$1=$2=""; print $0}' | sed 's/^ //')
  240. # 标记当前运行版本
  241. if [ "$TAG" = "$CURRENT_CONFIG_TAG" ]; then
  242. log_info " [$i] $TAG - $IMAGE_ID (当前运行版本) - $CREATED"
  243. CURRENT_INDEX=$i
  244. else
  245. log_info " [$i] $TAG - $IMAGE_ID - $CREATED"
  246. fi
  247. done
  248. # 保留策略:保留最新的(索引0)和当前的(如果有),删除上上次的(索引1,如果存在)
  249. if [ ${#IMAGE_ARRAY[@]} -gt 1 ]; then
  250. # 获取第二个镜像的信息(索引1)
  251. SECOND_TAG=$(echo "${IMAGE_ARRAY[1]}" | awk '{print $1}')
  252. SECOND_ID=$(echo "${IMAGE_ARRAY[1]}" | awk '{print $2}')
  253. # 检查是否是要删除的上上次版本
  254. if [ "$SECOND_TAG" != "$NEW_TAG" ] && [ "$SECOND_TAG" != "$CURRENT_CONFIG_TAG" ]; then
  255. log_info "正在删除上上次版本镜像: $SECOND_TAG ($SECOND_ID)"
  256. # 删除镜像
  257. docker rmi -f "$SECOND_ID" 2>/dev/null
  258. if [ $? -eq 0 ]; then
  259. log_info "成功删除上上次版本镜像: $SECOND_TAG"
  260. else
  261. log_warn "删除镜像 $SECOND_TAG 失败(可能已被删除或正在使用),跳过..."
  262. fi
  263. else
  264. log_info "跳过删除 $SECOND_TAG,因为它是当前运行版本或将要构建的新版本"
  265. fi
  266. # 如果有第三个及以后的镜像,也删除(只保留最新的2个版本)
  267. for ((i=2; i<${#IMAGE_ARRAY[@]}; i++)); do
  268. OLD_TAG=$(echo "${IMAGE_ARRAY[$i]}" | awk '{print $1}')
  269. OLD_ID=$(echo "${IMAGE_ARRAY[$i]}" | awk '{print $2}')
  270. if [ "$OLD_TAG" != "$NEW_TAG" ] && [ "$OLD_TAG" != "$CURRENT_CONFIG_TAG" ]; then
  271. log_info "删除更旧的镜像: $OLD_TAG ($OLD_ID)"
  272. docker rmi -f "$OLD_ID" 2>/dev/null
  273. fi
  274. done
  275. else
  276. log_info "只有1个历史镜像,无需清理"
  277. fi
  278. else
  279. log_info "未找到历史镜像"
  280. fi
  281. # ================= 步骤 5: 构建新镜像 =================
  282. # 5a. 检查/构建 base 镜像(含所有系统依赖和 pip 包)
  283. BASE_IMAGE_NAME="lq-agent-base"
  284. BASE_IMAGE_TAG="latest"
  285. REQUIREMENTS_FILE="$SOURCE_DIR/requirements.txt"
  286. # 哈希文件放在 DOCKER_APP_DIR,避免被 git pull 覆盖
  287. BASE_HASH_FILE="$DOCKER_APP_DIR/.base_image_req_hash"
  288. NEED_REBUILD_BASE=false
  289. cd "$SOURCE_DIR"
  290. check_status "返回源码目录"
  291. # 询问是否使用代理(仅 base 镜像构建时需要下载依赖)
  292. ask_use_proxy
  293. # 检查 base 镜像是否存在
  294. if ! docker images --format "{{.Repository}}:{{.Tag}}" | grep -q "^${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}$"; then
  295. log_info "步骤 5a: base 镜像不存在,首次构建 ${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}(包含所有依赖,仅此一次)..."
  296. NEED_REBUILD_BASE=true
  297. else
  298. # 检查 requirements.txt 是否有变化
  299. CURRENT_HASH=$(md5sum "$REQUIREMENTS_FILE" | awk '{print $1}')
  300. if [ -f "$BASE_HASH_FILE" ]; then
  301. STORED_HASH=$(cat "$BASE_HASH_FILE")
  302. if [ "$CURRENT_HASH" != "$STORED_HASH" ]; then
  303. log_info "步骤 5a: requirements.txt 已变化,重建 base 镜像..."
  304. NEED_REBUILD_BASE=true
  305. else
  306. log_info "步骤 5a: base 镜像已存在且依赖未变化,跳过重建"
  307. fi
  308. else
  309. log_info "步骤 5a: 未找到依赖哈希记录,首次记录并确保 base 镜像一致..."
  310. NEED_REBUILD_BASE=true
  311. fi
  312. fi
  313. if [ "$NEED_REBUILD_BASE" = true ]; then
  314. if [ "$USE_PROXY" = true ]; then
  315. log_info "步骤 5a: 使用代理构建 base 镜像 (${PROXY_URL})..."
  316. docker build -f Dockerfile.base \
  317. --network host \
  318. --build-arg HTTP_PROXY="${PROXY_URL}" \
  319. --build-arg HTTPS_PROXY="${PROXY_URL}" \
  320. --build-arg http_proxy="${PROXY_URL}" \
  321. --build-arg https_proxy="${PROXY_URL}" \
  322. -t "${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}" .
  323. else
  324. log_info "步骤 5a: 不使用代理,使用默认镜像源构建 base 镜像..."
  325. docker build -f Dockerfile.base -t "${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}" .
  326. fi
  327. check_status "base 镜像构建"
  328. # 保存当前 requirements.txt 的 md5 哈希
  329. md5sum "$REQUIREMENTS_FILE" | awk '{print $1}' > "$BASE_HASH_FILE"
  330. log_info "base 镜像构建成功: ${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}"
  331. fi
  332. # 5b. 构建应用镜像(基于 base 镜像,仅复制源码,秒级完成)
  333. log_info "步骤 5b: 构建应用镜像 $IMAGE_NAME:$NEW_TAG ..."
  334. docker build -t "${IMAGE_NAME}:${NEW_TAG}" .
  335. check_status "应用镜像构建"
  336. log_info "应用镜像构建成功: ${IMAGE_NAME}:${NEW_TAG}"
  337. # ================= 步骤 6: 修改 docker-compose.yml 版本号 =================
  338. log_info "步骤 6: 更新 docker-compose.yml 中的版本号..."
  339. cd "$DOCKER_APP_DIR"
  340. check_status "进入 Docker 运行目录"
  341. if [ ! -f "$COMPOSE_FILE" ]; then
  342. log_error "找不到配置文件: $COMPOSE_FILE"
  343. exit 1
  344. fi
  345. # 使用 sed 正则替换
  346. # 匹配: image: lq_agent_platform_server_dev:任意字符
  347. # 替换为: image: lq_agent_platform_server_dev:新版本号
  348. sed -i "s|image: ${IMAGE_NAME}:.*|image: ${IMAGE_NAME}:${NEW_TAG}|" "$COMPOSE_FILE"
  349. check_status "修改 docker-compose.yml"
  350. # 验证修改结果
  351. MATCH_LINE=$(grep "image: ${IMAGE_NAME}:" "$COMPOSE_FILE")
  352. log_info "配置文件已更新: $MATCH_LINE"
  353. # ================= 步骤 7: 启动容器 =================
  354. log_info "步骤 7: 启动 Docker Compose..."
  355. docker compose up -d
  356. check_status "启动容器"
  357. # ================= 步骤 8: 显示当前保留的镜像 =================
  358. log_info "步骤 8: 当前保留的镜像版本列表:"
  359. docker images --filter "reference=${IMAGE_NAME}:*" --format "table {{.Tag}}\t{{.ID}}\t{{.Size}}\t{{.CreatedAt}}"
  360. log_info "===================================================="
  361. log_info " 开发版部署成功!"
  362. log_info " 当前运行端口: 8002"
  363. log_info " 部署版本: $NEW_TAG"
  364. log_info " 保留镜像: 最新版本 + 前一个版本"
  365. log_info "===================================================="