deploy_agent.sh 16 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424
  1. #!/bin/bash
  2. #!/bin/bash
  3. # ============ 强制要求 Bash 执行 ============
  4. if [ -z "$BASH_VERSION" ]; then
  5. echo "****************************************************************"
  6. echo "* 错误:此脚本必须使用 bash 执行,不支持 sh/dash!"
  7. echo "* 请使用以下任一方式运行:"
  8. echo "* 1. 赋予执行权限后: ./deploy_agent.sh"
  9. echo "* 2. 显式指定 bash: bash deploy_agent.sh"
  10. echo "****************************************************************"
  11. exit 1
  12. fi
  13. # ==========================================
  14. # ================= 配置区域 =================
  15. # 源代码路径
  16. SOURCE_DIR="/home/lq/lq_workspace/LQAgentServer/source/LQAgentPlatform"
  17. # Docker Compose 运行路径
  18. DOCKER_APP_DIR="/home/lq/lq_workspace/LQAgentServer/app/docker"
  19. # 配置文件名称
  20. COMPOSE_FILE="docker-compose.yml"
  21. # 镜像名称 (Repository)
  22. IMAGE_NAME="lq_agent_platform_server_dev"
  23. # Git 凭证
  24. GIT_USER="WangXuMing"
  25. GIT_PASS="123456"
  26. # 代理配置(用于加速依赖下载)
  27. PROXY_HOST="127.0.0.1" # 宿主机代理地址,配合 --network host 使用
  28. PROXY_PORT="7890" # 代理端口
  29. # ================= 辅助函数 =================
  30. # 打印带时间戳的日志
  31. log_info() {
  32. echo -e "\033[32m[INFO] $(date '+%Y-%m-%d %H:%M:%S') - $1\033[0m"
  33. }
  34. log_error() {
  35. echo -e "\033[31m[ERROR] $(date '+%Y-%m-%d %H:%M:%S') - $1\033[0m"
  36. }
  37. log_warn() {
  38. echo -e "\033[33m[WARN] $(date '+%Y-%m-%d %H:%M:%S') - $1\033[0m"
  39. }
  40. # 检查命令执行状态,如果失败则退出
  41. check_status() {
  42. if [ $? -ne 0 ]; then
  43. log_error "$1 执行失败,脚本终止。"
  44. exit 1
  45. fi
  46. }
  47. # 询问是否使用代理(默认不使用)
  48. ask_use_proxy() {
  49. USE_PROXY=false
  50. PROXY_URL=""
  51. # 非交互终端直接跳过
  52. if [ ! -t 0 ]; then
  53. log_info "非交互终端,默认不使用代理"
  54. return
  55. fi
  56. echo ""
  57. echo "============================================"
  58. echo " 是否使用代理加速依赖下载?"
  59. echo " 默认: 不使用代理(直接走清华镜像源)"
  60. echo "============================================"
  61. read -p "使用代理 [y/N]: " proxy_choice
  62. case "$proxy_choice" in
  63. [yY][eE][sS]|[yY])
  64. USE_PROXY=true
  65. # 确定代理宿主机地址
  66. if [ -z "$PROXY_HOST" ]; then
  67. PROXY_HOST=$(hostname -I | awk '{print $1}')
  68. fi
  69. PROXY_URL="http://${PROXY_HOST}:${PROXY_PORT}"
  70. log_info "已启用代理: ${PROXY_URL}"
  71. ;;
  72. *)
  73. log_info "不使用代理,走默认镜像源"
  74. ;;
  75. esac
  76. }
  77. # 版本号比较函数
  78. # 返回: 0=相等, 1=第一个大于第二个, 2=第二个大于第一个
  79. compare_versions() {
  80. v1=$(echo "$1" | sed 's/v//')
  81. v2=$(echo "$2" | sed 's/v//')
  82. if [ "$(echo "$v1 == $v2" | bc)" -eq 1 ]; then
  83. return 0
  84. elif [ "$(echo "$v1 > $v2" | bc)" -eq 1 ]; then
  85. return 1
  86. else
  87. return 2
  88. fi
  89. }
  90. # ================= 步骤 1: Git 拉取代码 (带重试+强制拉取) =================
  91. log_info "步骤 1: 进入源码目录并拉取最新代码..."
  92. if [ ! -d "$SOURCE_DIR" ]; then
  93. log_error "源码目录不存在: $SOURCE_DIR"
  94. exit 1
  95. fi
  96. # 检查目录进入权限并修复
  97. if [ ! -x "$SOURCE_DIR" ]; then
  98. log_error "源码目录无进入权限!正在修复..."
  99. sudo chmod +x "$SOURCE_DIR"
  100. sudo chown -R lq:lq "$SOURCE_DIR"
  101. fi
  102. cd "$SOURCE_DIR" || {
  103. log_error "进入源码目录失败!路径:$SOURCE_DIR"
  104. log_error "可能原因:1. 目录权限不足 2. 路径含特殊字符 3. 目录被删除"
  105. exit 1
  106. }
  107. check_status "进入源码目录" # 双重保障
  108. # 检查是否为 Git 仓库
  109. if [ ! -d ".git" ]; then
  110. log_error "当前目录不是 Git 仓库!路径:$SOURCE_DIR"
  111. exit 1
  112. fi
  113. log_info "检查本地是否存在可能与远程冲突的已修改文件..."
  114. HAS_CONFLICT_FILES=$(git status --porcelain | grep -v "^??")
  115. if [ -n "$HAS_CONFLICT_FILES" ]; then
  116. log_info "发现以下文件存在本地修改(将被远程最新代码覆盖):"
  117. echo "$HAS_CONFLICT_FILES" | awk '{print " - " $2}'
  118. log_info "正在强制丢弃本地修改,确保同步远程最新代码..."
  119. # 强制丢弃修改
  120. git checkout -- . # 仅丢弃已跟踪文件的本地修改(冲突风险文件)
  121. log_info "本地冲突文件修改已丢弃,准备拉取远程最新代码..."
  122. else
  123. log_info "本地无可能冲突的已修改文件,直接拉取远程最新代码..."
  124. fi
  125. # 组装 Git 认证 URL(保留原逻辑)
  126. ORIGIN_URL=$(git remote get-url origin 2>/dev/null)
  127. if [ $? -ne 0 ]; then
  128. log_error "获取 Git 远程地址失败!请检查 remote 配置"
  129. exit 1
  130. fi
  131. # 初始化认证 URL(默认使用 origin 远程)
  132. CLEAN_URL=${ORIGIN_URL#*://}
  133. AUTH_URL="http://${GIT_USER}:${GIT_PASS}@${CLEAN_URL}"
  134. # 定义备用远程(upstream)及认证 URL
  135. UPSTREAM_URL=$(git remote get-url upstream 2>/dev/null)
  136. if [ $? -ne 0 ]; then
  137. log_warn "未配置 upstream 远程,503 时无法切换备用源"
  138. UPSTREAM_AVAILABLE=0
  139. else
  140. UPSTREAM_CLEAN_URL=${UPSTREAM_URL#*://}
  141. UPSTREAM_AUTH_URL="http://${GIT_USER}:${GIT_PASS}@${UPSTREAM_CLEAN_URL}"
  142. UPSTREAM_AVAILABLE=1
  143. fi
  144. MAX_RETRIES=3
  145. COUNT=0
  146. GIT_SUCCESS=0
  147. CURRENT_AUTH_URL="$AUTH_URL" # 当前使用的认证 URL
  148. while [ $COUNT -lt $MAX_RETRIES ]; do
  149. log_info "正在执行 Git Pull (第 $((COUNT+1)) 次尝试) - 强制拉取 dev 分支最新代码..."
  150. log_info "当前使用远程地址:${CURRENT_AUTH_URL}"
  151. # 执行 git pull 并捕获错误输出
  152. PULL_OUTPUT=$(git pull "$CURRENT_AUTH_URL" dev --force --allow-unrelated-histories 2>&1)
  153. PULL_EXIT_CODE=$?
  154. if [ $PULL_EXIT_CODE -eq 0 ]; then
  155. # 拉取成功:输出结果并退出循环
  156. GIT_SUCCESS=1
  157. LATEST_COMMIT=$(git log -1 --format="%h - %s ")
  158. log_info "Git Pull 成功!当前部署提交版本:$LATEST_COMMIT"
  159. break
  160. else
  161. # 拉取失败:判断错误类型(新增 returned error: 503 匹配规则)
  162. if echo "$PULL_OUTPUT" | grep -qiE "503 Service Unavailable|503 Unavailable|returned error: 503" && [ $UPSTREAM_AVAILABLE -eq 1 ]; then
  163. # 错误类型:503 服务不可用 + 有备用 upstream 远程
  164. log_error "Git Pull 失败:当前远程(origin)返回 503 不可达,切换到备用远程(upstream)重试..."
  165. log_error "错误详情:$PULL_OUTPUT"
  166. CURRENT_AUTH_URL="$UPSTREAM_AUTH_URL" # 切换为 upstream 认证 URL
  167. COUNT=$((COUNT+1))
  168. sleep 3
  169. elif echo "$PULL_OUTPUT" | grep -qiE "503 Service Unavailable|503 Unavailable|returned error: 503" && [ $UPSTREAM_AVAILABLE -eq 0 ]; then
  170. # 错误类型:503 但无备用源
  171. log_error "Git Pull 失败:远程返回 503 不可达,但未配置 upstream 备用源,无法切换..."
  172. log_error "错误详情:$PULL_OUTPUT"
  173. COUNT=$((COUNT+1))
  174. sleep 3
  175. else
  176. # 其他错误(如认证失败、网络不通、分支不存在等):按原逻辑重试
  177. log_error "Git Pull 失败(非 503 错误),准备重试..."
  178. log_error "错误详情:$PULL_OUTPUT"
  179. COUNT=$((COUNT+1))
  180. sleep 3
  181. fi
  182. fi
  183. done
  184. # 所有重试失败后的处理
  185. if [ $GIT_SUCCESS -eq 0 ]; then
  186. log_error "Git Pull 已重试 $MAX_RETRIES 次,全部失败!"
  187. exit 1
  188. fi
  189. # ================= 步骤 2: 关闭当前容器 =================
  190. log_info "步骤 2: 关闭正在运行的容器..."
  191. if [ ! -d "$DOCKER_APP_DIR" ]; then
  192. log_error "Docker 运行目录不存在: $DOCKER_APP_DIR"
  193. exit 1
  194. fi
  195. cd "$DOCKER_APP_DIR"
  196. check_status "进入 Docker 运行目录"
  197. docker compose down
  198. # 即使 down 失败(例如没启动),也继续执行,只记录错误
  199. if [ $? -ne 0 ]; then
  200. log_error "警告: Docker Compose Down 返回非零状态,尝试继续..."
  201. fi
  202. # ================= 步骤 3: 获取当前运行版本并计算新版本号 =================
  203. log_info "步骤 3: 查找当前运行版本并计算新版本号..."
  204. # 获取当前 docker-compose 中指定的镜像版本
  205. CURRENT_CONFIG_TAG=$(grep "image: ${IMAGE_NAME}:" "$DOCKER_APP_DIR/$COMPOSE_FILE" | sed "s|.*image: ${IMAGE_NAME}:||")
  206. if [ -z "$CURRENT_CONFIG_TAG" ]; then
  207. CURRENT_CONFIG_TAG="v0.01"
  208. log_warn "未在配置文件中找到版本号,使用默认版本: $CURRENT_CONFIG_TAG"
  209. else
  210. log_info "当前配置文件中的版本: $CURRENT_CONFIG_TAG"
  211. fi
  212. # 计算新版本号
  213. # 提取版本号数字 (去掉 'v'),例如 v0.13 -> 0.13
  214. VERSION_NUM=$(echo "$CURRENT_CONFIG_TAG" | sed 's/v//')
  215. # 计算新版本号 (这里设置为 +0.01,即 0.13 -> 0.14)
  216. NEW_VERSION_NUM=$(echo "$VERSION_NUM" | awk '{printf "%.2f", $1 + 0.01}')
  217. NEW_TAG="v$NEW_VERSION_NUM"
  218. log_info "计算出的新版本号为: $NEW_TAG"
  219. # ================= 步骤 4: 删除上上次的镜像版本 =================
  220. log_info "步骤 4: 清理旧镜像(保留最新版本,删除上上次版本)..."
  221. # 获取所有历史镜像,按创建时间降序排列
  222. # 使用 docker images --format 获取完整信息
  223. HISTORY_IMAGES=$(docker images --filter "reference=${IMAGE_NAME}:*" --format "{{.Tag}} {{.ID}} {{.CreatedAt}}" | sort -r)
  224. if [ -n "$HISTORY_IMAGES" ]; then
  225. # 转换为数组
  226. mapfile -t IMAGE_ARRAY <<< "$HISTORY_IMAGES"
  227. log_info "发现 ${#IMAGE_ARRAY[@]} 个历史镜像版本:"
  228. for ((i=0; i<${#IMAGE_ARRAY[@]}; i++)); do
  229. TAG=$(echo "${IMAGE_ARRAY[$i]}" | awk '{print $1}')
  230. IMAGE_ID=$(echo "${IMAGE_ARRAY[$i]}" | awk '{print $2}')
  231. CREATED=$(echo "${IMAGE_ARRAY[$i]}" | awk '{$1=$2=""; print $0}' | sed 's/^ //')
  232. # 标记当前运行版本
  233. if [ "$TAG" = "$CURRENT_CONFIG_TAG" ]; then
  234. log_info " [$i] $TAG - $IMAGE_ID (当前运行版本) - $CREATED"
  235. CURRENT_INDEX=$i
  236. else
  237. log_info " [$i] $TAG - $IMAGE_ID - $CREATED"
  238. fi
  239. done
  240. # 保留策略:保留最新的(索引0)和当前的(如果有),删除上上次的(索引1,如果存在)
  241. if [ ${#IMAGE_ARRAY[@]} -gt 1 ]; then
  242. # 获取第二个镜像的信息(索引1)
  243. SECOND_TAG=$(echo "${IMAGE_ARRAY[1]}" | awk '{print $1}')
  244. SECOND_ID=$(echo "${IMAGE_ARRAY[1]}" | awk '{print $2}')
  245. # 检查是否是要删除的上上次版本
  246. if [ "$SECOND_TAG" != "$NEW_TAG" ] && [ "$SECOND_TAG" != "$CURRENT_CONFIG_TAG" ]; then
  247. log_info "正在删除上上次版本镜像: $SECOND_TAG ($SECOND_ID)"
  248. # 删除镜像
  249. docker rmi -f "$SECOND_ID" 2>/dev/null
  250. if [ $? -eq 0 ]; then
  251. log_info "成功删除上上次版本镜像: $SECOND_TAG"
  252. else
  253. log_warn "删除镜像 $SECOND_TAG 失败(可能已被删除或正在使用),跳过..."
  254. fi
  255. else
  256. log_info "跳过删除 $SECOND_TAG,因为它是当前运行版本或将要构建的新版本"
  257. fi
  258. # 如果有第三个及以后的镜像,也删除(只保留最新的2个版本)
  259. for ((i=2; i<${#IMAGE_ARRAY[@]}; i++)); do
  260. OLD_TAG=$(echo "${IMAGE_ARRAY[$i]}" | awk '{print $1}')
  261. OLD_ID=$(echo "${IMAGE_ARRAY[$i]}" | awk '{print $2}')
  262. if [ "$OLD_TAG" != "$NEW_TAG" ] && [ "$OLD_TAG" != "$CURRENT_CONFIG_TAG" ]; then
  263. log_info "删除更旧的镜像: $OLD_TAG ($OLD_ID)"
  264. docker rmi -f "$OLD_ID" 2>/dev/null
  265. fi
  266. done
  267. else
  268. log_info "只有1个历史镜像,无需清理"
  269. fi
  270. else
  271. log_info "未找到历史镜像"
  272. fi
  273. # ================= 步骤 5: 构建新镜像 =================
  274. # 5a. 检查/构建 base 镜像(含所有系统依赖和 pip 包)
  275. BASE_IMAGE_NAME="lq-agent-base"
  276. BASE_IMAGE_TAG="latest"
  277. REQUIREMENTS_FILE="$SOURCE_DIR/requirements.txt"
  278. # 哈希文件放在 DOCKER_APP_DIR,避免被 git pull 覆盖
  279. BASE_HASH_FILE="$DOCKER_APP_DIR/.base_image_req_hash"
  280. NEED_REBUILD_BASE=false
  281. cd "$SOURCE_DIR"
  282. check_status "返回源码目录"
  283. # 询问是否使用代理(仅 base 镜像构建时需要下载依赖)
  284. ask_use_proxy
  285. # 检查 base 镜像是否存在
  286. if ! docker images --format "{{.Repository}}:{{.Tag}}" | grep -q "^${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}$"; then
  287. log_info "步骤 5a: base 镜像不存在,首次构建 ${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}(包含所有依赖,仅此一次)..."
  288. NEED_REBUILD_BASE=true
  289. else
  290. # 检查 requirements.txt 是否有变化
  291. CURRENT_HASH=$(md5sum "$REQUIREMENTS_FILE" | awk '{print $1}')
  292. if [ -f "$BASE_HASH_FILE" ]; then
  293. STORED_HASH=$(cat "$BASE_HASH_FILE")
  294. if [ "$CURRENT_HASH" != "$STORED_HASH" ]; then
  295. log_info "步骤 5a: requirements.txt 已变化,重建 base 镜像..."
  296. NEED_REBUILD_BASE=true
  297. else
  298. log_info "步骤 5a: base 镜像已存在且依赖未变化,跳过重建"
  299. fi
  300. else
  301. log_info "步骤 5a: 未找到依赖哈希记录,首次记录并确保 base 镜像一致..."
  302. NEED_REBUILD_BASE=true
  303. fi
  304. fi
  305. if [ "$NEED_REBUILD_BASE" = true ]; then
  306. if [ "$USE_PROXY" = true ]; then
  307. log_info "步骤 5a: 使用代理构建 base 镜像 (${PROXY_URL})..."
  308. docker build -f Dockerfile.base \
  309. --network host \
  310. --build-arg HTTP_PROXY="${PROXY_URL}" \
  311. --build-arg HTTPS_PROXY="${PROXY_URL}" \
  312. --build-arg http_proxy="${PROXY_URL}" \
  313. --build-arg https_proxy="${PROXY_URL}" \
  314. -t "${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}" .
  315. else
  316. log_info "步骤 5a: 不使用代理,使用默认镜像源构建 base 镜像..."
  317. docker build -f Dockerfile.base -t "${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}" .
  318. fi
  319. check_status "base 镜像构建"
  320. # 保存当前 requirements.txt 的 md5 哈希
  321. md5sum "$REQUIREMENTS_FILE" | awk '{print $1}' > "$BASE_HASH_FILE"
  322. log_info "base 镜像构建成功: ${BASE_IMAGE_NAME}:${BASE_IMAGE_TAG}"
  323. fi
  324. # 5b. 构建应用镜像(基于 base 镜像,仅复制源码,秒级完成)
  325. log_info "步骤 5b: 构建应用镜像 $IMAGE_NAME:$NEW_TAG ..."
  326. docker build -t "${IMAGE_NAME}:${NEW_TAG}" .
  327. check_status "应用镜像构建"
  328. log_info "应用镜像构建成功: ${IMAGE_NAME}:${NEW_TAG}"
  329. # ================= 步骤 6: 修改 docker-compose.yml 版本号 =================
  330. log_info "步骤 6: 更新 docker-compose.yml 中的版本号..."
  331. cd "$DOCKER_APP_DIR"
  332. check_status "进入 Docker 运行目录"
  333. if [ ! -f "$COMPOSE_FILE" ]; then
  334. log_error "找不到配置文件: $COMPOSE_FILE"
  335. exit 1
  336. fi
  337. # 使用 sed 正则替换
  338. # 匹配: image: lq_agent_platform_server_dev:任意字符
  339. # 替换为: image: lq_agent_platform_server_dev:新版本号
  340. sed -i "s|image: ${IMAGE_NAME}:.*|image: ${IMAGE_NAME}:${NEW_TAG}|" "$COMPOSE_FILE"
  341. check_status "修改 docker-compose.yml"
  342. # 验证修改结果
  343. MATCH_LINE=$(grep "image: ${IMAGE_NAME}:" "$COMPOSE_FILE")
  344. log_info "配置文件已更新: $MATCH_LINE"
  345. # ================= 步骤 7: 启动容器 =================
  346. log_info "步骤 7: 启动 Docker Compose..."
  347. docker compose up -d
  348. check_status "启动容器"
  349. # ================= 步骤 8: 显示当前保留的镜像 =================
  350. log_info "步骤 8: 当前保留的镜像版本列表:"
  351. docker images --filter "reference=${IMAGE_NAME}:*" --format "table {{.Tag}}\t{{.ID}}\t{{.Size}}\t{{.CreatedAt}}"
  352. log_info "===================================================="
  353. log_info " 开发版部署成功!"
  354. log_info " 当前运行端口: 8002"
  355. log_info " 部署版本: $NEW_TAG"
  356. log_info " 保留镜像: 最新版本 + 前一个版本"
  357. log_info "===================================================="