5 місяців тому · 3a3a3505a4
--- a/build_graph_app.png
+++ b/build_graph_app.png
--- a/config/config.ini
+++ b/config/config.ini
@@ -43,4 +43,4 @@ CONSOLE_OUTPUT=True
 
				 
			
 
				 
			
 
				 [user_lists]
			
 
				-USERS=['user-001']
			
 
				+USERS=['user-001']
			
--- a/core/base/progress_manager.py
+++ b/core/base/progress_manager.py
@@ -0,0 +1,125 @@
 
				+"""
			
 
				+任务进度管理器
			
 
				+负责任务进度的存储、更新和查询
			
 
				+"""
			
 
				+
			
 
				+import json
			
 
				+from typing import Dict, Any, Optional
			
 
				+from datetime import datetime
			
 
				+
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+
			
 
				+class ProgressManager:
			
 
				+    """任务进度管理器"""
			
 
				+
			
 
				+    def __init__(self):
			
 
				+        self.progress_data = {}  # 简化：使用内存存储
			
 
				+
			
 
				+    async def initialize_progress(self, callback_task_id: str, user_id: str, stages: list):
			
 
				+        """初始化进度记录"""
			
 
				+        try:
			
 
				+            self.progress_data[callback_task_id] = {
			
 
				+                "user_id": user_id,
			
 
				+                "overall_progress": 0,
			
 
				+                "current_stage": stages[0]["stage_name"] if stages else "",
			
 
				+                "stages": stages,
			
 
				+                "updated_at": datetime.now()
			
 
				+            }
			
 
				+            logger.info(f"初始化任务进度: {callback_task_id}")
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"初始化进度失败: {str(e)}")
			
 
				+            raise
			
 
				+
			
 
				+    async def update_stage_progress(self, callback_task_id: str, stage_name: str,
			
 
				+                                  progress: int, status: str, message: str = "",
			
 
				+                                  sub_progress: int = 0):
			
 
				+        """更新阶段进度"""
			
 
				+        try:
			
 
				+            if callback_task_id not in self.progress_data:
			
 
				+                logger.warning(f"任务进度不存在: {callback_task_id}")
			
 
				+                return
			
 
				+
			
 
				+            task_progress = self.progress_data[callback_task_id]
			
 
				+
			
 
				+            # 更新阶段进度
			
 
				+            for stage in task_progress["stages"]:
			
 
				+                if stage["stage_name"] == stage_name:
			
 
				+                    stage["progress"] = progress
			
 
				+                    stage["stage_status"] = status
			
 
				+                    stage["message"] = message
			
 
				+                    stage["sub_progress"] = sub_progress
			
 
				+                    break
			
 
				+
			
 
				+            # 更新当前阶段和整体进度
			
 
				+            task_progress["current_stage"] = stage_name
			
 
				+            task_progress["overall_progress"] = self._calculate_overall_progress(task_progress["stages"])
			
 
				+            task_progress["updated_at"] = datetime.now()
			
 
				+
			
 
				+            logger.debug(f"更新进度: {callback_task_id}, 阶段: {stage_name}, 进度: {progress}%")
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"更新阶段进度失败: {str(e)}")
			
 
				+            raise
			
 
				+
			
 
				+    async def get_progress(self, callback_task_id: str) -> Optional[Dict[str, Any]]:
			
 
				+        """获取任务进度"""
			
 
				+        try:
			
 
				+            if callback_task_id not in self.progress_data:
			
 
				+                return None
			
 
				+
			
 
				+            task_progress = self.progress_data[callback_task_id]
			
 
				+
			
 
				+            # 计算整体状态
			
 
				+            if any(stage["stage_status"] == "failed" for stage in task_progress["stages"]):
			
 
				+                review_task_status = "failed"
			
 
				+            elif all(stage["stage_status"] == "completed" for stage in task_progress["stages"]):
			
 
				+                review_task_status = "completed"
			
 
				+            elif any(stage["stage_status"] == "processing" for stage in task_progress["stages"]):
			
 
				+                review_task_status = "processing"
			
 
				+            else:
			
 
				+                review_task_status = "pending"
			
 
				+
			
 
				+            return {
			
 
				+                "callback_task_id": callback_task_id,
			
 
				+                "user_id": task_progress["user_id"],
			
 
				+                "review_task_status": review_task_status,
			
 
				+                "overall_progress": task_progress["overall_progress"],
			
 
				+                "stages": task_progress["stages"],
			
 
				+                "updated_at": int(task_progress["updated_at"].timestamp()),
			
 
				+                "estimated_remaining": 600
			
 
				+            }
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"获取进度失败: {str(e)}")
			
 
				+            return None
			
 
				+
			
 
				+    async def complete_task(self, callback_task_id: str, result: Dict[str, Any]):
			
 
				+        """标记任务完成"""
			
 
				+        try:
			
 
				+            if callback_task_id in self.progress_data:
			
 
				+                task_progress = self.progress_data[callback_task_id]
			
 
				+
			
 
				+                # 完成最后一个阶段
			
 
				+                if task_progress["stages"]:
			
 
				+                    task_progress["stages"][-1]["stage_status"] = "completed"
			
 
				+                    task_progress["stages"][-1]["progress"] = 100
			
 
				+
			
 
				+                task_progress["overall_progress"] = 100
			
 
				+                task_progress["updated_at"] = datetime.now()
			
 
				+
			
 
				+                # 保存结果
			
 
				+                task_progress["result"] = result
			
 
				+
			
 
				+            logger.info(f"任务完成: {callback_task_id}")
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"标记任务完成失败: {str(e)}")
			
 
				+            raise
			
 
				+
			
 
				+    def _calculate_overall_progress(self, stages: list) -> int:
			
 
				+        """计算整体进度"""
			
 
				+        if not stages:
			
 
				+            return 0
			
 
				+        total_progress = sum(stage["progress"] for stage in stages)
			
 
				+        return int(total_progress / len(stages))
			
--- a/core/base/redis_duplicate_checker.py
+++ b/core/base/redis_duplicate_checker.py
@@ -0,0 +1,161 @@
 
				+"""
			
 
				+基于Redis的重复任务检查器
			
 
				+支持多进程间的重复任务检查
			
 
				+"""
			
 
				+
			
 
				+import os
			
 
				+import json
			
 
				+from datetime import datetime, timedelta
			
 
				+import redis
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+
			
 
				+
			
 
				+class RedisDuplicateChecker:
			
 
				+    """基于Redis的重复任务检查器"""
			
 
				+
			
 
				+    def __init__(self):
			
 
				+        try:
			
 
				+            # 从配置文件读取Redis连接信息
			
 
				+            from foundation.base.config import config_handler
			
 
				+            redis_host = config_handler.get('redis', 'REDIS_HOST', 'localhost')
			
 
				+            redis_port = config_handler.get('redis', 'REDIS_PORT', '6379')
			
 
				+            redis_password = config_handler.get('redis', 'REDIS_PASSWORD', '')
			
 
				+
			
 
				+            # 构建Redis连接URL
			
 
				+            if redis_password:
			
 
				+                redis_url = f"redis://:{redis_password}@{redis_host}:{redis_port}/2"
			
 
				+            else:
			
 
				+                redis_url = f"redis://{redis_host}:{redis_port}/2"
			
 
				+
			
 
				+            logger.info(f"连接Redis: {redis_url}")
			
 
				+
			
 
				+            # 连接Redis
			
 
				+            self.redis_client = redis.from_url(redis_url, decode_responses=True)
			
 
				+
			
 
				+            # 测试连接
			
 
				+            self.redis_client.ping()
			
 
				+            logger.info("Redis重复检查器连接成功")
			
 
				+            self.use_redis = True
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"Redis连接失败，回退到内存模式: {str(e)}")
			
 
				+            # 回退到内存模式
			
 
				+            self.task_cache = {}
			
 
				+            self.use_redis = False
			
 
				+        else:
			
 
				+            self.use_redis = True
			
 
				+
			
 
				+    async def is_duplicate_task(self, file_id: str) -> bool:
			
 
				+        """检查是否为重复任务"""
			
 
				+        try:
			
 
				+            if self.use_redis:
			
 
				+                # 使用Redis检查
			
 
				+                task_info = self.redis_client.get(f"task:{file_id}")
			
 
				+                if task_info:
			
 
				+                    # 检查任务是否过期
			
 
				+                    task_data = json.loads(task_info)
			
 
				+                    created_at = datetime.fromisoformat(task_data['created_at'])
			
 
				+
			
 
				+                    if datetime.now() - created_at < timedelta(minutes=2):
			
 
				+                        logger.info(f"发现重复任务: {file_id}")
			
 
				+                        return True
			
 
				+                    else:
			
 
				+                        # 任务已过期，清理
			
 
				+                        self.redis_client.delete(f"task:{file_id}")
			
 
				+                        return False
			
 
				+                return False
			
 
				+            else:
			
 
				+                # 回退到内存模式
			
 
				+                if file_id in self.task_cache:
			
 
				+                    logger.info(f"发现重复任务: {file_id}")
			
 
				+                    return True
			
 
				+                return False
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"检查重复任务失败: {str(e)}")
			
 
				+            return False
			
 
				+
			
 
				+    async def register_task(self, file_info: dict, callback_task_id: str):
			
 
				+        """注册任务"""
			
 
				+        try:
			
 
				+            # 过滤掉不可序列化的字段（如file_content等bytes数据）
			
 
				+            serializable_file_info = {
			
 
				+                k: v for k, v in file_info.items()
			
 
				+                if k not in ['file_content'] and not isinstance(v, bytes)
			
 
				+            }
			
 
				+
			
 
				+            task_data = {
			
 
				+                "callback_task_id": callback_task_id,
			
 
				+                "created_at": datetime.now().isoformat(),
			
 
				+                "file_info": serializable_file_info
			
 
				+            }
			
 
				+
			
 
				+            if self.use_redis:
			
 
				+                # 使用Redis存储，设置1小时过期
			
 
				+                self.redis_client.setex(
			
 
				+                    f"task:{file_info['file_id']}",
			
 
				+                    3600,  # 1小时
			
 
				+                    json.dumps(task_data, ensure_ascii=False)
			
 
				+                )
			
 
				+            else:
			
 
				+                # 回退到内存模式
			
 
				+                self.task_cache[file_info['file_id']] = task_data
			
 
				+
			
 
				+            logger.info(f"注册任务: {file_info['file_id']} -> {callback_task_id}")
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"注册任务失败: {str(e)}")
			
 
				+            raise
			
 
				+
			
 
				+    async def unregister_task(self, file_id: str):
			
 
				+        """取消注册任务"""
			
 
				+        try:
			
 
				+            if self.use_redis:
			
 
				+                self.redis_client.delete(f"task:{file_id}")
			
 
				+            else:
			
 
				+                if file_id in self.task_cache:
			
 
				+                    del self.task_cache[file_id]
			
 
				+
			
 
				+            logger.info(f"取消注册任务: {file_id}")
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"取消注册任务失败: {str(e)}")
			
 
				+
			
 
				+    async def get_task_info(self, file_id: str) -> str:
			
 
				+        """获取任务信息"""
			
 
				+        try:
			
 
				+            if self.use_redis:
			
 
				+                task_info = self.redis_client.get(f"task:{file_id}")
			
 
				+                if task_info:
			
 
				+                    task_data = json.loads(task_info)
			
 
				+                    return task_data.get("callback_task_id", "")
			
 
				+                return ""
			
 
				+            else:
			
 
				+                if file_id in self.task_cache:
			
 
				+                    return self.task_cache[file_id].get("callback_task_id", "")
			
 
				+                return ""
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"获取任务信息失败: {str(e)}")
			
 
				+            return ""
			
 
				+
			
 
				+    def cleanup_expired_cache(self):
			
 
				+        """清理过期缓存（Redis自动处理）"""
			
 
				+        try:
			
 
				+            if not self.use_redis:
			
 
				+                current_time = datetime.now()
			
 
				+                expired_files = []
			
 
				+
			
 
				+                for file_id, task_info in list(self.task_cache.items()):
			
 
				+                    created_at = datetime.fromisoformat(task_info['created_at'])
			
 
				+                    if current_time - created_at > timedelta(hours=1):
			
 
				+                        expired_files.append(file_id)
			
 
				+
			
 
				+                for file_id in expired_files:
			
 
				+                    del self.task_cache[file_id]
			
 
				+
			
 
				+                if expired_files:
			
 
				+                    logger.info(f"清理过期缓存: {len(expired_files)} 个文件")
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"清理过期缓存失败: {str(e)}")
			
--- a/core/base/workflow_manager.py
+++ b/core/base/workflow_manager.py
@@ -0,0 +1,288 @@
 
				+"""
			
 
				+基于LangGraph的工作流管理器
			
 
				+负责任务的创建、编排和执行，使用LangGraph进行状态管理
			
 
				+"""
			
 
				+
			
 
				+import asyncio
			
 
				+import uuid
			
 
				+from typing import Dict, Optional, TypedDict, Annotated, List
			
 
				+from datetime import datetime
			
 
				+from dataclasses import dataclass
			
 
				+
			
 
				+from langgraph.graph import StateGraph, END
			
 
				+from langgraph.graph.message import add_messages
			
 
				+from langchain_core.messages import BaseMessage, HumanMessage, AIMessage
			
 
				+
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+from foundation.utils.time_statistics import track_execution_time
			
 
				+from .progress_manager import ProgressManager
			
 
				+from .redis_duplicate_checker import RedisDuplicateChecker
			
 
				+from ..construction_review.workflows import DocumentWorkflow,AIReviewWorkflow,ReportWorkflow
			
 
				+
			
 
				+@dataclass
			
 
				+class TaskChain:
			
 
				+    """任务链"""
			
 
				+    callback_task_id: str
			
 
				+    file_id: str
			
 
				+    user_id: str
			
 
				+    status: str  # processing, completed, failed
			
 
				+    current_stage: str
			
 
				+    created_at: datetime
			
 
				+    started_at: Optional[datetime] = None
			
 
				+    completed_at: Optional[datetime] = None
			
 
				+    results: Dict = None
			
 
				+
			
 
				+    def __post_init__(self):
			
 
				+        if self.results is None:
			
 
				+            self.results = {}
			
 
				+
			
 
				+class WorkflowManager:
			
 
				+    """工作流管理器"""
			
 
				+
			
 
				+    def __init__(self, max_concurrent_docs: int = 5, max_concurrent_reviews: int = 10):
			
 
				+        self.max_concurrent_docs = max_concurrent_docs
			
 
				+        self.max_concurrent_reviews = max_concurrent_reviews
			
 
				+
			
 
				+        # 并发控制
			
 
				+        self.doc_semaphore = asyncio.Semaphore(max_concurrent_docs)
			
 
				+        self.review_semaphore = asyncio.Semaphore(max_concurrent_reviews)
			
 
				+
			
 
				+        # 服务组件
			
 
				+        self.progress_manager = ProgressManager()
			
 
				+        self.redis_duplicate_checker = RedisDuplicateChecker()
			
 
				+
			
 
				+        # 活跃任务跟踪
			
 
				+        self.active_chains: Dict[str, TaskChain] = {}
			
 
				+        self._cleanup_task_started = False
			
 
				+
			
 
				+    async def submit_task_processing(self, file_info: dict) -> str:
			
 
				+        """异步提交任务处理（用于file_upload层）"""
			
 
				+        from foundation.base.tasks import submit_task_processing_task
			
 
				+
			
 
				+        try:
			
 
				+            logger.info(f"提交文档处理任务到Celery: {file_info['file_id']}")
			
 
				+
			
 
				+            # 提交到Celery队列
			
 
				+            task = submit_task_processing_task.delay(file_info)
			
 
				+
			
 
				+            logger.info(f"Celery任务已提交，Task ID: {task.id}")
			
 
				+            return task.id
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"提交Celery任务失败: {str(e)}")
			
 
				+            raise
			
 
				+    @track_execution_time   
			
 
				+    def submit_task_processing_sync(self, file_info: dict) -> dict:
			
 
				+        """同步提交任务处理（用于Celery worker）"""
			
 
				+        try:
			
 
				+
			
 
				+
			
 
				+            logger.info(f"提交文档处理任务: {file_info['file_id']}")
			
 
				+
			
 
				+            # 1. 生成任务链ID
			
 
				+            callback_task_id = file_info['callback_task_id']
			
 
				+
			
 
				+            # 2. 创建任务链
			
 
				+            task_chain = TaskChain(
			
 
				+                callback_task_id=callback_task_id,
			
 
				+                file_id=file_info['file_id'],
			
 
				+                user_id=file_info['user_id'],
			
 
				+                status="processing",
			
 
				+                current_stage="document_processing",
			
 
				+                created_at=datetime.now()
			
 
				+            )
			
 
				+
			
 
				+            # 4. 注册任务
			
 
				+            asyncio.run(self.redis_duplicate_checker.register_task(file_info, callback_task_id))
			
 
				+            self.active_chains[callback_task_id] = task_chain
			
 
				+
			
 
				+            # 5. 初始化进度
			
 
				+            asyncio.run(self.progress_manager.initialize_progress(
			
 
				+                callback_task_id=callback_task_id,
			
 
				+                user_id=file_info['user_id'],
			
 
				+                stages=[
			
 
				+                    {"stage_name": "文件上传", "progress": 100, "status": "completed"},
			
 
				+                    {"stage_name": "文档处理", "progress": 0, "status": "pending"},
			
 
				+                    {"stage_name": "AI审查", "progress": 0, "status": "pending"},
			
 
				+                    {"stage_name": "报告生成", "progress": 0, "status": "pending"}
			
 
				+                ]
			
 
				+            ))
			
 
				+
			
 
				+            # 6. 启动处理流程（同步执行）
			
 
				+            self._process_task_chain_sync(task_chain, file_info['file_content'], file_info['file_type'])
			
 
				+            # logger.info(f"提交文档处理任务: {callback_task_id}")
			
 
				+            logger.info(f"施工方案审查任务已完成！ ")
			
 
				+            logger.info(f"文件ID: {file_info['file_id']}")
			
 
				+            logger.info(f"文件名：{file_info['file_name']}")
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"提交文档处理任务失败: {str(e)}")
			
 
				+            raise
			
 
				+    
			
 
				+
			
 
				+    async def _process_task_chain(self, task_chain: TaskChain, file_content: bytes, file_type: str):
			
 
				+        """处理文档任务链 - 串行执行，内部并发"""
			
 
				+        try:
			
 
				+            task_chain.started_at = datetime.now()
			
 
				+
			
 
				+            # 阶段1：文档处理（串行）
			
 
				+            async with self.doc_semaphore:
			
 
				+                task_chain.current_stage = "document_processing"
			
 
				+
			
 
				+                document_workflow = DocumentWorkflow(
			
 
				+                    file_id=task_chain.file_id,
			
 
				+                    callback_task_id=task_chain.callback_task_id,
			
 
				+                    user_id=task_chain.user_id,
			
 
				+                    progress_manager=self.progress_manager,
			
 
				+                    redis_duplicate_checker=self.redis_duplicate_checker
			
 
				+                )
			
 
				+
			
 
				+                doc_result = await document_workflow.execute(file_content, file_type)
			
 
				+                task_chain.results['document'] = doc_result
			
 
				+
			
 
				+            # 阶段2：AI审查（内部并发）
			
 
				+            task_chain.current_stage = "ai_review"
			
 
				+
			
 
				+            structured_content = doc_result['structured_content']
			
 
				+
			
 
				+            ai_workflow = AIReviewWorkflow(
			
 
				+                file_id=task_chain.file_id,
			
 
				+                callback_task_id=task_chain.callback_task_id,
			
 
				+                user_id=task_chain.user_id,
			
 
				+                structured_content=structured_content,
			
 
				+                progress_manager=self.progress_manager
			
 
				+            )
			
 
				+
			
 
				+            ai_result = await ai_workflow.execute()
			
 
				+            task_chain.results['ai_review'] = ai_result
			
 
				+
			
 
				+            # 阶段3：报告生成（串行）
			
 
				+            task_chain.current_stage = "report_generation"
			
 
				+
			
 
				+            report_workflow = ReportWorkflow(
			
 
				+                file_id=task_chain.file_id,
			
 
				+                callback_task_id=task_chain.callback_task_id,
			
 
				+                user_id=task_chain.user_id,
			
 
				+                ai_review_results=ai_result,
			
 
				+                progress_manager=self.progress_manager
			
 
				+            )
			
 
				+
			
 
				+            report_result = await report_workflow.execute()
			
 
				+            task_chain.results['report'] = report_result
			
 
				+
			
 
				+            # 完成任务链
			
 
				+            task_chain.status = "completed"
			
 
				+            task_chain.completed_at = datetime.now()
			
 
				+
			
 
				+            # 清理任务注册
			
 
				+            await self.redis_duplicate_checker.unregister_task(task_chain.file_id)
			
 
				+
			
 
				+            logger.info(f"文档处理任务链完成: {task_chain.callback_task_id}")
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            task_chain.status = "failed"
			
 
				+            logger.error(f"文档处理任务链失败: {task_chain.callback_task_id}, 错误: {str(e)}")
			
 
				+
			
 
				+            # 清理任务注册
			
 
				+            await self.redis_duplicate_checker.unregister_task(task_chain.file_id)
			
 
				+
			
 
				+            raise
			
 
				+        finally:
			
 
				+            # 清理活跃任务
			
 
				+            if task_chain.callback_task_id in self.active_chains:
			
 
				+                del self.active_chains[task_chain.callback_task_id]
			
 
				+
			
 
				+
			
 
				+
			
 
				+    def _process_task_chain_sync(self, task_chain: TaskChain, file_content: bytes, file_type: str):
			
 
				+        """同步处理文档任务链（用于Celery worker）"""
			
 
				+        try:
			
 
				+            task_chain.started_at = datetime.now()
			
 
				+
			
 
				+            # 阶段1：文档处理（串行）
			
 
				+            task_chain.current_stage = "document_processing"
			
 
				+
			
 
				+            document_workflow = DocumentWorkflow(
			
 
				+                file_id=task_chain.file_id,
			
 
				+                callback_task_id=task_chain.callback_task_id,
			
 
				+                user_id=task_chain.user_id,
			
 
				+                progress_manager=self.progress_manager,
			
 
				+                redis_duplicate_checker=self.redis_duplicate_checker
			
 
				+            )
			
 
				+
			
 
				+            # 同步执行文档处理
			
 
				+            loop = asyncio.new_event_loop()
			
 
				+            asyncio.set_event_loop(loop)
			
 
				+            doc_result = loop.run_until_complete(document_workflow.execute(file_content, file_type))
			
 
				+            loop.close()
			
 
				+
			
 
				+            task_chain.results['document'] = doc_result
			
 
				+
			
 
				+            # 阶段2：AI审查（内部并发）
			
 
				+            task_chain.current_stage = "ai_review"
			
 
				+
			
 
				+            structured_content = doc_result['structured_content']
			
 
				+
			
 
				+            ai_workflow = AIReviewWorkflow(
			
 
				+                file_id=task_chain.file_id,
			
 
				+                callback_task_id=task_chain.callback_task_id,
			
 
				+                user_id=task_chain.user_id,
			
 
				+                structured_content=structured_content,
			
 
				+                progress_manager=self.progress_manager
			
 
				+            )
			
 
				+
			
 
				+            # 同步执行AI审查
			
 
				+            loop = asyncio.new_event_loop()
			
 
				+            asyncio.set_event_loop(loop)
			
 
				+            ai_result = loop.run_until_complete(ai_workflow.execute())
			
 
				+            loop.close()
			
 
				+
			
 
				+            task_chain.results['ai_review'] = ai_result
			
 
				+
			
 
				+            # 阶段3：报告生成（串行）
			
 
				+            task_chain.current_stage = "report_generation"
			
 
				+
			
 
				+            report_workflow = ReportWorkflow(
			
 
				+                file_id=task_chain.file_id,
			
 
				+                callback_task_id=task_chain.callback_task_id,
			
 
				+                user_id=task_chain.user_id,
			
 
				+                ai_review_results=ai_result,
			
 
				+                progress_manager=self.progress_manager
			
 
				+            )
			
 
				+
			
 
				+            # 同步执行报告生成
			
 
				+            loop = asyncio.new_event_loop()
			
 
				+            asyncio.set_event_loop(loop)
			
 
				+            report_result = loop.run_until_complete(report_workflow.execute())
			
 
				+            loop.close()
			
 
				+
			
 
				+            task_chain.results['report'] = report_result
			
 
				+
			
 
				+            # 完成任务链
			
 
				+            task_chain.status = "completed"
			
 
				+            task_chain.completed_at = datetime.now()
			
 
				+
			
 
				+            # 清理任务注册
			
 
				+            asyncio.run(self.redis_duplicate_checker.unregister_task(task_chain.file_id))
			
 
				+
			
 
				+            logger.info(f"文档处理任务链完成: {task_chain.callback_task_id}")
			
 
				+            return task_chain.results
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            task_chain.status = "failed"
			
 
				+            logger.error(f"文档处理任务链失败: {task_chain.callback_task_id}, 错误: {str(e)}")
			
 
				+
			
 
				+            # 清理任务注册
			
 
				+            asyncio.run(self.redis_duplicate_checker.unregister_task(task_chain.file_id))
			
 
				+
			
 
				+            raise
			
 
				+        finally:
			
 
				+            # 清理活跃任务
			
 
				+            if task_chain.callback_task_id in self.active_chains:
			
 
				+                del self.active_chains[task_chain.callback_task_id]
			
 
				+
			
 
				+
			
 
				+
			
 
				+    async def update_task_status(self, callback_task_id: str) -> Optional[Dict]:
			
 
				+        """更新任务状态"""
			
 
				+        pass
			
--- a/core/construction_review/component/__init__.py
+++ b/core/construction_review/component/__init__.py
@@ -0,0 +1,14 @@
 
				+"""
			
 
				+施工方案审查核心组件模块
			
 
				+负责文档处理、AI审查和报告生成的核心业务逻辑
			
 
				+"""
			
 
				+
			
 
				+from .document_processor import DocumentProcessor
			
 
				+from .ai_review_engine import AIReviewEngine
			
 
				+from .report_generator import ReportGenerator
			
 
				+
			
 
				+__all__ = [
			
 
				+    'DocumentProcessor',
			
 
				+    'AIReviewEngine',
			
 
				+    'ReportGenerator'
			
 
				+]
			
--- a/core/construction_review/component/ai_review_engine.py
+++ b/core/construction_review/component/ai_review_engine.py
@@ -0,0 +1,178 @@
 
				+"""
			
 
				+AI审查引擎
			
 
				+负责执行AI审查，支持审查条目并发处理
			
 
				+"""
			
 
				+
			
 
				+import asyncio
			
 
				+import time
			
 
				+from typing import Dict, List, Any, Optional, Callable
			
 
				+from dataclasses import dataclass
			
 
				+from datetime import datetime
			
 
				+
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+
			
 
				+@dataclass
			
 
				+class ReviewResult:
			
 
				+    """审查结果"""
			
 
				+    unit_index: int
			
 
				+    unit_content: Dict[str, Any]
			
 
				+    basic_compliance: Dict[str, Any]
			
 
				+    technical_compliance: Dict[str, Any]
			
 
				+    rag_enhanced: Dict[str, Any]
			
 
				+    overall_risk: str
			
 
				+
			
 
				+class AIReviewEngine:
			
 
				+    """AI审查引擎 - 支持审查条目并发"""
			
 
				+
			
 
				+    def __init__(self, max_concurrent_reviews: int = 20):
			
 
				+        self.max_concurrent_reviews = max_concurrent_reviews
			
 
				+        self.semaphore = asyncio.Semaphore(max_concurrent_reviews)
			
 
				+
			
 
				+    
			
 
				+    async def basic_compliance_check(self, unit_content: Dict[str, Any]) -> Dict[str, Any]:
			
 
				+        """基础合规性检查"""
			
 
				+        # 词句语法检查
			
 
				+        grammar_result = await self.check_grammar(unit_content['content'])
			
 
				+
			
 
				+        # 语义逻辑检查
			
 
				+        semantic_result = await self.check_semantic_logic(unit_content['content'])
			
 
				+
			
 
				+        # 条文完整性检查
			
 
				+        completeness_result = await self.check_completeness(unit_content['content'])
			
 
				+
			
 
				+        return {
			
 
				+            'grammar_check': grammar_result,
			
 
				+            'semantic_check': semantic_result,
			
 
				+            'completeness_check': completeness_result,
			
 
				+            'overall_score': self._calculate_basic_score(grammar_result, semantic_result, completeness_result)
			
 
				+        }
			
 
				+
			
 
				+    async def technical_compliance_check(self, unit_content: Dict[str, Any]) -> Dict[str, Any]:
			
 
				+        """技术性合规检查"""
			
 
				+        # 强制性标准符合性检查
			
 
				+        mandatory_result = await self.check_mandatory_standards(unit_content['content'])
			
 
				+
			
 
				+        # 设计值符合性检查
			
 
				+        design_value_result = await self.check_design_values(unit_content['content'])
			
 
				+
			
 
				+        # 技术参数精确检查
			
 
				+        technical_param_result = await self.check_technical_parameters(unit_content['content'])
			
 
				+
			
 
				+        return {
			
 
				+            'mandatory_standards': mandatory_result,
			
 
				+            'design_values': design_value_result,
			
 
				+            'technical_parameters': technical_param_result,
			
 
				+            'overall_score': self._calculate_technical_score(mandatory_result, design_value_result, technical_param_result)
			
 
				+        }
			
 
				+
			
 
				+    async def rag_enhanced_check(self, unit_content: Dict[str, Any]) -> Dict[str, Any]:
			
 
				+        """RAG增强审查"""
			
 
				+        # 向量检索
			
 
				+        vector_results = await self.vector_search(unit_content['content'])
			
 
				+
			
 
				+        # 混合检索
			
 
				+        hybrid_results = await self.hybrid_search(unit_content['content'])
			
 
				+
			
 
				+        # 重排序
			
 
				+        reranked_results = await self.rerank_results(unit_content['content'], hybrid_results)
			
 
				+
			
 
				+        return {
			
 
				+            'vector_search': vector_results,
			
 
				+            'hybrid_search': hybrid_results,
			
 
				+            'reranked_results': reranked_results,
			
 
				+            'enhanced_suggestions': self.generate_enhanced_suggestions(reranked_results)
			
 
				+        }
			
 
				+
			
 
				+    # 基础合规性审查 - 原子化组件方法
			
 
				+    async def check_grammar(self, content: str) -> Dict[str, Any]:
			
 
				+        """语法检查"""
			
 
				+        await asyncio.sleep(0.1)  # 模拟处理时间
			
 
				+        return {"score": 85, "issues": []}
			
 
				+
			
 
				+    async def check_semantic_logic(self, content: str) -> Dict[str, Any]:
			
 
				+        """语义逻辑检查"""
			
 
				+        logger.info(f"开始执行语法检查，内容：{content}")
			
 
				+        await asyncio.sleep(0.1)
			
 
				+        return {"score": 90, "logic_issues": []}
			
 
				+
			
 
				+    async def check_completeness(self, content: str) -> Dict[str, Any]:
			
 
				+        """完整性检查"""
			
 
				+        logger.info(f"开始执行完整性检查，内容：{content}")
			
 
				+        await asyncio.sleep(0.1)
			
 
				+        return {"score": 88, "missing_items": []}
			
 
				+
			
 
				+    async def check_mandatory_standards(self, content: str) -> Dict[str, Any]:
			
 
				+        """强制性标准检查"""
			
 
				+        logger.info(f"开始执行强制性标准检查，内容：{content}")
			
 
				+        await asyncio.sleep(0.3)
			
 
				+        return {"compliance_rate": 92, "violations": []}
			
 
				+
			
 
				+    async def check_design_values(self, content: str) -> Dict[str, Any]:
			
 
				+        """设计值检查"""
			
 
				+        await asyncio.sleep(0.2)
			
 
				+        return {"accuracy": 87, "deviations": []}
			
 
				+
			
 
				+    async def check_technical_parameters(self, content: str) -> Dict[str, Any]:
			
 
				+        """技术参数检查"""
			
 
				+        await asyncio.sleep(0.2)
			
 
				+        return {"precision": 90, "errors": []}
			
 
				+
			
 
				+    # RAG检索增强 - 原子化组件方法
			
 
				+    async def vector_search(self, content: str) -> List[Dict[str, Any]]:
			
 
				+        """向量检索"""
			
 
				+        await asyncio.sleep(0.1)
			
 
				+        return [{"similarity": 0.85, "content": "相关标准1"}, {"similarity": 0.78, "content": "相关标准2"}]
			
 
				+
			
 
				+    async def hybrid_search(self, content: str) -> List[Dict[str, Any]]:
			
 
				+        """混合检索"""
			
 
				+        await asyncio.sleep(0.2)
			
 
				+        return [{"score": 0.88, "content": "混合检索结果1"}, {"score": 0.82, "content": "混合检索结果2"}]
			
 
				+
			
 
				+    async def rerank_results(self, content: str, results: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
			
 
				+        """重排序"""
			
 
				+        await asyncio.sleep(0.1)
			
 
				+        return sorted(results, key=lambda x: x.get('score', 0), reverse=True)[:5]
			
 
				+
			
 
				+    def generate_enhanced_suggestions(self, results: List[Dict[str, Any]]) -> List[str]:
			
 
				+        """生成增强建议"""
			
 
				+        suggestions = []
			
 
				+        for result in results:
			
 
				+            suggestions.append(f"基于{result.get('content', '相关内容')}的建议")
			
 
				+        return suggestions
			
 
				+
			
 
				+    def _calculate_basic_score(self, grammar: Dict, semantic: Dict, completeness: Dict) -> float:
			
 
				+        """计算基础合规性得分"""
			
 
				+        return (grammar.get('score', 0) + semantic.get('score', 0) + completeness.get('score', 0)) / 3
			
 
				+
			
 
				+    def _calculate_technical_score(self, mandatory: Dict, design: Dict, technical: Dict) -> float:
			
 
				+        """计算技术合规性得分"""
			
 
				+        return (mandatory.get('compliance_rate', 0) + design.get('accuracy', 0) + technical.get('precision', 0)) / 3
			
 
				+
			
 
				+    def _calculate_overall_risk(self, basic: Dict, technical: Dict, rag: Dict) -> str:
			
 
				+        """计算总体风险等级"""
			
 
				+        basic_score = basic.get('overall_score', 0)
			
 
				+        technical_score = technical.get('overall_score', 0)
			
 
				+
			
 
				+        avg_score = (basic_score + technical_score) / 2
			
 
				+
			
 
				+        if avg_score >= 90:
			
 
				+            return "low"
			
 
				+        elif avg_score >= 70:
			
 
				+            return "medium"
			
 
				+        else:
			
 
				+            return "high"
			
 
				+
			
 
				+    def _aggregate_results(self, results: List[ReviewResult]) -> Dict[str, Any]:
			
 
				+        """汇总审查结果"""
			
 
				+        risk_counts = {"high": 0, "medium": 0, "low": 0}
			
 
				+
			
 
				+        for result in results:
			
 
				+            risk_counts[result.overall_risk] += 1
			
 
				+
			
 
				+        return {
			
 
				+            "risk_distribution": risk_counts,
			
 
				+            "total_issues": len([r for r in results if r.overall_risk != "low"]),
			
 
				+            "high_risk_count": risk_counts["high"],
			
 
				+            "medium_risk_count": risk_counts["medium"],
			
 
				+            "low_risk_count": risk_counts["low"]
			
 
				+        }
			
--- a/core/construction_review/component/document_processor.py
+++ b/core/construction_review/component/document_processor.py
@@ -0,0 +1,173 @@
 
				+"""
			
 
				+文档处理器
			
 
				+负责文档解析、内容提取和结构化处理
			
 
				+"""
			
 
				+
			
 
				+import io   
			
 
				+from docx import Document
			
 
				+from typing import Dict, Any, Optional, Callable
			
 
				+from datetime import datetime
			
 
				+
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+
			
 
				+from langchain_community.document_loaders import PyPDFLoader
			
 
				+from langchain.text_splitter import RecursiveCharacterTextSplitter
			
 
				+
			
 
				+class DocumentProcessor:
			
 
				+    """文档处理器"""
			
 
				+
			
 
				+    def __init__(self):
			
 
				+        self.supported_types = ['pdf', 'docx']
			
 
				+
			
 
				+    async def process_document(self, file_content: bytes, file_type: str,
			
 
				+                             progress_callback: Optional[Callable[[int, str], None]] = None) -> Dict[str, Any]:
			
 
				+        """
			
 
				+        处理文档
			
 
				+
			
 
				+        Args:
			
 
				+            file_content: 文件内容
			
 
				+            file_type: 文件类型
			
 
				+            progress_callback: 进度回调函数
			
 
				+
			
 
				+        Returns:
			
 
				+            Dict: 解析结果
			
 
				+        """
			
 
				+        try:
			
 
				+            logger.info(f"开始处理文档，类型: {file_type}")
			
 
				+
			
 
				+            # 简化处理：直接解析
			
 
				+            if file_type.lower() == 'pdf':
			
 
				+                result = await self.parse_pdf_content(file_content)
			
 
				+            elif file_type.lower() == 'docx':
			
 
				+                result = await self.parse_docx_content(file_content)
			
 
				+            else:
			
 
				+                raise ValueError(f"不支持的文件类型: {file_type}")
			
 
				+
			
 
				+            # 结构化内容
			
 
				+            structured_result = self.structure_content(result)
			
 
				+
			
 
				+            if progress_callback:
			
 
				+                progress_callback(100, "文档处理完成")
			
 
				+
			
 
				+            return structured_result
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"文档处理失败: {str(e)}")
			
 
				+            raise
			
 
				+
			
 
				+    async def parse_pdf_content(self, file_content: bytes) -> Dict[str, Any]:
			
 
				+        """解析PDF内容"""
			
 
				+        try:
			
 
				+            # 保存到临时文件
			
 
				+            import tempfile
			
 
				+            with tempfile.NamedTemporaryFile(delete=False, suffix='.pdf') as temp_file:
			
 
				+                temp_file.write(file_content)
			
 
				+                temp_file_path = temp_file.name
			
 
				+
			
 
				+            # 使用PyPDFLoader解析
			
 
				+            loader = PyPDFLoader(temp_file_path)
			
 
				+            documents = loader.load()
			
 
				+
			
 
				+            # 文本分块
			
 
				+            text_splitter = RecursiveCharacterTextSplitter(
			
 
				+                chunk_size=1000,
			
 
				+                chunk_overlap=200,
			
 
				+                separators=["\n\n", "\n", " ", ""]
			
 
				+            )
			
 
				+            splits = text_splitter.split_documents(documents)
			
 
				+
			
 
				+            logger.info(f"PDF解析完成，分块数量: {len(splits)}")
			
 
				+
			
 
				+            return {
			
 
				+                'document_type': 'pdf',
			
 
				+                'total_pages': len(documents),
			
 
				+                'total_chunks': len(splits),
			
 
				+                'chunks': [
			
 
				+                    {
			
 
				+                        'page': doc.metadata.get('page', 0),
			
 
				+                        'content': doc.page_content,
			
 
				+                        'metadata': doc.metadata
			
 
				+                    }
			
 
				+                    for doc in documents
			
 
				+                ],
			
 
				+                'splits': [
			
 
				+                    {
			
 
				+                        'content': split.page_content,
			
 
				+                        'metadata': split.metadata
			
 
				+                    }
			
 
				+                    for split in splits
			
 
				+                ]
			
 
				+            }
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"PDF解析失败: {str(e)}")
			
 
				+            raise
			
 
				+
			
 
				+    async def parse_docx_content(self, file_content: bytes) -> Dict[str, Any]:
			
 
				+        """解析DOCX内容"""
			
 
				+        try:
			
 
				+            # 简化实现：直接返回文本内容
			
 
				+            # 实际实现中可以使用python-docx库
			
 
				+
			
 
				+
			
 
				+            doc = Document(io.BytesIO(file_content))
			
 
				+            full_text = '\n'.join([paragraph.text for paragraph in doc.paragraphs])
			
 
				+
			
 
				+            # 简单分块
			
 
				+            chunks = []
			
 
				+            chunk_size = 1000
			
 
				+            for i in range(0, len(full_text), chunk_size):
			
 
				+                chunk_text = full_text[i:i+chunk_size]
			
 
				+                chunks.append({
			
 
				+                    'chunk_id': f'chunk_{i+1}',
			
 
				+                    'content': chunk_text,
			
 
				+                    'metadata': {'chunk_index': i+1}
			
 
				+                })
			
 
				+
			
 
				+            logger.info(f"DOCX解析完成，分块数量: {len(chunks)}")
			
 
				+
			
 
				+            return {
			
 
				+                'document_type': 'docx',
			
 
				+                'total_chunks': len(chunks),
			
 
				+                'full_text': full_text,
			
 
				+                'chunks': chunks,
			
 
				+                'metadata': {
			
 
				+                    'paragraphs_count': len(doc.paragraphs),
			
 
				+                    'word_count': len(full_text.split())
			
 
				+                }
			
 
				+            }
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"DOCX解析失败: {str(e)}")
			
 
				+            raise
			
 
				+
			
 
				+    def structure_content(self, raw_content: Dict[str, Any]) -> Dict[str, Any]:
			
 
				+        """结构化处理"""
			
 
				+        try:
			
 
				+            if raw_content['document_type'] == 'pdf':
			
 
				+                # PDF结构化
			
 
				+                chunks = []
			
 
				+                for i, chunk in enumerate(raw_content['chunks']):
			
 
				+                    chunks.append({
			
 
				+                        'chunk_id': f'chunk_{i+1}',
			
 
				+                        'page': chunk['page'],
			
 
				+                        'content': chunk['content'],
			
 
				+                        'chapter': f'第{chunk["page"]}页',
			
 
				+                        'title': f'内容块{i+1}',
			
 
				+                        'original_content': chunk['content'][:100] + '...' if len(chunk['content']) > 100 else chunk['content']
			
 
				+                    })
			
 
				+            else:
			
 
				+                # DOCX结构化
			
 
				+                chunks = raw_content.get('chunks', [])
			
 
				+
			
 
				+            return {
			
 
				+                'document_name': f"施工方案文档_{raw_content.get('document_type', 'unknown')}",
			
 
				+                'document_type': raw_content['document_type'],
			
 
				+                'total_chunks': raw_content.get('total_chunks', 0),
			
 
				+                'chunks': chunks,
			
 
				+                'metadata': raw_content.get('metadata', {})
			
 
				+            }
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"内容结构化失败: {str(e)}")
			
 
				+            raise
			
--- a/core/construction_review/component/report_generator.py
+++ b/core/construction_review/component/report_generator.py
@@ -0,0 +1,292 @@
 
				+"""
			
 
				+报告生成器
			
 
				+负责生成审查报告和多维评分
			
 
				+"""
			
 
				+
			
 
				+import asyncio
			
 
				+from typing import Dict, List, Any, Optional, Callable
			
 
				+from dataclasses import dataclass
			
 
				+from datetime import datetime
			
 
				+import json
			
 
				+
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+
			
 
				+@dataclass
			
 
				+class DimensionScores:
			
 
				+    """四维评分"""
			
 
				+    safety: int      # 安全维度评分
			
 
				+    quality: int     # 质量维度评分
			
 
				+    schedule: int    # 进度维度评分
			
 
				+    cost: int        # 成本维度评分
			
 
				+
			
 
				+@dataclass
			
 
				+class FinalReport:
			
 
				+    """最终报告"""
			
 
				+    file_id: str
			
 
				+    document_name: str
			
 
				+    risk_stats: Dict[str, int]
			
 
				+    dimension_scores: DimensionScores
			
 
				+    summary_report: str
			
 
				+    multidimensional_report: str
			
 
				+    recommendations: List[str]
			
 
				+    generated_at: datetime
			
 
				+
			
 
				+class ReportGenerator:
			
 
				+    """报告生成器"""
			
 
				+
			
 
				+    def __init__(self):
			
 
				+        self.risk_weight_mapping = {
			
 
				+            "high": 3,
			
 
				+            "medium": 2,
			
 
				+            "low": 1
			
 
				+        }
			
 
				+
			
 
				+    async def generate_report(self, file_id: str, review_results: Dict[str, Any],
			
 
				+                            progress_callback: Optional[Callable[[int, str], None]] = None) -> FinalReport:
			
 
				+        """
			
 
				+        生成审查报告
			
 
				+
			
 
				+        Args:
			
 
				+            file_id: 文件ID
			
 
				+            review_results: AI审查结果
			
 
				+            progress_callback: 进度回调函数
			
 
				+
			
 
				+        Returns:
			
 
				+            FinalReport: 最终报告
			
 
				+        """
			
 
				+        try:
			
 
				+            logger.info(f"开始生成报告，文件ID: {file_id}")
			
 
				+
			
 
				+            if progress_callback:
			
 
				+                progress_callback(20, "汇总审查结果")
			
 
				+
			
 
				+            # 1. 数据汇总
			
 
				+            aggregated_data = await self._aggregate_results(review_results)
			
 
				+
			
 
				+            if progress_callback:
			
 
				+                progress_callback(40, "计算多维评分")
			
 
				+
			
 
				+            # 2. 计算四维评分
			
 
				+            dimension_scores = await self._calculate_dimension_scores(aggregated_data)
			
 
				+
			
 
				+            if progress_callback:
			
 
				+                progress_callback(60, "生成总结报告")
			
 
				+
			
 
				+            # 3. 生成总结报告
			
 
				+            summary_report = await self._generate_summary(aggregated_data, dimension_scores)
			
 
				+
			
 
				+            if progress_callback:
			
 
				+                progress_callback(80, "生成多维报告")
			
 
				+
			
 
				+            # 4. 生成多维报告
			
 
				+            multidimensional_report = await self._generate_multidimensional_report(
			
 
				+                aggregated_data, dimension_scores
			
 
				+            )
			
 
				+
			
 
				+            if progress_callback:
			
 
				+                progress_callback(100, "报告生成完成")
			
 
				+
			
 
				+            # 5. 生成建议
			
 
				+            recommendations = await self._generate_recommendations(aggregated_data, dimension_scores)
			
 
				+
			
 
				+            final_report = FinalReport(
			
 
				+                file_id=file_id,
			
 
				+                document_name=f"施工方案审查报告_{file_id}",
			
 
				+                risk_stats=aggregated_data.get('risk_distribution', {}),
			
 
				+                dimension_scores=dimension_scores,
			
 
				+                summary_report=summary_report,
			
 
				+                multidimensional_report=multidimensional_report,
			
 
				+                recommendations=recommendations,
			
 
				+                generated_at=datetime.now()
			
 
				+            )
			
 
				+
			
 
				+            logger.info(f"报告生成完成，文件ID: {file_id}")
			
 
				+            return final_report
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"报告生成失败: {str(e)}")
			
 
				+            raise
			
 
				+
			
 
				+    async def _aggregate_results(self, review_results: Dict[str, Any]) -> Dict[str, Any]:
			
 
				+        """汇总审查结果"""
			
 
				+        summary = review_results.get('summary', {})
			
 
				+        risk_stats = summary.get('risk_distribution', {})
			
 
				+
			
 
				+        # 按风险等级分类问题
			
 
				+        issues_by_risk = {
			
 
				+            "high": [],
			
 
				+            "medium": [],
			
 
				+            "low": []
			
 
				+        }
			
 
				+
			
 
				+        # 分析每个审查单元的问题
			
 
				+        for result in review_results.get('review_results', []):
			
 
				+            risk_level = result.overall_risk
			
 
				+            issues_by_risk[risk_level].append({
			
 
				+                'unit_index': result.unit_index,
			
 
				+                'chapter': result.unit_content.get('chapter', ''),
			
 
				+                'title': result.unit_content.get('title', ''),
			
 
				+                'content': result.unit_content.get('original_content', ''),
			
 
				+                'basic_issues': self._extract_issues(result.basic_compliance),
			
 
				+                'technical_issues': self._extract_issues(result.technical_compliance),
			
 
				+                'rag_suggestions': result.rag_enhanced.get('enhanced_suggestions', [])
			
 
				+            })
			
 
				+
			
 
				+        return {
			
 
				+            'risk_distribution': risk_stats,
			
 
				+            'issues_by_risk': issues_by_risk,
			
 
				+            'total_units': review_results.get('total_units', 0),
			
 
				+            'successful_units': review_results.get('successful_units', 0),
			
 
				+            'failed_units': review_results.get('failed_units', 0)
			
 
				+        }
			
 
				+
			
 
				+    async def _calculate_dimension_scores(self, aggregated_data: Dict[str, Any]) -> DimensionScores:
			
 
				+        """计算四维评分"""
			
 
				+        risk_stats = aggregated_data.get('risk_distribution', {})
			
 
				+        total_issues = risk_stats.get('high', 0) + risk_stats.get('medium', 0) + risk_stats.get('low', 0)
			
 
				+        total_units = aggregated_data.get('total_units', 1)
			
 
				+
			
 
				+        # 基础评分计算
			
 
				+        base_score = max(0, 100 - (risk_stats.get('high', 0) * 10) - (risk_stats.get('medium', 0) * 5) - (risk_stats.get('low', 0) * 2))
			
 
				+
			
 
				+        # 安全维度评分 (安全风险权重更高)
			
 
				+        safety_score = max(0, base_score - (risk_stats.get('high', 0) * 15) - (risk_stats.get('medium', 0) * 8))
			
 
				+
			
 
				+        # 质量维度评分
			
 
				+        quality_score = max(0, base_score - (risk_stats.get('high', 0) * 12) - (risk_stats.get('medium', 0) * 6))
			
 
				+
			
 
				+        # 进度维度评分
			
 
				+        schedule_score = max(0, base_score - (risk_stats.get('medium', 0) * 8) - (risk_stats.get('low', 0) * 3))
			
 
				+
			
 
				+        # 成本维度评分
			
 
				+        cost_score = max(0, base_score - (risk_stats.get('high', 0) * 10) - (risk_stats.get('medium', 0) * 5))
			
 
				+
			
 
				+        return DimensionScores(
			
 
				+            safety=min(100, safety_score),
			
 
				+            quality=min(100, quality_score),
			
 
				+            schedule=min(100, schedule_score),
			
 
				+            cost=min(100, cost_score)
			
 
				+        )
			
 
				+
			
 
				+    async def _generate_summary(self, aggregated_data: Dict[str, Any], dimension_scores: DimensionScores) -> str:
			
 
				+        """生成总结报告"""
			
 
				+        risk_stats = aggregated_data.get('risk_distribution', {})
			
 
				+        high_risk = risk_stats.get('high', 0)
			
 
				+        medium_risk = risk_stats.get('medium', 0)
			
 
				+        low_risk = risk_stats.get('low', 0)
			
 
				+        total_issues = high_risk + medium_risk + low_risk
			
 
				+
			
 
				+        # 生成总结报告
			
 
				+        summary_parts = []
			
 
				+
			
 
				+        # 整体评价
			
 
				+        if high_risk == 0 and medium_risk <= 2:
			
 
				+            summary_parts.append("该施工方案整体符合规范要求，质量良好。")
			
 
				+        elif high_risk <= 2:
			
 
				+            summary_parts.append("该施工方案基本符合规范要求，存在少量问题需要整改。")
			
 
				+        else:
			
 
				+            summary_parts.append("该施工方案存在较多高风险问题，需要重点整改。")
			
 
				+
			
 
				+        # 风险统计
			
 
				+        summary_parts.append(f"发现风险问题 {total_issues} 个，其中高风险 {high_risk} 个，中风险 {medium_risk} 个，低风险 {low_risk} 个。")
			
 
				+
			
 
				+        # 评分说明
			
 
				+        avg_score = (dimension_scores.safety + dimension_scores.quality +
			
 
				+                     dimension_scores.schedule + dimension_scores.cost) / 4
			
 
				+
			
 
				+        if avg_score >= 85:
			
 
				+            summary_parts.append(f"综合评分 {avg_score:.1f} 分，表现优秀。")
			
 
				+        elif avg_score >= 70:
			
 
				+            summary_parts.append(f"综合评分 {avg_score:.1f} 分，表现良好。")
			
 
				+        else:
			
 
				+            summary_parts.append(f"综合评分 {avg_score:.1f} 分，需要改进。")
			
 
				+
			
 
				+        return " ".join(summary_parts)
			
 
				+
			
 
				+    async def _generate_multidimensional_report(self, aggregated_data: Dict[str, Any],
			
 
				+                                              dimension_scores: DimensionScores) -> str:
			
 
				+        """生成多维报告"""
			
 
				+        report_parts = []
			
 
				+
			
 
				+        # 安全维度分析
			
 
				+        safety_desc = self._get_score_description(dimension_scores.safety, "安全")
			
 
				+        report_parts.append(f"安全维度评分 {dimension_scores.safety} 分：{safety_desc}")
			
 
				+
			
 
				+        # 质量维度分析
			
 
				+        quality_desc = self._get_score_description(dimension_scores.quality, "质量")
			
 
				+        report_parts.append(f"质量维度评分 {dimension_scores.quality} 分：{quality_desc}")
			
 
				+
			
 
				+        # 进度维度分析
			
 
				+        schedule_desc = self._get_score_description(dimension_scores.schedule, "进度")
			
 
				+        report_parts.append(f"进度维度评分 {dimension_scores.schedule} 分：{schedule_desc}")
			
 
				+
			
 
				+        # 成本维度分析
			
 
				+        cost_desc = self._get_score_description(dimension_scores.cost, "成本")
			
 
				+        report_parts.append(f"成本维度评分 {dimension_scores.cost} 分：{cost_desc}")
			
 
				+
			
 
				+        # 综合建议
			
 
				+        report_parts.append("\n综合建议：")
			
 
				+        if dimension_scores.safety < 70:
			
 
				+            report_parts.append("• 重点关注安全管理，完善安全技术措施。")
			
 
				+        if dimension_scores.quality < 70:
			
 
				+            report_parts.append("• 加强质量控制，完善施工工艺标准。")
			
 
				+        if dimension_scores.schedule < 70:
			
 
				+            report_parts.append("• 优化进度管理，确保工期可控。")
			
 
				+        if dimension_scores.cost < 70:
			
 
				+            report_parts.append("• 加强成本控制，避免预算超支。")
			
 
				+
			
 
				+        return "\n".join(report_parts)
			
 
				+
			
 
				+    async def _generate_recommendations(self, aggregated_data: Dict[str, Any],
			
 
				+                                       dimension_scores: DimensionScores) -> List[str]:
			
 
				+        """生成改进建议"""
			
 
				+        recommendations = []
			
 
				+
			
 
				+        # 基于风险分布的建议
			
 
				+        risk_stats = aggregated_data.get('risk_distribution', {})
			
 
				+        high_risk_issues = aggregated_data.get('issues_by_risk', {}).get('high', [])
			
 
				+
			
 
				+        if high_risk_issues:
			
 
				+            recommendations.append("立即处理高风险问题：")
			
 
				+            for issue in high_risk_issues[:3]:  # 取前3个高风险问题
			
 
				+                recommendations.append(f"• {issue.get('title', '未知章节')}：{issue.get('content', '')[:50]}...")
			
 
				+
			
 
				+        # 基于评分的建议
			
 
				+        if dimension_scores.safety < 80:
			
 
				+            recommendations.append("完善安全管理体系：")
			
 
				+            recommendations.append("• 补充安全技术交底记录")
			
 
				+            recommendations.append("• 加强现场安全防护措施")
			
 
				+
			
 
				+        if dimension_scores.quality < 80:
			
 
				+            recommendations.append("提升施工质量：")
			
 
				+            recommendations.append("• 完善施工工艺标准")
			
 
				+            recommendations.append("• 加强质量检查频次")
			
 
				+
			
 
				+        if dimension_scores.schedule < 80:
			
 
				+            recommendations.append("优化进度管理：")
			
 
				+            recommendations.append("• 细化施工进度计划")
			
 
				+            recommendations.append("• 建立进度预警机制")
			
 
				+
			
 
				+        return recommendations
			
 
				+
			
 
				+    def _extract_issues(self, compliance_result: Dict[str, Any]) -> List[str]:
			
 
				+        """提取问题描述"""
			
 
				+        if isinstance(compliance_result, dict) and 'error' in compliance_result:
			
 
				+            return [f"检查失败: {compliance_result['error']}"]
			
 
				+
			
 
				+        # 根据实际审查结果结构提取问题
			
 
				+        # 这里需要根据实际的审查结果结构来实现
			
 
				+        return []
			
 
				+
			
 
				+    def _get_score_description(self, score: int, dimension: str) -> str:
			
 
				+        """获取评分描述"""
			
 
				+        if score >= 90:
			
 
				+            return f"{dimension}管理优秀，符合规范要求，无明显风险。"
			
 
				+        elif score >= 80:
			
 
				+            return f"{dimension}管理良好，基本符合规范，存在少量细节问题。"
			
 
				+        elif score >= 70:
			
 
				+            return f"{dimension}管理一般，需要改进部分环节。"
			
 
				+        elif score >= 60:
			
 
				+            return f"{dimension}管理较差，存在较多问题需要整改。"
			
 
				+        else:
			
 
				+            return f"{dimension}管理差，存在严重问题，需要全面整改。"
			
--- a/core/construction_review/workflows/__init__.py
+++ b/core/construction_review/workflows/__init__.py
@@ -0,0 +1,14 @@
 
				+"""
			
 
				+工作流模块
			
 
				+包含文档处理、AI审查和报告生成的工作流实现
			
 
				+"""
			
 
				+
			
 
				+from .document_workflow import DocumentWorkflow
			
 
				+from .ai_review_workflow import AIReviewWorkflow
			
 
				+from .report_workflow import ReportWorkflow
			
 
				+
			
 
				+__all__ = [
			
 
				+    'DocumentWorkflow',
			
 
				+    'AIReviewWorkflow',
			
 
				+    'ReportWorkflow'
			
 
				+]
			
--- a/core/construction_review/workflows/ai_review.py
+++ b/core/construction_review/workflows/ai_review.py
@@ -1,6 +0,0 @@
 
				-
			
 
				-
			
 
				-from pydantic import BaseModel
			
 
				-
			
 
				-class ReviewWorkflow(BaseModel):
			
 
				-    
			
--- a/core/construction_review/workflows/ai_review_workflow.py
+++ b/core/construction_review/workflows/ai_review_workflow.py
@@ -0,0 +1,402 @@
 
				+"""
			
 
				+基于LangGraph的AI审查工作流
			
 
				+负责AI审查的流程控制和业务编排，使用LangGraph进行状态管理
			
 
				+"""
			
 
				+
			
 
				+import asyncio
			
 
				+import json
			
 
				+from dataclasses import asdict
			
 
				+import time
			
 
				+from typing import Optional, Callable, Dict, Any, TypedDict, Annotated, List
			
 
				+from dataclasses import dataclass
			
 
				+from langgraph.graph import StateGraph, END
			
 
				+from langgraph.graph.message import add_messages
			
 
				+from langchain_core.messages import BaseMessage, HumanMessage, AIMessage
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+from foundation.utils.time_statistics import track_execution_time
			
 
				+from ..component import AIReviewEngine
			
 
				+
			
 
				+
			
 
				+@dataclass
			
 
				+class ReviewResult:
			
 
				+    """审查结果"""
			
 
				+    unit_index: int
			
 
				+    unit_content: Dict[str, Any]
			
 
				+    basic_compliance: Dict[str, Any]
			
 
				+    technical_compliance: Dict[str, Any]
			
 
				+    rag_enhanced: Dict[str, Any]
			
 
				+    overall_risk: str
			
 
				+
			
 
				+class AIReviewState(TypedDict):
			
 
				+    """AI审查工作流状态"""
			
 
				+    # 基本信息
			
 
				+    file_id: str
			
 
				+    callback_task_id: str
			
 
				+    user_id: str
			
 
				+    structured_content: Dict[str, Any]
			
 
				+
			
 
				+    # AI审查结果
			
 
				+    review_results: Optional[Dict[str, Any]]
			
 
				+
			
 
				+    # 状态和进度
			
 
				+    current_stage: str
			
 
				+    status: str
			
 
				+    error_message: Optional[str]
			
 
				+
			
 
				+    # 进度管理
			
 
				+    progress_manager: Optional[Any]
			
 
				+
			
 
				+    # 消息日志（用于LangGraph状态追踪）
			
 
				+    messages: Annotated[List[BaseMessage], add_messages]
			
 
				+
			
 
				+
			
 
				+class AIReviewWorkflow:
			
 
				+    """基于LangGraph的AI审查工作流"""
			
 
				+
			
 
				+    def __init__(self, file_id: str, callback_task_id: str, user_id: str,
			
 
				+                 structured_content: Dict[str, Any], progress_manager=None):
			
 
				+        self.file_id = file_id
			
 
				+        self.callback_task_id = callback_task_id
			
 
				+        self.user_id = user_id
			
 
				+        self.structured_content = structured_content
			
 
				+        self.progress_manager = progress_manager
			
 
				+        self.ai_review_engine = AIReviewEngine()
			
 
				+
			
 
				+        # 构建LangGraph工作流
			
 
				+        self.graph = self._build_workflow()
			
 
				+
			
 
				+    def _build_workflow(self) -> StateGraph:
			
 
				+        """构建AI审查的LangGraph工作流图"""
			
 
				+        workflow = StateGraph(AIReviewState)
			
 
				+
			
 
				+        # 添加节点
			
 
				+        workflow.add_node("start", self._start_node)
			
 
				+        workflow.add_node("initialize_progress", self._initialize_progress_node)
			
 
				+        workflow.add_node("ai_review", self._ai_review_node)
			
 
				+        workflow.add_node("complete", self._complete_node)
			
 
				+        workflow.add_node("error_handler", self._error_handler_node)
			
 
				+
			
 
				+        # 设置入口点
			
 
				+        workflow.set_entry_point("start")
			
 
				+
			
 
				+        # 添加边（定义流程）
			
 
				+        workflow.add_edge("start", "initialize_progress")
			
 
				+        workflow.add_edge("initialize_progress", "ai_review")
			
 
				+        workflow.add_edge("ai_review", "complete")
			
 
				+        workflow.add_edge("complete", END)
			
 
				+        workflow.add_edge("error_handler", END)
			
 
				+
			
 
				+        # 添加条件边（错误处理）
			
 
				+        workflow.add_conditional_edges(
			
 
				+            "ai_review",
			
 
				+            self._check_ai_review_result,
			
 
				+            {
			
 
				+                "success": "complete",
			
 
				+                "error": "error_handler"
			
 
				+            }
			
 
				+        )
			
 
				+
			
 
				+        self.graph = workflow.compile()
			
 
				+        self._get_workflow_graph()
			
 
				+
			
 
				+        return self.graph
			
 
				+
			
 
				+    async def execute(self) -> dict:
			
 
				+        """执行基于LangGraph的AI审查工作流"""
			
 
				+        try:
			
 
				+            logger.info(f"开始AI审查工作流，文件ID: {self.file_id}")
			
 
				+
			
 
				+            # 初始状态
			
 
				+            initial_state = AIReviewState(
			
 
				+                file_id=self.file_id,
			
 
				+                callback_task_id=self.callback_task_id,
			
 
				+                user_id=self.user_id,
			
 
				+                structured_content=self.structured_content,
			
 
				+                review_results=None,
			
 
				+                current_stage="start",
			
 
				+                status="processing",
			
 
				+                error_message=None,
			
 
				+                progress_manager=self.progress_manager,
			
 
				+                messages=[HumanMessage(content=f"开始AI审查: {self.file_id}")]
			
 
				+            )
			
 
				+
			
 
				+            # 执行LangGraph工作流
			
 
				+            result = await self.graph.ainvoke(initial_state)
			
 
				+
			
 
				+            logger.info(f"LangGraph AI审查工作流完成，文件ID: {self.file_id}")
			
 
				+            review_results = {
			
 
				+                'file_id': result['file_id'],
			
 
				+                'total_units': result['review_results'].get('total_units', 0) if result['review_results'] else 0,
			
 
				+                'successful_units': result['review_results'].get('successful_units', 0) if result['review_results'] else 0,
			
 
				+                'failed_units': result['review_results'].get('failed_units', 0) if result['review_results'] else 0,
			
 
				+                'review_results': result['review_results'].get('review_results', []) if result['review_results'] else [],
			
 
				+                'summary': result['review_results'].get('summary', {}) if result['review_results'] else {},
			
 
				+                'status': result['status']
			
 
				+            }
			
 
				+
			
 
				+            logger.info(f"保存审查结果")
			
 
				+            with open('temp/AI审查结果.json', "w",encoding='utf-8') as f:
			
 
				+                json.dump(result, f, ensure_ascii=False, indent=2, default=str)
			
 
				+
			
 
				+            return review_results
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"LangGraph AI审查工作流执行失败: {str(e)}")
			
 
				+            raise
			
 
				+
			
 
				+    # ========== LangGraph节点实现 ==========
			
 
				+
			
 
				+    async def _start_node(self, state: AIReviewState) -> AIReviewState:
			
 
				+        """开始节点"""
			
 
				+        logger.info(f"AI审查工作流启动: {state['file_id']}")
			
 
				+
			
 
				+        state["current_stage"] = "start"
			
 
				+        state["status"] = "processing"
			
 
				+        state["messages"].append(AIMessage(content="AI审查工作流启动"))
			
 
				+
			
 
				+        return state
			
 
				+
			
 
				+    async def _initialize_progress_node(self, state: AIReviewState) -> AIReviewState:
			
 
				+        """初始化进度节点"""
			
 
				+        logger.info(f"初始化AI审查进度: {state['file_id']}")
			
 
				+
			
 
				+        state["current_stage"] = "initialize_progress"
			
 
				+
			
 
				+        # 更新进度
			
 
				+        if state["progress_manager"]:
			
 
				+            await state["progress_manager"].update_stage_progress(
			
 
				+                callback_task_id=state["callback_task_id"],
			
 
				+                stage_name="AI审查",
			
 
				+                progress=0,
			
 
				+                status="processing",
			
 
				+                message="开始AI审查"
			
 
				+            )
			
 
				+
			
 
				+        state["messages"].append(AIMessage(content="进度初始化完成"))
			
 
				+
			
 
				+        return state
			
 
				+    
			
 
				+    async def _ai_review_node(self, state: AIReviewState) -> AIReviewState:
			
 
				+        """AI审查节点 - 使用LangGraph编排原子化组件方法"""
			
 
				+        try:
			
 
				+            logger.info(f"执行AI审查: {state['file_id']}")
			
 
				+
			
 
				+            state["current_stage"] = "ai_review"
			
 
				+
			
 
				+            total_units = len(state['structured_content']['chunks'])
			
 
				+            completed_units = 0
			
 
				+
			
 
				+            # 进度回调函数
			
 
				+            def progress_callback(progress: int, message: str):
			
 
				+                # 将AI审查的进度映射到整体进度
			
 
				+                overall_progress = 50 + int(progress * 0.4)  # AI审查占整体进度的40%
			
 
				+                if state["progress_manager"]:
			
 
				+                    asyncio.create_task(
			
 
				+                        state["progress_manager"].update_stage_progress(
			
 
				+                            callback_task_id=state["callback_task_id"],
			
 
				+                            stage_name="AI审查",
			
 
				+                            progress=overall_progress,
			
 
				+                            status="processing",
			
 
				+                            message=message
			
 
				+                        )
			
 
				+                    )
			
 
				+
			
 
				+            # 使用原子化组件方法审查单个单元
			
 
				+            async def review_single_unit(unit_content: Dict[str, Any], unit_index: int) -> ReviewResult:
			
 
				+                """使用LangGraph编排的原子化组件方法审查单个单元"""
			
 
				+                async with self.ai_review_engine.semaphore:
			
 
				+                    try:
			
 
				+                        # 并发执行各种原子化审查方法
			
 
				+                        review_tasks = [
			
 
				+                            self.ai_review_engine.basic_compliance_check(unit_content),
			
 
				+                            self.ai_review_engine.technical_compliance_check(unit_content),
			
 
				+                            self.ai_review_engine.rag_enhanced_check(unit_content)
			
 
				+                        ]
			
 
				+
			
 
				+                        # 等待所有审查完成
			
 
				+                        review_results = await asyncio.gather(*review_tasks, return_exceptions=True)
			
 
				+
			
 
				+                        # 处理异常结果
			
 
				+                        basic_result = review_results[0] if not isinstance(review_results[0], Exception) else {"error": str(review_results[0])}
			
 
				+                        technical_result = review_results[1] if not isinstance(review_results[1], Exception) else {"error": str(review_results[1])}
			
 
				+                        rag_result = review_results[2] if not isinstance(review_results[2], Exception) else {"error": str(review_results[2])}
			
 
				+
			
 
				+                        # 计算总体风险等级
			
 
				+                        overall_risk = self._calculate_overall_risk(basic_result, technical_result, rag_result)
			
 
				+
			
 
				+                        # 更新进度
			
 
				+                        nonlocal completed_units
			
 
				+                        completed_units += 1
			
 
				+                        progress = int((completed_units / total_units) * 100)
			
 
				+                        message = f"已完成 {completed_units}/{total_units} 个审查单元"
			
 
				+
			
 
				+                        if progress_callback:
			
 
				+                            progress_callback(progress, message)
			
 
				+
			
 
				+                        return ReviewResult(
			
 
				+                            unit_index=unit_index,
			
 
				+                            unit_content=unit_content,
			
 
				+                            basic_compliance=basic_result,
			
 
				+                            technical_compliance=technical_result,
			
 
				+                            rag_enhanced=rag_result,
			
 
				+                            overall_risk=overall_risk
			
 
				+                        )
			
 
				+
			
 
				+                    except Exception as e:
			
 
				+                        logger.error(f"审查单元 {unit_index} 失败: {str(e)}")
			
 
				+                        return ReviewResult(
			
 
				+                            unit_index=unit_index,
			
 
				+                            unit_content=unit_content,
			
 
				+                            basic_compliance={"error": str(e)},
			
 
				+                            technical_compliance={"error": str(e)},
			
 
				+                            rag_enhanced={"error": str(e)},
			
 
				+                            overall_risk="error"
			
 
				+                        )
			
 
				+
			
 
				+            # 并发审查所有单元
			
 
				+            review_tasks = [
			
 
				+                asyncio.create_task(review_single_unit(content, i))
			
 
				+                for i, content in enumerate(state['structured_content']['chunks'])
			
 
				+            ]
			
 
				+
			
 
				+            # 等待所有审查完成
			
 
				+            all_results = await asyncio.gather(*review_tasks)
			
 
				+
			
 
				+            # 过滤成功结果
			
 
				+            successful_results = [result for result in all_results if result.overall_risk != "error"]
			
 
				+
			
 
				+            # 汇总结果
			
 
				+            summary = self._aggregate_results(successful_results)
			
 
				+
			
 
				+            review_results = {
			
 
				+                'total_units': total_units,
			
 
				+                'successful_units': len(successful_results),
			
 
				+                'failed_units': total_units - len(successful_results),
			
 
				+                'review_results': successful_results,
			
 
				+                'summary': summary
			
 
				+            }
			
 
				+
			
 
				+            state["review_results"] = review_results
			
 
				+            state["messages"].append(AIMessage(
			
 
				+                content=f"AI审查完成，共处理{total_units}个单元，成功{len(successful_results)}个"
			
 
				+            ))
			
 
				+
			
 
				+            return state
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"AI审查失败: {str(e)}")
			
 
				+            state["error_message"] = str(e)
			
 
				+            state["messages"].append(AIMessage(content=f"AI审查失败: {str(e)}"))
			
 
				+            return state
			
 
				+
			
 
				+    async def _complete_node(self, state: AIReviewState) -> AIReviewState:
			
 
				+        """完成节点"""
			
 
				+        logger.info(f"AI审查完成: {state['file_id']}")
			
 
				+
			
 
				+        state["current_stage"] = "complete"
			
 
				+        state["status"] = "completed"
			
 
				+
			
 
				+        # 更新完成状态
			
 
				+        if state["progress_manager"]:
			
 
				+            await state["progress_manager"].update_stage_progress(
			
 
				+                callback_task_id=state["callback_task_id"],
			
 
				+                stage_name="AI审查",
			
 
				+                progress=90,
			
 
				+                status="completed",
			
 
				+                message="AI审查完成"
			
 
				+            )
			
 
				+
			
 
				+        state["messages"].append(AIMessage(content="AI审查工作流完成"))
			
 
				+
			
 
				+        return state
			
 
				+
			
 
				+    async def _error_handler_node(self, state: AIReviewState) -> AIReviewState:
			
 
				+        """错误处理节点"""
			
 
				+        logger.error(f"AI审查错误处理: {state['file_id']}, 错误: {state['error_message']}")
			
 
				+
			
 
				+        state["status"] = "failed"
			
 
				+        state["current_stage"] = "error_handler"
			
 
				+
			
 
				+        # 更新错误状态
			
 
				+        if state["progress_manager"]:
			
 
				+            await state["progress_manager"].update_stage_progress(
			
 
				+                callback_task_id=state["callback_task_id"],
			
 
				+                stage_name="AI审查",
			
 
				+                progress=50,
			
 
				+                status="failed",
			
 
				+                message=f"AI审查失败: {state['error_message']}"
			
 
				+            )
			
 
				+
			
 
				+        state["messages"].append(AIMessage(
			
 
				+            content=f"错误处理: {state['error_message']}"
			
 
				+        ))
			
 
				+
			
 
				+        return state
			
 
				+
			
 
				+    # ========== 辅助方法 ==========
			
 
				+
			
 
				+    def _calculate_overall_risk(self, basic_result: Dict, technical_result: Dict, rag_result: Dict) -> str:
			
 
				+        """计算总体风险等级"""
			
 
				+        try:
			
 
				+            # 基于各种审查结果计算风险等级
			
 
				+            basic_score = basic_result.get('overall_score', 0)
			
 
				+            technical_score = technical_result.get('overall_score', 0)
			
 
				+
			
 
				+            if basic_score >= 90 and technical_score >= 90:
			
 
				+                return "low"
			
 
				+            elif basic_score >= 70 and technical_score >= 70:
			
 
				+                return "medium"
			
 
				+            else:
			
 
				+                return "high"
			
 
				+        except:
			
 
				+            return "medium"
			
 
				+
			
 
				+    def _aggregate_results(self, successful_results: List[ReviewResult]) -> Dict[str, Any]:
			
 
				+        """汇总审查结果"""
			
 
				+        try:
			
 
				+            if not successful_results:
			
 
				+                return {}
			
 
				+
			
 
				+            # 计算统计数据
			
 
				+            risk_stats = {"low": 0, "medium": 0, "high": 0, "error": 0}
			
 
				+            for result in successful_results:
			
 
				+                risk_stats[result.overall_risk] += 1
			
 
				+
			
 
				+            # 计算平均分
			
 
				+            total_basic_score = sum(r.basic_compliance.get('overall_score', 0) for r in successful_results)
			
 
				+            total_technical_score = sum(r.technical_compliance.get('overall_score', 0) for r in successful_results)
			
 
				+
			
 
				+            avg_basic_score = total_basic_score / len(successful_results)
			
 
				+            avg_technical_score = total_technical_score / len(successful_results)
			
 
				+
			
 
				+            return {
			
 
				+                'risk_stats': risk_stats,
			
 
				+                'avg_basic_score': avg_basic_score,
			
 
				+                'avg_technical_score': avg_technical_score,
			
 
				+                'total_reviewed': len(successful_results)
			
 
				+            }
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"结果汇总失败: {str(e)}")
			
 
				+            return {}
			
 
				+
			
 
				+    # ========== 条件边函数 ==========
			
 
				+
			
 
				+    def _check_ai_review_result(self, state: AIReviewState) -> str:
			
 
				+        """检查AI审查结果"""
			
 
				+        if state.get("error_message"):
			
 
				+            return "error"
			
 
				+        return "success"
			
 
				+
			
 
				+    def _get_workflow_graph(self):
			
 
				+        """获取工作流图（可视化输出）"""
			
 
				+        grandalf_graph = self.graph.get_graph()
			
 
				+        grandalf_graph.print_ascii()
			
 
				+ 
			
 
				+
			
 
				+
			
 
				+
			
 
				+    async def _get_status(self) -> dict:
			
 
				+        """获取工作流状态"""
			
 
				+        if self.progress_manager:
			
 
				+            return await self.progress_manager.get_progress(self.callback_task_id)
			
 
				+        return {}
			
--- a/core/construction_review/workflows/document_ans.py
+++ b/core/construction_review/workflows/document_ans.py
@@ -1,32 +0,0 @@
 
				-
			
 
				-
			
 
				-# 文档解析流程
			
 
				-from langchain_community.document_loaders import PyPDFLoader  # 加载PDF文件
			
 
				-from langchain.text_splitter import RecursiveCharacterTextSplitter  # 文本分块
			
 
				-from foundation.logger.loggering import server_logger
			
 
				-
			
 
				-logger = server_logger
			
 
				-
			
 
				-
			
 
				-class DocumentParse:
			
 
				-
			
 
				-    """
			
 
				-    文档解析
			
 
				-    """
			
 
				-
			
 
				-    @staticmethod
			
 
				-    def document_parse(file_path):
			
 
				-        # 1. 加载PDF
			
 
				-        loader = PyPDFLoader(file_path)
			
 
				-        documents = loader.load()
			
 
				-        
			
 
				-        # 2. 文本分块
			
 
				-        text_splitter = RecursiveCharacterTextSplitter(
			
 
				-            chunk_size=1000,  # 块大小
			
 
				-            chunk_overlap=20,  # 块重叠
			
 
				-            separators=["\n\n", "\n", " ", ""]  # 分块分隔符
			
 
				-        )
			
 
				-        splits = text_splitter.split_documents(documents)  # 得到分块后的文档
			
 
				-        logger.info(f"加载的: {len(splits)}条审查条款")
			
 
				-        return splits
			
 
				-
			
--- a/core/construction_review/workflows/document_workflow.py
+++ b/core/construction_review/workflows/document_workflow.py
@@ -0,0 +1,100 @@
 
				+"""
			
 
				+文档处理工作流
			
 
				+负责文档处理的流程控制和业务编排
			
 
				+"""
			
 
				+
			
 
				+import asyncio
			
 
				+from typing import Optional, Callable
			
 
				+from datetime import datetime
			
 
				+
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+from ..component import DocumentProcessor
			
 
				+
			
 
				+class DocumentWorkflow:
			
 
				+    """文档处理工作流"""
			
 
				+
			
 
				+    def __init__(self, file_id: str, callback_task_id: str, user_id: str,
			
 
				+                 progress_manager=None, redis_duplicate_checker=None):
			
 
				+        self.file_id = file_id
			
 
				+        self.callback_task_id = callback_task_id
			
 
				+        self.user_id = user_id
			
 
				+        self.progress_manager = progress_manager
			
 
				+        self.redis_duplicate_checker = redis_duplicate_checker
			
 
				+        self.document_processor = DocumentProcessor()
			
 
				+
			
 
				+    async def execute(self, file_content: bytes, file_type: str) -> dict:
			
 
				+        """执行文档处理工作流"""
			
 
				+        try:
			
 
				+            logger.info(f"开始文档处理工作流，文件ID: {self.file_id}")
			
 
				+
			
 
				+            # 2. 初始化进度
			
 
				+            await self.progress_manager.initialize_progress(
			
 
				+                callback_task_id=self.callback_task_id,
			
 
				+                user_id=self.user_id,
			
 
				+                stages=[
			
 
				+                    {"stage_name": "文档上传", "progress": 100, "status": "completed"},
			
 
				+                    {"stage_name": "文档解析", "progress": 0, "status": "pending"},
			
 
				+                    {"stage_name": "内容提取", "progress": 0, "status": "pending"},
			
 
				+                    {"stage_name": "结构化处理", "progress": 0, "status": "pending"}
			
 
				+                ]
			
 
				+            )
			
 
				+
			
 
				+            # 4. 执行文档处理
			
 
				+            def progress_callback(progress: int, message: str):
			
 
				+                asyncio.create_task(
			
 
				+                    self.progress_manager.update_stage_progress(
			
 
				+                        callback_task_id=self.callback_task_id,
			
 
				+                        stage_name="文档处理",
			
 
				+                        progress=progress,
			
 
				+                        status="processing",
			
 
				+                        message=message
			
 
				+                    )
			
 
				+                )
			
 
				+
			
 
				+            structured_content = await self.document_processor.process_document(
			
 
				+                file_content=file_content,
			
 
				+                file_type=file_type,
			
 
				+                progress_callback=progress_callback
			
 
				+            )
			
 
				+
			
 
				+            # 5. 更新完成状态
			
 
				+            await self.progress_manager.update_stage_progress(
			
 
				+                callback_task_id=self.callback_task_id,
			
 
				+                stage_name="文档处理",
			
 
				+                progress=100,
			
 
				+                status="completed",
			
 
				+                message="文档处理完成"
			
 
				+            )
			
 
				+
			
 
				+            # 6. 保存处理结果
			
 
				+            result = {
			
 
				+                'file_id': self.file_id,
			
 
				+                'structured_content': structured_content,
			
 
				+                'document_name': structured_content['document_name'],
			
 
				+                'total_chunks': structured_content['total_chunks'],
			
 
				+                'metadata': structured_content['metadata']
			
 
				+            }
			
 
				+
			
 
				+            logger.info(f"文档处理工作流完成，文件ID: {self.file_id}")
			
 
				+            return result
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"文档处理工作流失败: {str(e)}")
			
 
				+
			
 
				+            # 更新错误状态
			
 
				+            if self.progress_manager:
			
 
				+                await self.progress_manager.update_stage_progress(
			
 
				+                    callback_task_id=self.callback_task_id,
			
 
				+                    stage_name="文档处理",
			
 
				+                    progress=0,
			
 
				+                    status="failed",
			
 
				+                    message=f"处理失败: {str(e)}"
			
 
				+                )
			
 
				+
			
 
				+            raise
			
 
				+
			
 
				+    async def get_status(self) -> dict:
			
 
				+        """获取工作流状态"""
			
 
				+        if self.progress_manager:
			
 
				+            return await self.progress_manager.get_progress(self.callback_task_id)
			
 
				+        return {}
			
--- a/core/construction_review/workflows/report_workflow.py
+++ b/core/construction_review/workflows/report_workflow.py
@@ -0,0 +1,117 @@
 
				+"""
			
 
				+报告生成工作流
			
 
				+负责报告生成的流程控制和业务编排
			
 
				+"""
			
 
				+
			
 
				+import asyncio
			
 
				+from typing import Optional, Callable
			
 
				+from datetime import datetime
			
 
				+
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+from ..component import ReportGenerator
			
 
				+
			
 
				+class ReportWorkflow:
			
 
				+    """报告生成工作流"""
			
 
				+
			
 
				+    def __init__(self, file_id: str, callback_task_id: str, user_id: str,
			
 
				+                 ai_review_results: dict, progress_manager=None):
			
 
				+        self.file_id = file_id
			
 
				+        self.callback_task_id = callback_task_id
			
 
				+        self.user_id = user_id
			
 
				+        self.ai_review_results = ai_review_results
			
 
				+        self.progress_manager = progress_manager
			
 
				+        self.report_generator = ReportGenerator()
			
 
				+
			
 
				+    async def execute(self) -> dict:
			
 
				+        """执行报告生成工作流"""
			
 
				+        try:
			
 
				+            logger.info(f"开始报告生成工作流，文件ID: {self.file_id}")
			
 
				+
			
 
				+            # 1. 初始化进度
			
 
				+            await self.progress_manager.update_stage_progress(
			
 
				+                callback_task_id=self.callback_task_id,
			
 
				+                stage_name="报告生成",
			
 
				+                progress=0,
			
 
				+                status="processing",
			
 
				+                message="开始生成报告"
			
 
				+            )
			
 
				+
			
 
				+            # 2. 生成报告
			
 
				+            def progress_callback(progress: int, message: str):
			
 
				+                # 将报告生成的进度映射到整体进度
			
 
				+                overall_progress = 90 + int(progress * 0.1)  # 报告生成占整体进度的10%
			
 
				+                asyncio.create_task(
			
 
				+                    self.progress_manager.update_stage_progress(
			
 
				+                        callback_task_id=self.callback_task_id,
			
 
				+                        stage_name="报告生成",
			
 
				+                        progress=overall_progress,
			
 
				+                        status="processing",
			
 
				+                        message=message
			
 
				+                    )
			
 
				+                )
			
 
				+
			
 
				+            final_report = await self.report_generator.generate_report(
			
 
				+                file_id=self.file_id,
			
 
				+                review_results=self.ai_review_results,
			
 
				+                progress_callback=progress_callback
			
 
				+            )
			
 
				+
			
 
				+            # 3. 更新完成状态
			
 
				+            await self.progress_manager.update_stage_progress(
			
 
				+                callback_task_id=self.callback_task_id,
			
 
				+                stage_name="报告生成",
			
 
				+                progress=100,
			
 
				+                status="completed",
			
 
				+                message="报告生成完成"
			
 
				+            )
			
 
				+
			
 
				+            # 4. 标记任务链完成
			
 
				+            await self.progress_manager.complete_task(
			
 
				+                callback_task_id=self.callback_task_id,
			
 
				+                result=self._convert_report_to_dict(final_report)
			
 
				+            )
			
 
				+
			
 
				+            # 5. 处理结果
			
 
				+            result = self._convert_report_to_dict(final_report)
			
 
				+
			
 
				+            logger.info(f"报告生成工作流完成，文件ID: {self.file_id}")
			
 
				+            return result
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"报告生成工作流失败: {str(e)}")
			
 
				+
			
 
				+            # 更新错误状态
			
 
				+            if self.progress_manager:
			
 
				+                await self.progress_manager.update_stage_progress(
			
 
				+                    callback_task_id=self.callback_task_id,
			
 
				+                    stage_name="报告生成",
			
 
				+                    progress=90,
			
 
				+                    status="failed",
			
 
				+                    message=f"报告生成失败: {str(e)}"
			
 
				+                )
			
 
				+
			
 
				+            raise
			
 
				+
			
 
				+    def _convert_report_to_dict(self, final_report) -> dict:
			
 
				+        """将报告对象转换为字典"""
			
 
				+        return {
			
 
				+            'file_id': final_report.file_id,
			
 
				+            'document_name': final_report.document_name,
			
 
				+            'risk_stats': final_report.risk_stats,
			
 
				+            'dimension_scores': {
			
 
				+                'safety': final_report.dimension_scores.safety,
			
 
				+                'quality': final_report.dimension_scores.quality,
			
 
				+                'schedule': final_report.dimension_scores.schedule,
			
 
				+                'cost': final_report.dimension_scores.cost
			
 
				+            },
			
 
				+            'summary_report': final_report.summary_report,
			
 
				+            'multidimensional_report': final_report.multidimensional_report,
			
 
				+            'recommendations': final_report.recommendations,
			
 
				+            'generated_at': final_report.generated_at.isoformat()
			
 
				+        }
			
 
				+
			
 
				+    async def get_status(self) -> dict:
			
 
				+        """获取工作流状态"""
			
 
				+        if self.progress_manager:
			
 
				+            return await self.progress_manager.get_progress(self.callback_task_id)
			
 
				+        return {}
			
--- a/core/construction_review/workflows/task_progress.py
+++ b/core/construction_review/workflows/task_progress.py
--- a/foundation/base/celery_app.py
+++ b/foundation/base/celery_app.py
@@ -0,0 +1,55 @@
 
				+"""
			
 
				+Celery应用配置
			
 
				+负责任务队列管理，不涉及具体业务逻辑
			
 
				+"""
			
 
				+
			
 
				+import os
			
 
				+from celery import Celery
			
 
				+from .config import config_handler
			
 
				+
			
 
				+# 从配置文件获取Redis连接信息
			
 
				+redis_host = config_handler.get('redis', 'REDIS_HOST', 'localhost')
			
 
				+redis_port = config_handler.get('redis', 'REDIS_PORT', '6379')
			
 
				+redis_password = config_handler.get('redis', 'REDIS_PASSWORD', '')
			
 
				+
			
 
				+
			
 
				+# 构建Redis连接URL
			
 
				+if redis_password:
			
 
				+    redis_url = f"redis://:{redis_password}@{redis_host}:{redis_port}/0"
			
 
				+else:
			
 
				+    redis_url = f"redis://{redis_host}:{redis_port}/0"
			
 
				+
			
 
				+print(f"Connecting to Redis: {redis_url}")
			
 
				+
			
 
				+app = Celery(
			
 
				+    'workflow_tasks',
			
 
				+    broker=redis_url,
			
 
				+    backend=redis_url,
			
 
				+    include=['foundation.base.tasks']
			
 
				+)
			
 
				+
			
 
				+# 配置
			
 
				+app.conf.update(
			
 
				+    task_serializer='json',
			
 
				+    accept_content=['json'],
			
 
				+    result_serializer='json',
			
 
				+    timezone='Asia/Shanghai',
			
 
				+    enable_utc=True,
			
 
				+
			
 
				+    # Worker配置
			
 
				+    worker_prefetch_multiplier=1,  # 每个worker一次只取一个任务
			
 
				+    task_acks_late=True,           # 任务完成后再确认
			
 
				+
			
 
				+    # 并发控制
			
 
				+    worker_concurrency=2,          # 每个worker进程数（文档处理较重，不宜过多）
			
 
				+    worker_pool='solo',           # 使用单线程模式（避免GIL问题）
			
 
				+
			
 
				+    # 任务配置
			
 
				+    task_track_started=True,
			
 
				+    task_time_limit=600,           # 10分钟超时（文档处理较慢）
			
 
				+    task_soft_time_limit=540,      # 9分钟软超时
			
 
				+    worker_max_tasks_per_child=5,  # 每个worker进程最多处理5个任务后重启（防止内存泄漏）
			
 
				+
			
 
				+    # 结果过期时间
			
 
				+    result_expires=3600,           # 1小时后过期
			
 
				+)
			
--- a/foundation/base/tasks.py
+++ b/foundation/base/tasks.py
@@ -0,0 +1,82 @@
 
				+"""
			
 
				+Celery任务定义
			
 
				+只负责任务调度，具体业务逻辑由WorkflowManager处理
			
 
				+"""
			
 
				+
			
 
				+from celery import current_task
			
 
				+from .celery_app import app
			
 
				+from core.base.workflow_manager import WorkflowManager
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+from foundation.utils.time_statistics import track_execution_time
			
 
				+
			
 
				+
			
 
				+@app.task(bind=True)
			
 
				+def submit_task_processing_task(self, file_info: dict):
			
 
				+    """
			
 
				+    提交任务处理到Celery队列
			
 
				+    这个任务只负责调用WorkflowManager，不包含业务逻辑
			
 
				+    """
			
 
				+    import traceback
			
 
				+
			
 
				+    # 添加调试信息
			
 
				+    logger.info("=== Celery任务接收调试 ===")
			
 
				+    logger.info(f"任务ID: {self.request.id}")
			
 
				+    logger.info(f"文件ID: {file_info.get('file_id')}")
			
 
				+    logger.info(f"回调任务ID: {file_info.get('callback_task_id')}")
			
 
				+    logger.info("=== 任务接收调用栈 ===")
			
 
				+    for line in traceback.format_stack():
			
 
				+        logger.debug(f"  {line.strip()}")
			
 
				+    logger.info("=== 调用栈结束 ===")
			
 
				+
			
 
				+    try:
			
 
				+        # 更新任务状态 - 开始处理
			
 
				+        self.update_state(
			
 
				+            state='PROGRESS',
			
 
				+            meta={
			
 
				+                'current': 0,
			
 
				+                'total': 100,
			
 
				+                'status': '开始处理文档',
			
 
				+                'file_id': file_info.get('file_id')
			
 
				+            }
			
 
				+        )
			
 
				+
			
 
				+        logger.info(f"开始执行业务逻辑，文件ID: {file_info.get('file_id')}")
			
 
				+
			
 
				+        # 创建独立的WorkflowManager实例执行业务逻辑
			
 
				+        workflow_manager = WorkflowManager(
			
 
				+            max_concurrent_docs=1,  # Celery worker中单任务执行
			
 
				+            max_concurrent_reviews=5
			
 
				+        )
			
 
				+
			
 
				+        # 同步执行（Celery worker本身就是独立的进程）
			
 
				+
			
 
				+        result = workflow_manager.submit_task_processing_sync(file_info)
			
 
				+
			
 
				+
			
 
				+
			
 
				+        # 更新任务状态 - 完成
			
 
				+        self.update_state(
			
 
				+            state='PROGRESS',
			
 
				+            meta={
			
 
				+                'current': 100,
			
 
				+                'total': 100,
			
 
				+                'status': '处理完成',
			
 
				+                'file_id': file_info.get('file_id')
			
 
				+            }
			
 
				+        )
			
 
				+
			
 
				+
			
 
				+        return {
			
 
				+            'status': 'success',
			
 
				+            'file_id': file_info.get('file_id'),
			
 
				+            'callback_task_id': file_info.get('callback_task_id'),
			
 
				+            'result': result
			
 
				+        }
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        # 记录错误并重试
			
 
				+        logger.error(f"任务处理失败: {str(e)}")
			
 
				+        logger.exception("详细错误信息:")
			
 
				+        # 自动重试，延迟60秒，最多重试2次
			
 
				+        self.retry(countdown=60, max_retries=2, exc=e)
			
 
				+        raise
			
--- a/foundation/utils/md5.py
+++ b/foundation/utils/md5.py
@@ -0,0 +1,17 @@
 
				+import hashlib
			
 
				+
			
 
				+def md5_id(file_content_or_path):
			
 
				+    """计算文件内容或文件路径的MD5哈希值作为ID"""
			
 
				+    md5_hash = hashlib.md5()
			
 
				+
			
 
				+    # 判断输入是文件内容(bytes)还是文件路径(str)
			
 
				+    if isinstance(file_content_or_path, bytes):
			
 
				+        # 直接处理文件内容
			
 
				+        md5_hash.update(file_content_or_path)
			
 
				+    else:
			
 
				+        # 处理文件路径
			
 
				+        with open(file_content_or_path, 'rb') as f:
			
 
				+            for chunk in iter(lambda: f.read(4096), b''):
			
 
				+                md5_hash.update(chunk)
			
 
				+
			
 
				+    return md5_hash.hexdigest()
			
--- a/foundation/utils/time_statistics.py
+++ b/foundation/utils/time_statistics.py
@@ -0,0 +1,21 @@
 
				+import time
			
 
				+from functools import wraps
			
 
				+from ..logger.loggering import server_logger as logger
			
 
				+
			
 
				+def track_execution_time(func):
			
 
				+    """
			
 
				+    追踪函数执行时间并通过日志输出的装饰器
			
 
				+    记录函数开始执行、执行完成及耗时（保留两位小数）
			
 
				+    """
			
 
				+    @wraps(func)
			
 
				+    def wrapper(*args, **kwargs):
			
 
				+        logger.info(f"[{func.__name__}] 开始执行")
			
 
				+        start_time = time.perf_counter()
			
 
				+        
			
 
				+        try:
			
 
				+            return func(*args, **kwargs)
			
 
				+        finally:
			
 
				+            duration = time.perf_counter() - start_time
			
 
				+            logger.info(f"[{func.__name__}] 执行完成，耗时: {duration:.2f} 秒")
			
 
				+    
			
 
				+    return wrapper
			
--- a/requirements.txt
+++ b/requirements.txt
@@ -19,6 +19,8 @@ coloredlogs==15.0.1
 
				 concurrent-log-handler==0.9.28
			
 
				 cryptography==45.0.5
			
 
				 cyclopts==3.22.2
			
 
				+celery==5.5.3
			
 
				+redis
			
 
				 dashscope==1.23.8
			
 
				 dataclasses-json==0.6.7
			
 
				 distro==1.9.0
			
@@ -101,6 +103,7 @@ opentelemetry-semantic-conventions==0.55b1
 
				 orjson==3.10.18
			
 
				 ormsgpack==1.10.0
			
 
				 overrides==7.7.0
			
 
				+python-docx==1.2.0
			
 
				 packaging==24.2
			
 
				 pandas==2.3.1
			
 
				 pluggy==1.6.0
			
@@ -140,6 +143,7 @@ rich==14.0.0
 
				 rich-rst==1.3.1
			
 
				 rpds-py==0.26.0
			
 
				 rsa==4.9.1
			
 
				+grandalf==0.8
			
 
				 setuptools==78.1.1
			
 
				 shellingham==1.5.4
			
 
				 six==1.17.0
			
--- a/temp/AI审查结果.json
+++ b/temp/AI审查结果.json
--- a/views/construction_review/app.py
+++ b/views/construction_review/app.py
@@ -6,12 +6,19 @@
 
				 import datetime
			
 
				 import sys
			
 
				 import os
			
 
				+import threading
			
 
				+import subprocess
			
 
				+import time
			
 
				+from multiprocessing import Process
			
 
				 
			
 
				 # 添加项目根目录到Python路径
			
 
				 current_dir = os.path.dirname(os.path.abspath(__file__))
			
 
				 project_root = os.path.dirname(os.path.dirname(current_dir))
			
 
				 sys.path.insert(0, project_root)
			
 
				 
			
 
				+# 现在可以正常导入了
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				+from foundation.base.celery_app import app as celery_app
			
 
				 from fastapi import FastAPI, HTTPException
			
 
				 from fastapi.middleware.cors import CORSMiddleware
			
 
				 from fastapi.responses import JSONResponse
			
@@ -58,6 +65,17 @@ def create_app() -> FastAPI:
 
				         timestamp = datetime.datetime.now().isoformat()
			
 
				         return {"status": "healthy", "timestamp": timestamp}
			
 
				 
			
 
				+    # Celery状态检查
			
 
				+    @app.get("/celery/status")
			
 
				+    async def get_celery_status():
			
 
				+        """获取Celery Worker状态"""
			
 
				+        global celery_manager
			
 
				+        status = celery_manager.get_status()
			
 
				+        return {
			
 
				+            "celery_worker": status,
			
 
				+            "timestamp": datetime.datetime.now().isoformat()
			
 
				+        }
			
 
				+
			
 
				     # API文档
			
 
				     @app.get("/api/docs")
			
 
				     async def api_docs():
			
@@ -90,18 +108,338 @@ def create_app() -> FastAPI:
 
				         }
			
 
				 
			
 
				     return app
			
 
				-app = create_app()
			
 
				+# Celery Worker管理器
			
 
				+class CeleryWorkerManager:
			
 
				+    """Celery Worker程序化管理器"""
			
 
				+
			
 
				+    def __init__(self):
			
 
				+        self.worker = None
			
 
				+        self.is_running = False
			
 
				+        self.worker_thread = None
			
 
				+        self.shutdown_event = threading.Event()
			
 
				+
			
 
				+    def start_worker(self, **kwargs):
			
 
				+        """启动Celery Worker"""
			
 
				+        if self.is_running:
			
 
				+            logger.warning("Celery Worker已在运行")
			
 
				+            return True
			
 
				+
			
 
				+        try:
			
 
				+            # 导入Celery应用
			
 
				+            from foundation.base.celery_app import app as celery_app
			
 
				+
			
 
				+            # 创建Worker函数
			
 
				+            def run_celery_worker():
			
 
				+                try:
			
 
				+                    # 使用最简单的启动方式
			
 
				+                    logger.info("Celery Worker开始运行...")
			
 
				+
			
 
				+                    # 直接启动worker，使用默认配置
			
 
				+                    celery_app.worker_main(['worker'])
			
 
				+
			
 
				+                except KeyboardInterrupt:
			
 
				+                    logger.info("收到停止信号，Celery Worker退出")
			
 
				+                except Exception as e:
			
 
				+                    logger.error(f"Celery Worker运行时出错: {e}")
			
 
				+                    logger.exception("详细错误信息:")
			
 
				+                finally:
			
 
				+                    self.is_running = False
			
 
				+                    logger.info("Celery Worker已停止")
			
 
				+
			
 
				+            # 在单独线程中启动Worker
			
 
				+            self.worker_thread = threading.Thread(target=run_celery_worker, daemon=True)
			
 
				+            self.worker_thread.start()
			
 
				+            self.is_running = True
			
 
				+
			
 
				+            # 等待启动
			
 
				+            time.sleep(2)
			
 
				+
			
 
				+            if self.is_running and self.worker_thread.is_alive():
			
 
				+                logger.info("Celery Worker启动成功")
			
 
				+                return True
			
 
				+            else:
			
 
				+                logger.error("Celery Worker启动失败")
			
 
				+                self.is_running = False
			
 
				+                return False
			
 
				+
			
 
				+        except ImportError as e:
			
 
				+            logger.error(f"导入Celery失败: {e}")
			
 
				+            logger.info("请先安装Celery: pip install celery redis")
			
 
				+            return False
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"启动Celery Worker失败: {e}")
			
 
				+            logger.exception("详细错误信息:")
			
 
				+            return False
			
 
				+
			
 
				+    def stop_worker(self, timeout: int = 5):
			
 
				+        """停止Celery Worker"""
			
 
				+        if not self.is_running:
			
 
				+            logger.info("Celery Worker未运行")
			
 
				+            return True
			
 
				+
			
 
				+        try:
			
 
				+            logger.info("停止Celery Worker...")
			
 
				+            self.shutdown_event.set()
			
 
				+
			
 
				+            # 发送停止信号给线程
			
 
				+            if self.worker_thread and self.worker_thread.is_alive():
			
 
				+                # 尝试优雅停止
			
 
				+                start_time = time.time()
			
 
				+                while self.is_running and (time.time() - start_time) < timeout:
			
 
				+                    time.sleep(0.1)
			
 
				+
			
 
				+                # 如果还没停止，记录警告
			
 
				+                if self.is_running:
			
 
				+                    logger.warning("Celery Worker优雅停止超时")
			
 
				+                else:
			
 
				+                    logger.info("Celery Worker已优雅停止")
			
 
				+
			
 
				+            self.is_running = False
			
 
				+            self.shutdown_event.clear()
			
 
				+            return True
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"停止Celery Worker失败: {e}")
			
 
				+            return False
			
 
				+
			
 
				+    def stop_worker_immediately(self):
			
 
				+        """立即停止Celery Worker，不等待"""
			
 
				+        if not self.is_running:
			
 
				+            logger.info("Celery Worker未运行")
			
 
				+            return True
			
 
				+
			
 
				+        try:
			
 
				+            logger.info("立即停止Celery Worker...")
			
 
				+            self.shutdown_event.set()
			
 
				+
			
 
				+            # 设置超时事件，强制停止
			
 
				+            import signal
			
 
				+            import os
			
 
				+
			
 
				+            # 发送中断信号给当前进程
			
 
				+            if hasattr(os, 'kill'):
			
 
				+                try:
			
 
				+                    os.kill(os.getpid(), signal.SIGINT)
			
 
				+                    logger.info("已发送中断信号")
			
 
				+                except:
			
 
				+                    pass
			
 
				+
			
 
				+            # 立即设置状态为停止
			
 
				+            self.is_running = False
			
 
				+            self.shutdown_event.clear()
			
 
				+
			
 
				+            logger.info("Celery Worker已立即停止")
			
 
				+            return True
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"立即停止Celery Worker失败: {e}")
			
 
				+            # 即使失败也要设置状态
			
 
				+            self.is_running = False
			
 
				+            return False
			
 
				+
			
 
				+    def get_status(self):
			
 
				+        """获取Worker状态"""
			
 
				+        return {
			
 
				+            "is_running": self.is_running,
			
 
				+            "thread_alive": self.worker_thread.is_alive() if self.worker_thread else False,
			
 
				+        }
			
 
				+
			
 
				+    def __enter__(self):
			
 
				+        return self
			
 
				+
			
 
				+    def __exit__(self, exc_type, exc_val, exc_tb):
			
 
				+        self.stop_worker()
			
 
				+
			
 
				+
			
 
				+# 全局Worker管理器实例
			
 
				+celery_manager = CeleryWorkerManager()
			
 
				+
			
 
				+def start_celery_worker():
			
 
				+    """启动Celery Worker（同步方式，用于测试）"""
			
 
				+    return celery_manager.start_worker()
			
 
				+
			
 
				+def cleanup_redis_before_start():
			
 
				+    """启动前清理Redis中的残留Celery任务"""
			
 
				+    try:
			
 
				+        import redis
			
 
				+        from foundation.base.config import config_handler
			
 
				+
			
 
				+        # 连接Redis
			
 
				+        redis_host = config_handler.get('redis', 'REDIS_HOST', 'localhost')
			
 
				+        redis_port = config_handler.get('redis', 'REDIS_PORT', '6379')
			
 
				+        redis_password = config_handler.get('redis', 'REDIS_PASSWORD', '')
			
 
				 
			
 
				-def run_server(host: str = "127.0.0.1", port: int = 8034, reload: bool = True):
			
 
				+        if redis_password:
			
 
				+            redis_url = f'redis://:{redis_password}@{redis_host}:{redis_port}/0'
			
 
				+        else:
			
 
				+            redis_url = f'redis://{redis_host}:{redis_port}/0'
			
 
				+
			
 
				+        r = redis.from_url(redis_url, decode_responses=True)
			
 
				+
			
 
				+        logger.info("清理Redis中的残留Celery任务...")
			
 
				+
			
 
				+        # 清理所有Celery相关的键
			
 
				+        keys_to_delete = []
			
 
				+        for key in r.keys():
			
 
				+            if any(keyword in key.lower() for keyword in ['celery', 'task:']):
			
 
				+                keys_to_delete.append(key)
			
 
				+
			
 
				+        if keys_to_delete:
			
 
				+            for key in keys_to_delete:
			
 
				+                try:
			
 
				+                    r.delete(key)
			
 
				+                    logger.debug(f"已清理: {key}")
			
 
				+                except Exception as e:
			
 
				+                    logger.warning(f"清理 {key} 失败: {e}")
			
 
				+
			
 
				+            logger.info(f"成功清理 {len(keys_to_delete)} 个Redis键")
			
 
				+        else:
			
 
				+            logger.info("没有发现需要清理的残留任务")
			
 
				+
			
 
				+        return True
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"清理Redis残留任务失败: {e}")
			
 
				+        return False
			
 
				+
			
 
				+def start_celery_worker_background():
			
 
				+    """在后台启动Celery Worker（异步方式）"""
			
 
				+    # 启动前清理残留任务
			
 
				+    cleanup_redis_before_start()
			
 
				+
			
 
				+    # 添加调用栈调试
			
 
				+    import traceback
			
 
				+    logger.info("=== Celery Worker启动调用栈 ===")
			
 
				+    for line in traceback.format_stack():
			
 
				+        logger.debug(f"  {line.strip()}")
			
 
				+    logger.info("=== 调用栈结束 ===")
			
 
				+
			
 
				+    return celery_manager.start_worker()
			
 
				+
			
 
				+def stop_celery_worker():
			
 
				+    """停止Celery Worker"""
			
 
				+    global celery_manager
			
 
				+
			
 
				+    # 立即取消所有任务注册
			
 
				+    try:
			
 
				+        import redis
			
 
				+        from foundation.base.config import config_handler
			
 
				+
			
 
				+        # 连接Redis
			
 
				+        redis_host = config_handler.get('redis', 'REDIS_HOST', 'localhost')
			
 
				+        redis_port = config_handler.get('redis', 'REDIS_PORT', '6379')
			
 
				+        redis_password = config_handler.get('redis', 'REDIS_PASSWORD', '')
			
 
				+
			
 
				+        if redis_password:
			
 
				+            redis_url = f'redis://:{redis_password}@{redis_host}:{redis_port}/2'
			
 
				+        else:
			
 
				+            redis_url = f'redis://{redis_host}:{redis_port}/2'
			
 
				+
			
 
				+        r = redis.from_url(redis_url, decode_responses=True)
			
 
				+
			
 
				+        # 清理所有任务注册
			
 
				+        task_keys = r.keys('task:*')
			
 
				+        for key in task_keys:
			
 
				+            r.delete(key)
			
 
				+            logger.info(f"取消任务注册: {key}")
			
 
				+
			
 
				+        logger.info(f"已取消 {len(task_keys)} 个任务注册")
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"取消任务注册失败: {e}")
			
 
				+
			
 
				+    # 立即停止Worker，不等待
			
 
				+    return celery_manager.stop_worker_immediately()
			
 
				+
			
 
				+def run_server(host: str = "127.0.0.1", port: int = 8034, reload: bool = False,
			
 
				+                with_celery: bool = True):
			
 
				     """运行服务器"""
			
 
				-    if reload:
			
 
				-        # 重载模式需要正确的模块路径
			
 
				-        app_import_path = "views.construction_review.app:app"
			
 
				-        uvicorn.run(app_import_path, host=host, port=port, reload=reload)
			
 
				-    else:
			
 
				-        # 直接运行模式，直接使用app对象
			
 
				-        uvicorn.run(app, host=host, port=port)
			
 
				+
			
 
				+    if with_celery:
			
 
				+        # 启动Celery Worker
			
 
				+        start_celery_worker_background()
			
 
				+
			
 
				+        # 注册退出时的清理函数
			
 
				+        import atexit
			
 
				+        atexit.register(stop_celery_worker)
			
 
				+
			
 
				+        # 设置信号处理
			
 
				+        import signal
			
 
				+        def signal_handler(signum, frame):
			
 
				+            logger.info(f"收到信号 {signum}，正在停止服务...")
			
 
				+            stop_celery_worker()
			
 
				+            sys.exit(0)
			
 
				+
			
 
				+        # Windows和Unix系统的信号处理
			
 
				+        try:
			
 
				+            signal.signal(signal.SIGINT, signal_handler)  # Ctrl+C
			
 
				+            signal.signal(signal.SIGTERM, signal_handler)  # 终止信号
			
 
				+        except AttributeError:
			
 
				+            # Windows可能不支持某些信号
			
 
				+            pass
			
 
				+
			
 
				+        # Windows特有的控制台事件处理
			
 
				+        if sys.platform == 'win32':
			
 
				+            try:
			
 
				+                import win32api
			
 
				+                def win32_handler(dwCtrlType):
			
 
				+                    # 正确的控制台事件常量
			
 
				+                    CTRL_C_EVENT = 0
			
 
				+                    CTRL_BREAK_EVENT = 1
			
 
				+                    CTRL_CLOSE_EVENT = 2
			
 
				+                    CTRL_SHUTDOWN_EVENT = 6
			
 
				+
			
 
				+                    if dwCtrlType in (CTRL_C_EVENT, CTRL_BREAK_EVENT, CTRL_CLOSE_EVENT, CTRL_SHUTDOWN_EVENT):
			
 
				+                        logger.info(f"收到Windows控制台事件 {dwCtrlType}，正在停止服务...")
			
 
				+                        stop_celery_worker()
			
 
				+                        sys.exit(0)
			
 
				+                    return False
			
 
				+                win32api.SetConsoleCtrlHandler(win32_handler, True)
			
 
				+            except (ImportError, AttributeError) as e:
			
 
				+                # 如果win32api不可用，跳过Windows控制台处理
			
 
				+                logger.debug(f"Windows控制台事件处理不可用: {e}")
			
 
				+                pass
			
 
				+
			
 
				+    try:
			
 
				+        if reload:
			
 
				+            # 重载模式需要正确的模块路径
			
 
				+            app_import_path = "views.construction_review.app:app"
			
 
				+            uvicorn.run(app_import_path, host=host, port=port, reload=reload)
			
 
				+        else:
			
 
				+            # 直接运行模式，直接使用app对象
			
 
				+            uvicorn.run(app, host=host, port=port)
			
 
				+    finally:
			
 
				+        if with_celery:
			
 
				+            stop_celery_worker()
			
 
				+
			
 
				+
			
 
				+app = create_app()
			
 
				 
			
 
				 
			
 
				 if __name__ == "__main__":
			
 
				-    run_server(reload=True)  # 直接运行时关闭重载
			
 
				+    import argparse
			
 
				+
			
 
				+    parser = argparse.ArgumentParser(description='施工方案审查API服务')
			
 
				+    parser.add_argument('--host', default='127.0.0.1', help='服务器地址')
			
 
				+    parser.add_argument('--port', type=int, default=8035, help='服务器端口')
			
 
				+    parser.add_argument('--no-celery', action='store_true', help='不启动Celery Worker')
			
 
				+    parser.add_argument('--no-reload', action='store_true', help='关闭热重载')
			
 
				+
			
 
				+    args = parser.parse_args()
			
 
				+
			
 
				+    logger.info("施工方案审查API服务启动中...")
			
 
				+    logger.info(f"服务地址: http://{args.host}:{args.port}")
			
 
				+    logger.info(f"API文档: http://{args.host}:{args.port}/docs")
			
 
				+    logger.info(f"健康检查: http://{args.host}:{args.port}/health")
			
 
				+
			
 
				+    if not args.no_celery:
			
 
				+        logger.info("Celery Worker: 已集成启动")
			
 
				+    else:
			
 
				+        logger.warning("Celery Worker: 已禁用")
			
 
				+
			
 
				+    run_server(
			
 
				+        host=args.host,
			
 
				+        port=args.port,
			
 
				+        reload=False,
			
 
				+        with_celery=not args.no_celery
			
 
				+    )
			
--- a/views/construction_review/file_upload.py
+++ b/views/construction_review/file_upload.py
@@ -3,13 +3,16 @@
 
				 模拟文件上传功能，返回文件ID和回调任务ID
			
 
				 """
			
 
				 import ast
			
 
				+import traceback
			
 
				 import uuid
			
 
				 import time
			
 
				 from datetime import datetime
			
 
				 from fastapi import APIRouter, UploadFile, File, Form, HTTPException
			
 
				 from pydantic import BaseModel
			
 
				 from typing import Optional,List
			
 
				-from core.construction_review.workflows.document_ans import DocumentParse
			
 
				+from foundation.utils import md5
			
 
				+from core.base.redis_duplicate_checker import RedisDuplicateChecker
			
 
				+from core.base.workflow_manager import WorkflowManager
			
 
				 from foundation.logger.loggering import server_logger as logger
			
 
				 from foundation.base.config import config_handler
			
 
				 from .schemas.error_schemas import FileUploadErrors
			
@@ -18,59 +21,64 @@ from .schemas.error_schemas import FileUploadErrors
 
				 
			
 
				 file_upload_router = APIRouter(prefix="/sgsc", tags=["文档上传"])
			
 
				 uploaded_files = {}
			
 
				+# 初始化工作流管理器
			
 
				+workflow_manager = WorkflowManager(
			
 
				+    max_concurrent_docs=3,
			
 
				+    max_concurrent_reviews=5
			
 
				+)
			
 
				+# 使用workflow_manager的duplicatechecker实例，确保一致性
			
 
				+duplicatechecker = workflow_manager.redis_duplicate_checker
			
 
				 
			
 
				 class FileUploadResponse(BaseModel):
			
 
				     code: int
			
 
				     data: dict
			
 
				 
			
 
				-def validate_file(file: UploadFile) -> None:
			
 
				-    """验证文件格式和大小"""
			
 
				-    # 检查文件是否存在
			
 
				+def get_file_size(file: UploadFile) -> int:
			
 
				+    """获取文件大小的可靠同步方法（兼容 seek 仅支持单参数的情况）"""
			
 
				+    try:
			
 
				+        content = file.file.read()
			
 
				+        size = len(content)
			
 
				+        file.file.seek(0)
			
 
				+        size_mb = size / (1024 * 1024)
			
 
				+        return size,round(size_mb, 2)
			
 
				+    except Exception as e:
			
 
				+        logger.warning(f"获取文件大小失败: {str(e)}")
			
 
				+        return 0, 0.0  
			
 
				+
			
 
				+def validate_file(file: UploadFile, file_content: bytes = None) -> None:
			
 
				+    """验证文件格式"""
			
 
				+
			
 
				+    file_extension = '.' + file.filename.split('.')[-1].lower() if '.' in file.filename else ''
			
 
				+    # 检测文件类型
			
 
				+    actual_file_type = 'unknown'
			
 
				+
			
 
				+    if file_content.startswith(b'%PDF'):
			
 
				+        actual_file_type = 'pdf'
			
 
				+    elif file_content.startswith(b'PK\x03\x04'):
			
 
				+        if file_extension in ['.docx'] or file_extension in ['.doc'] :
			
 
				+            actual_file_type = 'docx/doc'
			
 
				+        else:
			
 
				+            logger.warning(f"未知文件类型，: {file_content[:20]}")
			
 
				+            raise FileUploadErrors.file_format_unsupported()
			
 
				+    else:
			
 
				+        logger.warning(f"未知文件类型，: {file_content[:20]}")
			
 
				+        raise FileUploadErrors.file_format_unsupported()
			
 
				 
			
 
				-    if not file or not file.filename:
			
 
				-        raise FileUploadErrors.file_missing()
			
 
				 
			
 
				-    # 检查文件大小（Mock中假设文件大小合理，实际应该读取文件内容）
			
 
				-    # 这里可以添加文件大小检查逻辑
			
 
				-    file_size = getattr(file, 'size', None)
			
 
				-    if file_size is not None and file_size == 0:
			
 
				-        raise FileUploadErrors.file_rejected("文件为空")
			
 
				 
			
 
				-    # 支持的文件类型
			
 
				-    allowed_mime_types = {
			
 
				-        'application/pdf',
			
 
				-        'application/msword',
			
 
				-        'application/vnd.openxmlformats-officedocument.wordprocessingml.document'
			
 
				-    }
			
 
				 
			
 
				-    # 检查文件格式
			
 
				-    if file.content_type not in allowed_mime_types:
			
 
				-        raise FileUploadErrors.file_format_unsupported()
			
 
				+    logger.info(f"文件类型验证通过: {actual_file_type} (扩展名: {file_extension}, MIME: {file.content_type})")
			
 
				 
			
 
				 @file_upload_router.post("/file_upload", response_model=FileUploadResponse)
			
 
				 async def file_upload(
			
 
				-    file: List[UploadFile] = File([]),  # 改为文件列表，支持多文件检测
			
 
				+    file: List[UploadFile] = File([]),  
			
 
				     callback_url: str = Form(None),
			
 
				     project_plan_type: str = Form(None),
			
 
				-    user: str = Form(None)  # 用户参数从表单获取，不从配置获取
			
 
				+    user: str = Form(None)  
			
 
				 ):
			
 
				     """
			
 
				     文件上传接口
			
 
				     """
			
 
				-
			
 
				-    # 调试日志信息
			
 
				-    logger.info(f"文件上传请求 - 用户: {user}, 文件数量: {len(file) if file else 0}",
			
 
				-                log_type="upload", trace_id=f"upload-{int(time.time())}")
			
 
				-
			
 
				-    # 记录每个文件的信息
			
 
				-    if file:
			
 
				-        for i, f in enumerate(file):
			
 
				-            file_size = getattr(f, 'size', 0)  # 安全获取文件大小，避免属性不存在错误
			
 
				-            logger.info(f"文件 {i+1}: {f.filename}, 大小: {file_size}, 类型: {f.content_type}", log_type="upload")
			
 
				-    logger.info(f"请求参数 - 回调URL: {callback_url}, 工程类型: {project_plan_type}",
			
 
				-                log_type="upload")
			
 
				-    logger.info(f"用户标识: {user}")
			
 
				-
			
 
				     try:
			
 
				         # 验证工程方案类型
			
 
				         valid_project_types = {
			
@@ -81,17 +89,34 @@ async def file_upload(
 
				         valid_users = ast.literal_eval(config_handler.get("user_lists", "USERS"))
			
 
				         
			
 
				         # 验证文件上传
			
 
				+
			
 
				         if not file or len(file) == 0:
			
 
				             raise FileUploadErrors.file_missing()
			
 
				+        elif not file[0].filename:
			
 
				+            raise FileUploadErrors.file_missing()
			
 
				         elif len(file) > 1:
			
 
				+            logger.info(f"文件上传请求 - 用户: {user}, 文件数量: {len(file) if file else 0}",
			
 
				+            log_type="upload", trace_id=f"upload-{int(time.time())}")
			
 
				             raise FileUploadErrors.file_multiple()
			
 
				         
			
 
				-        
			
 
				-
			
 
				-        # 验证文件格式和大小（只验证第一个文件）
			
 
				-
			
 
				+        # 验证文件数量
			
 
				         if file and len(file) > 0:
			
 
				-            validate_file(file[0])
			
 
				+            try:
			
 
				+                content = file[0].file.read()
			
 
				+                file[0].file.seek(0)  # 重置文件指针
			
 
				+            except:
			
 
				+                content = b""
			
 
				+            validate_file(file[0], content)
			
 
				+
			
 
				+        # 验证文件格式
			
 
				+        file_size, file_size_mb = get_file_size(file[0])
			
 
				+        if file_size == 0:
			
 
				+            raise FileUploadErrors.file_missing()
			
 
				+
			
 
				+        # 验证文件大小限制
			
 
				+        if file_size_mb > 30:  # 文件大小不能超过30MB
			
 
				+            raise FileUploadErrors.file_size_exceeded()
			
 
				+        
			
 
				         # 验证回调地址
			
 
				         if callback_url is '':
			
 
				             raise FileUploadErrors.callback_url_missing()
			
@@ -104,59 +129,82 @@ async def file_upload(
 
				         if project_plan_type not in valid_project_types:
			
 
				             raise FileUploadErrors.project_plan_type_invalid()
			
 
				 
			
 
				-        # 生成文件ID和回调任务ID
			
 
				-        file_id = str(uuid.uuid4())
			
 
				+        # 生成文件MD5ID
			
 
				+        file_id = md5.md5_id(content)
			
 
				+        if await duplicatechecker.is_duplicate_task(file_id):
			
 
				+            raise FileUploadErrors.task_already_exists()
			
 
				+
			
 
				         created_at = int(time.time())
			
 
				-        callback_task_id = f"{file_id}-{created_at}"
			
 
				 
			
 
				-        # 保存文件信息
			
 
				+        # 详细文件信息调试
			
 
				+        logger.info(f"=== 文件详细信息 ===")
			
 
				+        logger.info(f"文件名: {file[0].filename}")
			
 
				+        logger.info(f"文件扩展名: {file[0].filename.split('.')[-1] if '.' in file[0].filename else '无扩展名'}")
			
 
				+        logger.info(f"文件头信息: {content[:50] if 'content' in locals() else '未读取'}")
			
 
				+        logger.info(f"文件大小: {file_size_mb} MB")
			
 
				+        logger.info(f"========================", log_type="upload")
			
 
				+        logger.info(f"请求参数 - 回调URL: {callback_url}\n, 工程类型: {project_plan_type}",
			
 
				+                    log_type="upload")
			
 
				+        logger.info(f"用户标识: {user}")
			
 
				+
			
 
				+        # 确定文件类型
			
 
				+        file_extension = file[0].filename.split('.')[-1].lower() if '.' in file[0].filename else ''
			
 
				+        if content.startswith(b'%PDF'):
			
 
				+            file_type = 'pdf'
			
 
				+        elif content.startswith(b'PK\x03\x04') and file_extension in ['docx', 'doc']:
			
 
				+            file_type = 'docx'
			
 
				+        else:
			
 
				+            file_type = 'unknown'
			
 
				+
			
 
				+
			
 
				+        # 生成回调任务ID
			
 
				+        callback_task_id = f"chain-{file_id}-{int(datetime.now().timestamp())}"
			
 
				+
			
 
				+        # 记录文件信息
			
 
				         file_info = {
			
 
				-            "id": file_id,
			
 
				-            "name": file[0].filename,
			
 
				-            "size": 1024 * 1024,  # 文件大小 1MB
			
 
				-            "created_at": created_at,
			
 
				-            "status": "success",
			
 
				-            "callback_task_id": callback_task_id,
			
 
				-            "callback_url": callback_url,
			
 
				-            "project_plan_type": project_plan_type,
			
 
				-            "user": user,
			
 
				-            "upload_time": datetime.now().isoformat()
			
 
				-        }
			
 
				+                'file_id': file_id,
			
 
				+                'file_content': content,
			
 
				+                'user_id': user,
			
 
				+                'file_type': file_type,
			
 
				+                'callback_task_id': callback_task_id,
			
 
				+                "file_name": file[0].filename,
			
 
				+                "file_size": file_size_mb,
			
 
				+                "project_plan_type": project_plan_type,
			
 
				+                'updated_at': created_at
			
 
				+            }
			
 
				 
			
 
				-        # 文档处理（暂时注释，等文件保存逻辑实现后再启用）
			
 
				-        # DocumentParse.document_parse(file_path)
			
 
				-
			
 
				-        uploaded_files[file_id] = file_info
			
 
				-        uploaded_files[callback_task_id] = {
			
 
				-            "file_id": file_id,
			
 
				-            "user": user,
			
 
				-            "review_task_status": "processing",
			
 
				-            "overall_progress": 0,
			
 
				-            "stages": [
			
 
				-                {"stage_name": "文件上传", "progress": 100, "stage_status": "completed"},
			
 
				-                {"stage_name": "格式校验", "progress": 0, "stage_status": "pending"},
			
 
				-                {"stage_name": "内容提取", "progress": 0, "stage_status": "pending"},
			
 
				-                {"stage_name": "智能审查", "progress": 0, "stage_status": "pending"}
			
 
				-            ],
			
 
				-            "updated_at": int(time.time()),
			
 
				-            "estimated_remaining": 1800  # 预计30分钟
			
 
				-        }
			
 
				+        try:
			
 
				+            # 提交处理任务到工作流管理器
			
 
				+            await workflow_manager.submit_task_processing(file_info)
			
 
				+            logger.info(f"文档处理任务已提交，任务ID: {callback_task_id}")
			
 
				 
			
 
				-        return FileUploadResponse(
			
 
				-            code=200,
			
 
				-            data={
			
 
				-                "id": file_id,
			
 
				-                "name": file[0].filename,
			
 
				-                "size": file_info["size"],
			
 
				-                "created_at": file_info["created_at"],
			
 
				-                "status": "success",
			
 
				-                "callback_task_id": callback_task_id
			
 
				-            }
			
 
				-        )
			
 
				+
			
 
				+
			
 
				+            return FileUploadResponse(
			
 
				+                code=200,
			
 
				+                data={
			
 
				+                    "id": file_info['file_id'],
			
 
				+                    "name": file_info['file_name'],
			
 
				+                    "size": file_size_mb,
			
 
				+                    "created_at": created_at,
			
 
				+                    "status": "processing",
			
 
				+                    "callback_task_id": file_info['callback_task_id']
			
 
				+                }
			
 
				+            )
			
 
				+
			
 
				+        except Exception as workflow_error:
			
 
				+            logger.error(f"工作流提交失败: {str(workflow_error)}")
			
 
				+            raise FileUploadErrors.internal_error(workflow_error)
			
 
				 
			
 
				     except HTTPException:
			
 
				+        logger.error(f"HTTP异常: {traceback.format_exc()}")
			
 
				         raise
			
 
				     except Exception as e:
			
 
				+        logger.error(f"文件上传失败: {str(e)}")
			
 
				+        logger.error(f"错误详情: {traceback.format_exc()}")
			
 
				         raise FileUploadErrors.internal_error(e)
			
 
				 
			
 
				 
			
 
				+
			
 
				+
			
 
				+
			
--- a/views/construction_review/schemas/error_schemas.py
+++ b/views/construction_review/schemas/error_schemas.py
@@ -5,7 +5,7 @@
 
				 
			
 
				 from typing import Dict, Any
			
 
				 from fastapi import HTTPException
			
 
				-
			
 
				+from foundation.logger.loggering import server_logger as logger
			
 
				 
			
 
				 class ErrorCodes:
			
 
				     """错误码常量定义"""
			
@@ -42,14 +42,14 @@ class ErrorCodes:
 
				     WJSC005 = {
			
 
				         "code": "WJSC005",
			
 
				         "error_type": "FILE_SIZE_EXCEEDED",
			
 
				-        "message": "文件过大（最大30MB）",
			
 
				+        "message": "文件过大（最大不超过30MB）",
			
 
				         "status_code": 400
			
 
				     }
			
 
				 
			
 
				     WJSC006 = {
			
 
				         "code": "WJSC006",
			
 
				         "error_type": "PROJECT_PLAN_TYPE_INVALID",
			
 
				-        "message": "工程方案类型无效（未注册）",
			
 
				+        "message": "无效工程方案类型（未提供或未注册）",
			
 
				         "status_code": 400
			
 
				     }
			
 
				 
			
@@ -63,7 +63,7 @@ class ErrorCodes:
 
				     WJSC008 = {
			
 
				         "code": "WJSC008",
			
 
				         "error_type": "INVALID_USER",
			
 
				-        "message": "用户标识（user）无效",
			
 
				+        "message": "用户标识未提供或无效",
			
 
				         "status_code": 403
			
 
				     }
			
 
				 
			
@@ -76,6 +76,13 @@ class ErrorCodes:
 
				 
			
 
				     WJSC010 = {
			
 
				         "code": "WJSC010",
			
 
				+        "error_type": "TASK_ALREADY_EXISTS",
			
 
				+        "message": "任务已存在，请勿重复提交",
			
 
				+        "status_code": 409
			
 
				+    }
			
 
				+
			
 
				+    WJSC011 = {
			
 
				+        "code": "WJSC011",
			
 
				         "error_type": "INTERNAL_ERROR",
			
 
				         "message": "服务端内部错误",
			
 
				         "status_code": 500
			
@@ -106,7 +113,7 @@ class ErrorCodes:
 
				     JDLX004 = {
			
 
				         "code": "JDLX004",
			
 
				         "error_type": "INVALID_USER",
			
 
				-        "message": "用户标识（user）无效",
			
 
				+        "message": "用户标识未提供或无效",
			
 
				         "status_code": 403
			
 
				     }
			
 
				 
			
@@ -156,7 +163,7 @@ class ErrorCodes:
 
				     SCJG005 = {
			
 
				         "code": "SCJG005",
			
 
				         "error_type": "INVALID_USER",
			
 
				-        "message": "用户标识无效",
			
 
				+        "message": "用户标识未提供或无效",
			
 
				         "status_code": 403
			
 
				     }
			
 
				 
			
@@ -217,7 +224,7 @@ def create_server_error(error_code: str, original_error: Exception) -> HTTPExcep
 
				         HTTPException: FastAPI异常对象
			
 
				     """
			
 
				     error_map = {
			
 
				-        "WJSC008": ErrorCodes.WJSC008,
			
 
				+        "WJSC011": ErrorCodes.WJSC011,
			
 
				         "JDLX006": ErrorCodes.JDLX006,
			
 
				         "SCJG008": ErrorCodes.SCJG008
			
 
				     }
			
@@ -234,43 +241,59 @@ class FileUploadErrors:
 
				 
			
 
				     @staticmethod
			
 
				     def file_missing():
			
 
				+        logger.error(ErrorCodes.WJSC001)
			
 
				         return create_http_exception(ErrorCodes.WJSC001)
			
 
				 
			
 
				     @staticmethod
			
 
				     def file_multiple():
			
 
				+        logger.error(ErrorCodes.WJSC002)
			
 
				         return create_http_exception(ErrorCodes.WJSC002)
			
 
				 
			
 
				     @staticmethod
			
 
				     def file_rejected(message: str = None):
			
 
				+        logger.error(ErrorCodes.WJSC003)
			
 
				         return create_http_exception(ErrorCodes.WJSC003, message)
			
 
				 
			
 
				     @staticmethod
			
 
				     def file_format_unsupported():
			
 
				+        logger.error(ErrorCodes.WJSC004)
			
 
				         return create_http_exception(ErrorCodes.WJSC004)
			
 
				 
			
 
				     @staticmethod
			
 
				     def file_size_exceeded():
			
 
				+        logger.error(ErrorCodes.WJSC005)
			
 
				         return create_http_exception(ErrorCodes.WJSC005)
			
 
				 
			
 
				     @staticmethod
			
 
				     def project_plan_type_invalid():
			
 
				+        logger.error(ErrorCodes.WJSC006)
			
 
				         return create_http_exception(ErrorCodes.WJSC006)
			
 
				 
			
 
				     @staticmethod
			
 
				     def unauthorized():
			
 
				+        logger.error(ErrorCodes.WJSC007)
			
 
				         return create_http_exception(ErrorCodes.WJSC007)
			
 
				     
			
 
				     @staticmethod
			
 
				     def invalid_user():
			
 
				+        logger.error(ErrorCodes.WJSC008)
			
 
				         return create_http_exception(ErrorCodes.WJSC008)
			
 
				     
			
 
				     @staticmethod
			
 
				     def callback_url_missing():
			
 
				+        logger.error(ErrorCodes.WJSC009)
			
 
				         return create_http_exception(ErrorCodes.WJSC009)
			
 
				 
			
 
				+
			
 
				+    @staticmethod
			
 
				+    def task_already_exists():
			
 
				+        logger.error(ErrorCodes.WJSC010)
			
 
				+        return create_http_exception(ErrorCodes.WJSC010)
			
 
				+
			
 
				     @staticmethod
			
 
				     def internal_error(original_error: Exception):
			
 
				-        return create_server_error("WJSC010", original_error)
			
 
				+        logger.error(ErrorCodes.WJSC011)
			
 
				+        return create_server_error("WJSC011", original_error)
			
 
				 
			
 
				 
			
 
				 class TaskProgressErrors:
			
@@ -278,26 +301,32 @@ class TaskProgressErrors:
 
				 
			
 
				     @staticmethod
			
 
				     def missing_parameters():
			
 
				+        logger.error(ErrorCodes.JDLX001)
			
 
				         return create_http_exception(ErrorCodes.JDLX001)
			
 
				 
			
 
				     @staticmethod
			
 
				     def invalid_param_format():
			
 
				+        logger.error(ErrorCodes.JDLX002)
			
 
				         return create_http_exception(ErrorCodes.JDLX002)
			
 
				 
			
 
				     @staticmethod
			
 
				     def unauthorized():
			
 
				+        logger.error(ErrorCodes.JDLX003)
			
 
				         return create_http_exception(ErrorCodes.JDLX003)
			
 
				 
			
 
				     @staticmethod
			
 
				     def invalid_user():
			
 
				+        logger.error(ErrorCodes.JDLX004)
			
 
				         return create_http_exception(ErrorCodes.JDLX004)
			
 
				 
			
 
				     @staticmethod
			
 
				     def task_not_found():
			
 
				+        logger.error(ErrorCodes.JDLX005)
			
 
				         return create_http_exception(ErrorCodes.JDLX005)
			
 
				 
			
 
				     @staticmethod
			
 
				     def server_internal_error(original_error: Exception):
			
 
				+        logger.error(ErrorCodes.JDLX006, original_error)
			
 
				         return create_server_error("JDLX006", original_error)
			
 
				 
			
 
				 
			
@@ -306,32 +335,40 @@ class ReviewResultsErrors:
 
				 
			
 
				     @staticmethod
			
 
				     def invalid_type():
			
 
				+        logger.error(ErrorCodes.SCJG001)
			
 
				         return create_http_exception(ErrorCodes.SCJG001)
			
 
				 
			
 
				     @staticmethod
			
 
				     def missing_param_id():
			
 
				+        logger.error(ErrorCodes.SCJG002)
			
 
				         return create_http_exception(ErrorCodes.SCJG002)
			
 
				 
			
 
				     @staticmethod
			
 
				     def invalid_id_format():
			
 
				+        logger.error(ErrorCodes.SCJG003)
			
 
				         return create_http_exception(ErrorCodes.SCJG003)
			
 
				 
			
 
				     @staticmethod
			
 
				     def unauthorized():
			
 
				+        logger.error(ErrorCodes.SCJG004)
			
 
				         return create_http_exception(ErrorCodes.SCJG004)
			
 
				 
			
 
				     @staticmethod
			
 
				     def invalid_user():
			
 
				+        logger.error(ErrorCodes.SCJG005)
			
 
				         return create_http_exception(ErrorCodes.SCJG005)
			
 
				 
			
 
				     @staticmethod
			
 
				     def task_not_found():
			
 
				+        logger.error(ErrorCodes.SCJG006)
			
 
				         return create_http_exception(ErrorCodes.SCJG006)
			
 
				 
			
 
				     @staticmethod
			
 
				     def no_review_results():
			
 
				+        logger.error(ErrorCodes.SCJG007)
			
 
				         return create_http_exception(ErrorCodes.SCJG007)
			
 
				 
			
 
				     @staticmethod
			
 
				     def server_error(original_error: Exception):
			
 
				+        logger.error(ErrorCodes.SCJG008)
			
 
				         return create_server_error("SCJG008", original_error)
			
--- a/views/construction_review/task_progress.py
+++ b/views/construction_review/task_progress.py
@@ -1,6 +1,6 @@
 
				 """
			
 
				-审查进度轮询接口Mock实现
			
 
				-模拟任务进度更新，支持多阶段进度展示
			
 
				+审查进度轮询接口
			
 
				+支持Celery任务状态查询和进度展示
			
 
				 """
			
 
				 
			
 
				 import time
			
@@ -9,14 +9,11 @@ from datetime import datetime
 
				 from fastapi import APIRouter, HTTPException, Query
			
 
				 from pydantic import BaseModel
			
 
				 from typing import Optional
			
 
				+from celery.result import AsyncResult
			
 
				+from foundation.base.celery_app import app
			
 
				 
			
 
				-task_progress_router = APIRouter(prefix="/sgsc", tags=["进度轮询Mock"])
			
 
				+task_progress_router = APIRouter(prefix="/sgsc", tags=["进度轮询"])
			
 
				 
			
 
				-# 导入文件上传模块的存储
			
 
				-try:
			
 
				-    from .file_upload import uploaded_files
			
 
				-except ImportError:
			
 
				-    from views.construction_review.file_upload import uploaded_files
			
 
				 
			
 
				 # 导入错误码定义
			
 
				 from .schemas.error_schemas import TaskProgressErrors
			
@@ -104,7 +101,7 @@ async def task_progress(
 
				     user: str = Query(None)
			
 
				 ):
			
 
				     """
			
 
				-    Mock任务进度轮询接口
			
 
				+    任务进度轮询接口
			
 
				     """
			
 
				     try:
			
 
				         # 验证参数
			
@@ -143,8 +140,7 @@ async def task_progress(
 
				                 "review_task_status": updated_task["review_task_status"],
			
 
				                 "overall_progress": updated_task["overall_progress"],
			
 
				                 "stages": updated_task["stages"],
			
 
				-                "updated_at": updated_task["updated_at"],
			
 
				-                "estimated_remaining": updated_task["estimated_remaining"]
			
 
				+                "updated_at": updated_task["updated_at"]
			
 
				             }
			
 
				         )