2 viikkoa sitten · 46fc37cf1e
--- a/core/construction_review/component/ai_review_engine.py
+++ b/core/construction_review/component/ai_review_engine.py
@@ -1129,6 +1129,107 @@ class AIReviewEngine(BaseReviewer):
 
				                 }
			
 
				             }
			
 
				         
			
 
				+    async def timeliness_content_reviewer(self, review_data: Dict[str, Any], trace_id: str,
			
 
				+                                state: dict = None, stage_name: str = None) -> Dict[str, Any]:
			
 
				+        """
			
 
				+        执行三级分类内容时效性审查：检查tertiary_classification_details中引用的规范是否过时
			
 
				+
			
 
				+        Args:
			
 
				+            review_data: 待审查数据，包含tertiary_classification_details
			
 
				+            trace_id: 追踪ID
			
 
				+            state: 状态字典
			
 
				+            stage_name: 阶段名称
			
 
				+
			
 
				+        Returns:
			
 
				+            审查结果字典，包含内容时效性审查结果
			
 
				+        """
			
 
				+        start_time = time.time()
			
 
				+        try:
			
 
				+            logger.info(f"开始三级分类内容时效性审查，trace_id: {trace_id}")
			
 
				+
			
 
				+            # 提取三级分类详情
			
 
				+            tertiary_details = review_data.get('tertiary_classification_details', [])
			
 
				+            max_concurrent = review_data.get('max_concurrent', 4)
			
 
				+
			
 
				+            if not tertiary_details:
			
 
				+                logger.warning("三级分类详情为空，将跳过内容时效性审查")
			
 
				+                return {
			
 
				+                    "timeliness_content_review_results": {
			
 
				+                        "review_results": [],
			
 
				+                        "total_items": 0,
			
 
				+                        "issue_items": 0,
			
 
				+                        "execution_time": time.time() - start_time,
			
 
				+                        "error_message": None,
			
 
				+                        "message": "未找到三级分类详情，跳过内容时效性审查"
			
 
				+                    }
			
 
				+                }
			
 
				+
			
 
				+            logger.info(f"提取到 {len(tertiary_details)} 个三级分类详情")
			
 
				+
			
 
				+            # 调用内容时效性审查
			
 
				+            try:
			
 
				+                # 使用信号量控制并发
			
 
				+                async with self.semaphore:
			
 
				+                    # 从state中获取progress_manager和callback_task_id
			
 
				+                    progress_manager = state.get('progress_manager') if state else None
			
 
				+                    callback_task_id = state.get('callback_task_id') if state else None
			
 
				+
			
 
				+                    # 调用内容时效性审查器
			
 
				+                    from core.construction_review.component.reviewers.timeliness_content_reviewer import ContentTimelinessReviewer
			
 
				+                    async with ContentTimelinessReviewer(max_concurrent=max_concurrent) as reviewer:
			
 
				+                        timeliness_content_results = await reviewer.review_tertiary_content(
			
 
				+                            tertiary_details=tertiary_details,
			
 
				+                            collection_name="first_bfp_collection_status",
			
 
				+                            progress_manager=progress_manager,
			
 
				+                            callback_task_id=callback_task_id
			
 
				+                        )
			
 
				+
			
 
				+                    logger.info(f"内容时效性审查完成，发现问题数量: {len(timeliness_content_results)}")
			
 
				+
			
 
				+                    # 统计审查结果
			
 
				+                    total_items = len(timeliness_content_results)
			
 
				+                    issue_items = sum(1 for item in timeliness_content_results if item.get('exist_issue', False))
			
 
				+
			
 
				+                    logger.info(f"审查统计 - 总规范引用: {total_items}, 问题项: {issue_items}")
			
 
				+
			
 
				+            except Exception as e:
			
 
				+                logger.error(f"内容时效性审查失败: {str(e)}")
			
 
				+                return {
			
 
				+                    "timeliness_content_review_results": {
			
 
				+                        "review_results": [],
			
 
				+                        "total_items": 0,
			
 
				+                        "issue_items": 0,
			
 
				+                        "execution_time": time.time() - start_time,
			
 
				+                        "error_message": f"内容时效性审查失败: {str(e)}"
			
 
				+                    }
			
 
				+                }
			
 
				+
			
 
				+            # 返回完整结果
			
 
				+            return {
			
 
				+                "timeliness_content_review_results": {
			
 
				+                    "review_results": timeliness_content_results,
			
 
				+                    "total_items": total_items,
			
 
				+                    "issue_items": issue_items,
			
 
				+                    "execution_time": time.time() - start_time,
			
 
				+                    "error_message": None
			
 
				+                }
			
 
				+            }
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            execution_time = time.time() - start_time
			
 
				+            error_msg = f"内容时效性审查失败: {str(e)}"
			
 
				+            logger.error(error_msg, exc_info=True)
			
 
				+
			
 
				+            return {
			
 
				+                "timeliness_content_review_results": {
			
 
				+                    "review_results": [],
			
 
				+                    "total_items": 0,
			
 
				+                    "issue_items": 0,
			
 
				+                    "execution_time": execution_time,
			
 
				+                    "error_message": error_msg
			
 
				+                }
			
 
				+            }
			
 
				+
			
 
				     async def timeliness_basis_reviewer(self, review_data: Dict[str, Any], trace_id: str,
			
 
				                                 state: dict = None, stage_name: str = None) -> Dict[str, Any]:
			
 
				         """
			
--- a/core/construction_review/component/reviewers/timeliness_basis_reviewer.py
+++ b/core/construction_review/component/reviewers/timeliness_basis_reviewer.py
@@ -224,12 +224,44 @@ class BasisReviewService:
 
				                 
			
 
				                 # 获取match_reference_files的结果并过滤
			
 
				                 match_result = await match_reference_files(reference_text=grouped_candidates, review_text=basis_items)
			
 
				-                # 解析JSON并过滤：same_name_current和exact_match_info都是""的项过滤掉
			
 
				+
			
 
				+                # 记录完整的匹配结果用于调试
			
 
				+                logger.info(f"批次 match_reference_files 原始结果: {match_result[:500]}...")
			
 
				+
			
 
				+                # 解析JSON并过滤：保留有相关信息的项
			
 
				                 try:
			
 
				                     match_data = json.loads(match_result)
			
 
				                     # 提取items字段（match_reference_files返回{items: [...]}格式）
			
 
				                     items = match_data.get('items', match_data) if isinstance(match_data, dict) else match_data
			
 
				-                    filtered_data = [item for item in items if item.get('exact_match_info') != ""]
			
 
				+
			
 
				+                    logger.info(f"解析到 {len(items)} 个匹配项")
			
 
				+                    for idx, item in enumerate(items):
			
 
				+                        logger.info(f"  项{idx}: review_item={item.get('review_item', 'unknown')}, "
			
 
				+                                  f"has_related_file={item.get('has_related_file')}, "
			
 
				+                                  f"exact_match_info={item.get('exact_match_info')}, "
			
 
				+                                  f"same_name_current={item.get('same_name_current')}")
			
 
				+
			
 
				+                    # 放宽过滤条件：只要有相关文件信息就进行审查
			
 
				+                    filtered_data = [
			
 
				+                        item for item in items
			
 
				+                        if item.get('has_related_file') or
			
 
				+                           item.get('exact_match_info') or
			
 
				+                           item.get('same_name_current')
			
 
				+                    ]
			
 
				+
			
 
				+                    logger.info(f"过滤后保留 {len(filtered_data)} 个项")
			
 
				+
			
 
				+                    # 记录被过滤掉的项目用于调试
			
 
				+                    skipped_items = [
			
 
				+                        item for item in items
			
 
				+                        if not (item.get('has_related_file') or
			
 
				+                               item.get('exact_match_info') or
			
 
				+                               item.get('same_name_current'))
			
 
				+                    ]
			
 
				+                    if skipped_items:
			
 
				+                        logger.warning(f"跳过了 {len(skipped_items)} 个无参考信息的编制依据: "
			
 
				+                                     f"{[item.get('review_item', 'unknown') for item in skipped_items]}")
			
 
				+
			
 
				                     # 如果没有过滤出数据，直接返回空结果
			
 
				                     if not filtered_data:
			
 
				                         logger.info(f"过滤后没有符合条件的编制依据，跳过后续检查")
			
--- a/core/construction_review/component/reviewers/timeliness_content_reviewer.py
+++ b/core/construction_review/component/reviewers/timeliness_content_reviewer.py
@@ -0,0 +1,487 @@
 
				+#!/usr/bin/env python
			
 
				+# -*- coding: utf-8 -*-
			
 
				+"""
			
 
				+三级分类内容时效性审查模块
			
 
				+
			
 
				+功能：从三级分类详情的content字段中提取规范引用，并进行时效性审查。
			
 
				+主要用于检测文本内容中引用的规范是否过时（如JTG B01-2011应更新为JTG B01-2014）。
			
 
				+"""
			
 
				+
			
 
				+import re
			
 
				+import json
			
 
				+import asyncio
			
 
				+from typing import Any, Dict, List, Optional, Tuple
			
 
				+from dataclasses import dataclass, field
			
 
				+from functools import partial
			
 
				+
			
 
				+from foundation.observability.logger.loggering import review_logger as logger
			
 
				+from core.construction_review.component.reviewers.utils.reference_matcher import match_reference_files
			
 
				+from core.construction_review.component.reviewers.utils.timeliness_determiner import determine_timeliness_issue
			
 
				+from core.construction_review.component.reviewers.timeliness_basis_reviewer import BasisSearchEngine, StandardizedResponseProcessor
			
 
				+
			
 
				+
			
 
				+@dataclass
			
 
				+class StandardReference:
			
 
				+    """规范引用数据类"""
			
 
				+    original_text: str           # 原始文本，如"《公路工程技术标准》（JTG B01-2011）"
			
 
				+    name: str                    # 规范名称，如"公路工程技术标准"
			
 
				+    number: str                  # 规范编号，如"JTG B01-2011"
			
 
				+    context: str                 # 上下文内容
			
 
				+    location_info: Dict[str, Any] = field(default_factory=dict)  # 位置信息
			
 
				+
			
 
				+
			
 
				+@dataclass
			
 
				+class ContentTimelinessResult:
			
 
				+    """内容时效性审查结果"""
			
 
				+    reference: StandardReference
			
 
				+    has_issue: bool
			
 
				+    issue_type: str              # 问题类型
			
 
				+    suggestion: str
			
 
				+    reason: str
			
 
				+    risk_level: str              # 无风险 / 高风险
			
 
				+
			
 
				+
			
 
				+class StandardExtractor:
			
 
				+    """规范引用提取器"""
			
 
				+
			
 
				+    # 规范编号正则模式（匹配类似 GB 50010-2010、JTG B01-2014、GB/T 50502-2020 等格式）
			
 
				+    STANDARD_NUMBER_PATTERNS = [
			
 
				+        # 中国国家标准：GB 50010-2010、GB/T 50502-2020
			
 
				+        r'GB(?:/T)?\s*\d{4,5}(?:\.\d+)?\s*-\s*\d{4}',
			
 
				+        # 中国行业标准：JTG B01-2014、JTG D60-2015、JTG/T 3650-2020
			
 
				+        r'[A-Z]{2,3}(?:/T)?\s*[A-Z]?\s*\d{2,4}(?:\.\d+)?\s*-\s*\d{4}',
			
 
				+        # 地方标准：DB11/T 1234-2020
			
 
				+        r'DB\d{2}(?:/T)?\s*\d{4,5}\s*-\s*\d{4}',
			
 
				+        # 团体标准：T/CECS 123-2020
			
 
				+        r'T/\w+\s*\d{3,5}\s*-\s*\d{4}',
			
 
				+    ]
			
 
				+
			
 
				+    # 规范名称与编号组合的正则模式
			
 
				+    STANDARD_FULL_PATTERN = re.compile(
			
 
				+        r'《([^《》]+)》\s*[（(]([^)）]+)[）)]',
			
 
				+        re.MULTILINE
			
 
				+    )
			
 
				+
			
 
				+    # 仅规范编号模式
			
 
				+    STANDARD_NUMBER_ONLY_PATTERN = re.compile(
			
 
				+        r'(' + '|'.join(STANDARD_NUMBER_PATTERNS) + r')',
			
 
				+        re.MULTILINE | re.IGNORECASE
			
 
				+    )
			
 
				+
			
 
				+    def __init__(self):
			
 
				+        self.extracted_cache: Dict[str, List[StandardReference]] = {}
			
 
				+
			
 
				+    def extract_from_content(self, content: str, location_info: Optional[Dict] = None) -> List[StandardReference]:
			
 
				+        """
			
 
				+        从内容文本中提取规范引用
			
 
				+
			
 
				+        Args:
			
 
				+            content: 内容文本（包含行号标记如 <80>）
			
 
				+            location_info: 位置信息（如三级分类代码、行号范围等）
			
 
				+
			
 
				+        Returns:
			
 
				+            List[StandardReference]: 提取的规范引用列表
			
 
				+        """
			
 
				+        if not content:
			
 
				+            return []
			
 
				+
			
 
				+        # 使用缓存
			
 
				+        cache_key = hash(content)
			
 
				+        if cache_key in self.extracted_cache:
			
 
				+            return self.extracted_cache[cache_key]
			
 
				+
			
 
				+        references = []
			
 
				+
			
 
				+        # 1. 提取完整格式：《名称》（编号）
			
 
				+        full_matches = self.STANDARD_FULL_PATTERN.findall(content)
			
 
				+        for name, number in full_matches:
			
 
				+            # 验证编号是否符合规范格式
			
 
				+            if self._is_valid_standard_number(number):
			
 
				+                original = f"《{name}》（{number}）"
			
 
				+                # 查找该引用在原文中的位置
			
 
				+                context = self._extract_context(content, original)
			
 
				+                ref = StandardReference(
			
 
				+                    original_text=original,
			
 
				+                    name=name.strip(),
			
 
				+                    number=number.strip(),
			
 
				+                    context=context,
			
 
				+                    location_info=location_info or {}
			
 
				+                )
			
 
				+                references.append(ref)
			
 
				+
			
 
				+        # 2. 提取孤立的规范编号（用于补充）
			
 
				+        number_matches = self.STANDARD_NUMBER_ONLY_PATTERN.findall(content)
			
 
				+        for match in number_matches:
			
 
				+            number = match if isinstance(match, str) else match[0]
			
 
				+            # 检查是否已包含在完整格式中
			
 
				+            if not any(number in ref.number for ref in references):
			
 
				+                # 尝试提取该编号附近的上下文作为名称
			
 
				+                name = self._infer_name_from_context(content, number)
			
 
				+                original = f"《{name}》（{number}）" if name else number
			
 
				+                ref = StandardReference(
			
 
				+                    original_text=original,
			
 
				+                    name=name or "",
			
 
				+                    number=number.strip(),
			
 
				+                    context=self._extract_context(content, number),
			
 
				+                    location_info=location_info or {}
			
 
				+                )
			
 
				+                references.append(ref)
			
 
				+
			
 
				+        # 去重（基于original_text）
			
 
				+        seen = set()
			
 
				+        unique_refs = []
			
 
				+        for ref in references:
			
 
				+            if ref.original_text not in seen:
			
 
				+                seen.add(ref.original_text)
			
 
				+                unique_refs.append(ref)
			
 
				+
			
 
				+        self.extracted_cache[cache_key] = unique_refs
			
 
				+        return unique_refs
			
 
				+
			
 
				+    def _is_valid_standard_number(self, number: str) -> bool:
			
 
				+        """验证是否为有效的规范编号"""
			
 
				+        number = number.strip().upper()
			
 
				+        # 检查是否匹配任一规范编号模式
			
 
				+        for pattern in self.STANDARD_NUMBER_PATTERNS:
			
 
				+            if re.match(pattern, number, re.IGNORECASE):
			
 
				+                return True
			
 
				+        return False
			
 
				+
			
 
				+    def _extract_context(self, content: str, target: str, window: int = 50) -> str:
			
 
				+        """提取目标文本的上下文"""
			
 
				+        idx = content.find(target)
			
 
				+        if idx == -1:
			
 
				+            return ""
			
 
				+        start = max(0, idx - window)
			
 
				+        end = min(len(content), idx + len(target) + window)
			
 
				+        return content[start:end].strip()
			
 
				+
			
 
				+    def _infer_name_from_context(self, content: str, number: str) -> str:
			
 
				+        """从上下文推断规范名称"""
			
 
				+        # 查找编号附近的《名称》格式
			
 
				+        pattern = re.compile(r'《([^《》]{3,50})》[^《》]{0,30}' + re.escape(number))
			
 
				+        match = pattern.search(content)
			
 
				+        if match:
			
 
				+            return match.group(1)
			
 
				+        return ""
			
 
				+
			
 
				+
			
 
				+class ContentTimelinessReviewer:
			
 
				+    """三级分类内容时效性审查器"""
			
 
				+
			
 
				+    def __init__(self, max_concurrent: int = 4):
			
 
				+        self.extractor = StandardExtractor()
			
 
				+        self.search_engine = BasisSearchEngine()
			
 
				+        self.response_processor = StandardizedResponseProcessor()
			
 
				+        self.max_concurrent = max_concurrent
			
 
				+        self._semaphore = None
			
 
				+
			
 
				+    async def __aenter__(self):
			
 
				+        """异步上下文管理器入口"""
			
 
				+        if self._semaphore is None:
			
 
				+            self._semaphore = asyncio.Semaphore(self.max_concurrent)
			
 
				+        return self
			
 
				+
			
 
				+    async def __aexit__(self, exc_type, exc_val, exc_tb):
			
 
				+        """异步上下文管理器出口"""
			
 
				+        return False
			
 
				+
			
 
				+    async def review_tertiary_content(
			
 
				+        self,
			
 
				+        tertiary_details: List[Dict[str, Any]],
			
 
				+        collection_name: str = "first_bfp_collection_status",
			
 
				+        progress_manager=None,
			
 
				+        callback_task_id: str = None
			
 
				+    ) -> List[Dict[str, Any]]:
			
 
				+        """
			
 
				+        审查三级分类内容中的规范时效性
			
 
				+
			
 
				+        Args:
			
 
				+            tertiary_details: 三级分类详情列表，每项包含content字段
			
 
				+            collection_name: Milvus集合名称
			
 
				+            progress_manager: 进度管理器（可选，用于SSE推送）
			
 
				+            callback_task_id: 回调任务ID（可选）
			
 
				+
			
 
				+        Returns:
			
 
				+            List[Dict]: 标准化的审查结果列表
			
 
				+        """
			
 
				+        if not tertiary_details:
			
 
				+            return []
			
 
				+
			
 
				+        # 1. 从所有三级分类内容中提取规范引用
			
 
				+        all_references = []
			
 
				+        reference_to_location = {}  # 用于追踪引用来源
			
 
				+
			
 
				+        for detail in tertiary_details:
			
 
				+            content = detail.get("content", "")
			
 
				+            if not content:
			
 
				+                continue
			
 
				+
			
 
				+            location_info = {
			
 
				+                "third_category_name": detail.get("third_category_name", ""),
			
 
				+                "third_category_code": detail.get("third_category_code", ""),
			
 
				+                "start_line": detail.get("start_line", 0),
			
 
				+                "end_line": detail.get("end_line", 0),
			
 
				+            }
			
 
				+
			
 
				+            refs = self.extractor.extract_from_content(content, location_info)
			
 
				+            for ref in refs:
			
 
				+                all_references.append(ref)
			
 
				+                # 记录引用来源（用于后续结果关联）
			
 
				+                if ref.original_text not in reference_to_location:
			
 
				+                    reference_to_location[ref.original_text] = []
			
 
				+                reference_to_location[ref.original_text].append(location_info)
			
 
				+
			
 
				+        if not all_references:
			
 
				+            logger.info("未从三级分类内容中提取到规范引用")
			
 
				+            return []
			
 
				+
			
 
				+        logger.info(f"从三级分类内容中提取到 {len(all_references)} 个规范引用")
			
 
				+
			
 
				+        # 2. 对提取的规范进行时效性审查
			
 
				+        all_issues = []
			
 
				+
			
 
				+        # 分批处理（每批3个）
			
 
				+        batch_size = 3
			
 
				+        ref_texts = [ref.original_text for ref in all_references]
			
 
				+        total_batches = (len(ref_texts) + batch_size - 1) // batch_size
			
 
				+
			
 
				+        for i in range(0, len(ref_texts), batch_size):
			
 
				+            batch_refs = all_references[i:i + batch_size]
			
 
				+            batch_texts = [ref.original_text for ref in batch_refs]
			
 
				+            batch_num = i // batch_size + 1
			
 
				+
			
 
				+            try:
			
 
				+                async with self._semaphore:
			
 
				+                    # 搜索参考规范
			
 
				+                    search_tasks = []
			
 
				+                    for ref in batch_refs:
			
 
				+                        task = asyncio.create_task(
			
 
				+                            self._async_search_standard(ref.number, collection_name)
			
 
				+                        )
			
 
				+                        search_tasks.append(task)
			
 
				+
			
 
				+                    search_results = await asyncio.gather(*search_tasks, return_exceptions=True)
			
 
				+
			
 
				+                    # 构建参考文本列表
			
 
				+                    grouped_candidates = []
			
 
				+                    for j, result in enumerate(search_results):
			
 
				+                        if isinstance(result, Exception):
			
 
				+                            logger.error(f"搜索失败 '{batch_refs[j].original_text}': {result}")
			
 
				+                            grouped_candidates.append([])
			
 
				+                        else:
			
 
				+                            texts = [item.get("text_content", "") for item in result if item]
			
 
				+                            grouped_candidates.append(texts)
			
 
				+
			
 
				+                    # 匹配参考文件
			
 
				+                    match_result = await match_reference_files(
			
 
				+                        reference_text=grouped_candidates,
			
 
				+                        review_text=batch_texts
			
 
				+                    )
			
 
				+
			
 
				+                    # 记录完整的匹配结果用于调试
			
 
				+                    logger.info(f"批次{batch_num} match_reference_files 原始结果: {match_result[:500]}...")
			
 
				+
			
 
				+                    # 过滤：保留有相关信息的项进行审查
			
 
				+                    # 条件：has_related_file为true 或 exact_match_info不为空 或 same_name_current不为空
			
 
				+                    try:
			
 
				+                        match_data = json.loads(match_result)
			
 
				+                        items = match_data.get('items', match_data) if isinstance(match_data, dict) else match_data
			
 
				+
			
 
				+                        logger.info(f"批次{batch_num} 解析到 {len(items)} 个匹配项")
			
 
				+                        for idx, item in enumerate(items):
			
 
				+                            logger.info(f"  项{idx}: review_item={item.get('review_item', 'unknown')}, "
			
 
				+                                      f"has_related_file={item.get('has_related_file')}, "
			
 
				+                                      f"exact_match_info={item.get('exact_match_info')}, "
			
 
				+                                      f"same_name_current={item.get('same_name_current')}")
			
 
				+
			
 
				+                        # 放宽过滤条件：只要有相关文件信息就进行审查
			
 
				+                        filtered_data = [
			
 
				+                            item for item in items
			
 
				+                            if item.get('has_related_file') or
			
 
				+                               item.get('exact_match_info') or
			
 
				+                               item.get('same_name_current')
			
 
				+                        ]
			
 
				+
			
 
				+                        logger.info(f"批次{batch_num} 过滤后保留 {len(filtered_data)} 个项")
			
 
				+
			
 
				+                        # 记录被过滤掉的项目用于调试
			
 
				+                        skipped_items = [
			
 
				+                            item for item in items
			
 
				+                            if not (item.get('has_related_file') or
			
 
				+                                   item.get('exact_match_info') or
			
 
				+                                   item.get('same_name_current'))
			
 
				+                        ]
			
 
				+                        if skipped_items:
			
 
				+                            logger.warning(f"批次{batch_num} 跳过了 {len(skipped_items)} 个无参考信息的项: "
			
 
				+                                         f"{[item.get('review_item', 'unknown') for item in skipped_items]}")
			
 
				+
			
 
				+                        if not filtered_data:
			
 
				+                            logger.info(f"批次{batch_num}: 没有符合审查条件的规范引用")
			
 
				+                            continue
			
 
				+
			
 
				+                        # 重新构建JSON
			
 
				+                        if isinstance(match_data, dict) and 'items' in match_data:
			
 
				+                            match_result = json.dumps({"items": filtered_data}, ensure_ascii=False)
			
 
				+                        else:
			
 
				+                            match_result = json.dumps(filtered_data, ensure_ascii=False)
			
 
				+
			
 
				+                        # 判定时效性问题
			
 
				+                        llm_out = await determine_timeliness_issue(match_result)
			
 
				+
			
 
				+                        # 处理响应
			
 
				+                        standardized_result = self.response_processor.process_llm_response(
			
 
				+                            llm_out,
			
 
				+                            "content_timeliness_check",
			
 
				+                            "content",
			
 
				+                            "content_timeliness_check"
			
 
				+                        )
			
 
				+
			
 
				+                        # 3. 增强结果：添加位置信息
			
 
				+                        for item in standardized_result:
			
 
				+                            review_item = item.get("check_result", {}).get("location", "")
			
 
				+                            if review_item in reference_to_location:
			
 
				+                                locations = reference_to_location[review_item]
			
 
				+                                # 添加位置信息到结果
			
 
				+                                item["location_info"] = locations
			
 
				+                                # 添加三级分类上下文
			
 
				+                                contexts = []
			
 
				+                                for loc in locations:
			
 
				+                                    ctx = f"[{loc.get('third_category_name', '')}] 第{loc.get('start_line', 0)}-{loc.get('end_line', 0)}行"
			
 
				+                                    contexts.append(ctx)
			
 
				+                                item["content_context"] = "; ".join(contexts)
			
 
				+
			
 
				+                                # 更新location字段为更详细的描述
			
 
				+                                if contexts:
			
 
				+                                    item["check_result"]["location"] = f"{review_item}（出现在：{item['content_context']}）"
			
 
				+
			
 
				+                        all_issues.extend(standardized_result)
			
 
				+
			
 
				+                        # SSE推送（如果提供了progress_manager）
			
 
				+                        if progress_manager and callback_task_id:
			
 
				+                            try:
			
 
				+                                await progress_manager.update_stage_progress(
			
 
				+                                    callback_task_id=callback_task_id,
			
 
				+                                    stage_name=f"内容时效性审查-批次{batch_num}",
			
 
				+                                    status="processing",
			
 
				+                                    message=f"完成第{batch_num}/{total_batches}批次内容时效性审查，{len(batch_refs)}项",
			
 
				+                                    overall_task_status="processing",
			
 
				+                                    event_type="processing",
			
 
				+                                    issues=standardized_result
			
 
				+                                )
			
 
				+                            except Exception as e:
			
 
				+                                logger.error(f"SSE推送失败: {e}")
			
 
				+
			
 
				+                    except (json.JSONDecodeError, TypeError) as e:
			
 
				+                        logger.warning(f"处理匹配结果时出错: {e}")
			
 
				+                        continue
			
 
				+
			
 
				+            except Exception as e:
			
 
				+                logger.error(f"批次 {batch_num} 处理失败: {e}")
			
 
				+                error_result = {
			
 
				+                    "check_item": "content_timeliness_check",
			
 
				+                    "chapter_code": "content",
			
 
				+                    "check_item_code": "content_timeliness_check",
			
 
				+                    "check_result": {"error": str(e), "batch_num": batch_num},
			
 
				+                    "exist_issue": True,
			
 
				+                    "risk_info": {"risk_level": "medium"}
			
 
				+                }
			
 
				+                all_issues.append(error_result)
			
 
				+
			
 
				+        # 统计结果
			
 
				+        issue_count = sum(1 for item in all_issues if item.get("exist_issue", False))
			
 
				+        logger.info(f"内容时效性审查完成：总计 {len(all_references)} 项引用，发现问题 {issue_count} 项")
			
 
				+
			
 
				+        return all_issues
			
 
				+
			
 
				+    async def _async_search_standard(
			
 
				+        self,
			
 
				+        standard_number: str,
			
 
				+        collection_name: str,
			
 
				+        top_k: int = 3
			
 
				+    ) -> List[dict]:
			
 
				+        """异步搜索单个规范"""
			
 
				+        try:
			
 
				+            loop = asyncio.get_running_loop()
			
 
				+            func = partial(
			
 
				+                self.search_engine.hybrid_search,
			
 
				+                collection_name=collection_name,
			
 
				+                query_text=standard_number,
			
 
				+                top_k=top_k,
			
 
				+                ranker_type="weighted",
			
 
				+                dense_weight=0.3,
			
 
				+                sparse_weight=0.7
			
 
				+            )
			
 
				+            retrieved = await loop.run_in_executor(None, func)
			
 
				+            logger.debug(f"搜索 '{standard_number}' -> 找到 {len(retrieved or [])} 个结果")
			
 
				+            return retrieved or []
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"搜索失败 '{standard_number}': {e}")
			
 
				+            return []
			
 
				+
			
 
				+
			
 
				+# ===== 便捷函数 =====
			
 
				+
			
 
				+async def review_tertiary_content_timeliness(
			
 
				+    tertiary_details: List[Dict[str, Any]],
			
 
				+    collection_name: str = "first_bfp_collection_status",
			
 
				+    max_concurrent: int = 4,
			
 
				+    progress_manager=None,
			
 
				+    callback_task_id: str = None
			
 
				+) -> List[Dict[str, Any]]:
			
 
				+    """
			
 
				+    审查三级分类内容时效性的便捷函数
			
 
				+
			
 
				+    Args:
			
 
				+        tertiary_details: 三级分类详情列表
			
 
				+        collection_name: Milvus集合名称
			
 
				+        max_concurrent: 最大并发数
			
 
				+        progress_manager: 进度管理器（可选）
			
 
				+        callback_task_id: 回调任务ID（可选）
			
 
				+
			
 
				+    Returns:
			
 
				+        List[Dict]: 标准化的审查结果列表
			
 
				+    """
			
 
				+    async with ContentTimelinessReviewer(max_concurrent=max_concurrent) as reviewer:
			
 
				+        return await reviewer.review_tertiary_content(
			
 
				+            tertiary_details=tertiary_details,
			
 
				+            collection_name=collection_name,
			
 
				+            progress_manager=progress_manager,
			
 
				+            callback_task_id=callback_task_id
			
 
				+        )
			
 
				+
			
 
				+
			
 
				+# ===== 测试代码 =====
			
 
				+if __name__ == "__main__":
			
 
				+    # 测试数据
			
 
				+    test_tertiary_details = [
			
 
				+        {
			
 
				+            "third_category_name": "国家方针、政策、标准和设计文件",
			
 
				+            "third_category_code": "NationalPoliciesStandardsAndDesignDocument",
			
 
				+            "start_line": 80,
			
 
				+            "end_line": 82,
			
 
				+            "content": "<80> 国家方针、政策、标准和设计文件\n<81> 《公路工程技术标准》（JTG B01-2011）\n<82> 《公路桥涵设计通用规范》（JTG D60-2015）"
			
 
				+        },
			
 
				+        {
			
 
				+            "third_category_name": "施工技术标准",
			
 
				+            "third_category_code": "ConstructionTechnicalStandards",
			
 
				+            "start_line": 100,
			
 
				+            "end_line": 102,
			
 
				+            "content": "<100> 施工技术标准\n<101> 《公路桥涵施工技术规范》（JTG/T 3650-2020）\n<102> 《混凝土结构设计规范》（GB 50010-2010）"
			
 
				+        }
			
 
				+    ]
			
 
				+
			
 
				+    print(f"测试 {len(test_tertiary_details)} 个三级分类内容...")
			
 
				+
			
 
				+    # 测试提取器
			
 
				+    extractor = StandardExtractor()
			
 
				+    for detail in test_tertiary_details:
			
 
				+        refs = extractor.extract_from_content(detail["content"])
			
 
				+        print(f"\n从 '{detail['third_category_name']}' 提取到 {len(refs)} 个规范引用:")
			
 
				+        for ref in refs:
			
 
				+            print(f"  - {ref.original_text}")
			
 
				+
			
 
				+    # 测试完整审查流程（需要Milvus连接）
			
 
				+    # result = asyncio.run(review_tertiary_content_timeliness(test_tertiary_details))
			
 
				+    # print("\n审查结果:")
			
 
				+    # print(json.dumps(result, ensure_ascii=False, indent=2))
			
--- a/core/construction_review/component/reviewers/utils/inter_tool.py
+++ b/core/construction_review/component/reviewers/utils/inter_tool.py
@@ -298,7 +298,7 @@ class InterTool:
 
				                 reference_data = check_result.get('reference_basis_review_results', {})
			
 
				                 batch_results = reference_data.get('review_results', [])
			
 
				                 logger.debug(f"🔍 [DEBUG] 处理规范性审查结果，批次数: {len(batch_results)}")
			
 
				-                
			
 
				+
			
 
				                 for batch in batch_results:
			
 
				                     if isinstance(batch, list):
			
 
				                         for item in batch:
			
@@ -323,6 +323,27 @@ class InterTool:
 
				                 logger.info(f"🔍 规范性审查结果处理完成，添加 {len(review_lists)} 个问题项")
			
 
				                 continue
			
 
				 
			
 
				+            # 🔧 特殊处理：timeliness_content_reviewer 的返回格式
			
 
				+            if check_key == 'timeliness_content_reviewer' and isinstance(check_result, dict):
			
 
				+                content_timeliness_data = check_result.get('timeliness_content_review_results', {})
			
 
				+                batch_results = content_timeliness_data.get('review_results', [])
			
 
				+                logger.debug(f"🔍 [DEBUG] 处理内容时效性审查结果，问题数: {len(batch_results)}")
			
 
				+
			
 
				+                for item in batch_results:
			
 
				+                    if isinstance(item, dict):
			
 
				+                        review_lists.append({
			
 
				+                            "check_item": item.get('check_item', 'content_timeliness_check'),
			
 
				+                            "chapter_code": item.get('chapter_code', chapter_code),
			
 
				+                            "check_item_code": item.get('check_item_code', f"{chapter_code}_content_timeliness_check"),
			
 
				+                            "check_result": item.get('check_result', item),
			
 
				+                            "exist_issue": item.get('exist_issue', False),
			
 
				+                            "risk_info": item.get('risk_info', {"risk_level": "low"}),
			
 
				+                            "location_info": item.get('location_info', []),
			
 
				+                            "content_context": item.get('content_context', '')
			
 
				+                        })
			
 
				+                logger.info(f"🔍 内容时效性审查结果处理完成，添加 {len(batch_results)} 个问题项")
			
 
				+                continue
			
 
				+
			
 
				             # 🔧 类型安全检查：支持字典和 base_reviewer.ReviewResult 对象
			
 
				             is_dict = isinstance(check_result, dict)
			
 
				             is_review_result = hasattr(check_result, 'details') and hasattr(check_result, 'success')
			
--- a/core/construction_review/workflows/ai_review_workflow.py
+++ b/core/construction_review/workflows/ai_review_workflow.py
@@ -293,6 +293,7 @@ class AIReviewWorkflow:
 
				                 'semantic_logic_check': 'check_semantic_logic',
			
 
				                 'completeness_check': 'check_completeness',
			
 
				                 'timeliness_check': 'timeliness_basis_reviewer',
			
 
				+                'timeliness_content_check': 'timeliness_content_reviewer',
			
 
				                 'reference_check': 'reference_basis_reviewer',
			
 
				                 'sensitive_check': 'check_sensitive',
			
 
				                 'non_parameter_compliance_check': 'check_non_parameter_compliance',
			
--- a/core/construction_review/workflows/core_functions/ai_review_core_fun.py
+++ b/core/construction_review/workflows/core_functions/ai_review_core_fun.py
@@ -546,6 +546,31 @@ class AIReviewCoreFun:
 
				                 is_sse_push=True
			
 
				             )
			
 
				 
			
 
				+        # timeliness_content_reviewer：三级分类内容时效性审查（逐块处理）
			
 
				+        elif func_name == "timeliness_content_reviewer" and not is_complete_field:
			
 
				+            # 从chunk中获取三级分类详情
			
 
				+            tertiary_details = chunk.get("tertiary_classification_details", [])
			
 
				+            review_data = {
			
 
				+                "tertiary_classification_details": tertiary_details,  # 三级分类详情
			
 
				+                "max_concurrent": 4
			
 
				+            }
			
 
				+            raw_result = await method(
			
 
				+                review_data=review_data,
			
 
				+                trace_id=trace_id,
			
 
				+                state=state,
			
 
				+                stage_name=stage_name
			
 
				+            )
			
 
				+            # 基础审查方法，放入 basic_compliance
			
 
				+            return UnitReviewResult(
			
 
				+                unit_index=chunk_index,
			
 
				+                unit_content=chunk,
			
 
				+                basic_compliance={func_name: raw_result},
			
 
				+                technical_compliance={},
			
 
				+                rag_enhanced={},
			
 
				+                overall_risk=self._calculate_single_result_risk(raw_result),
			
 
				+                is_sse_push=True
			
 
				+            )
			
 
				+
			
 
				         else:
			
 
				             # 处理 check_completeness 但 is_complete_field=False 的情况
			
 
				             if func_name == "check_completeness" and not is_complete_field:
			
--- a/problem.json
+++ b/problem.json
--- a/test_content_timeliness.py
+++ b/test_content_timeliness.py
@@ -0,0 +1,141 @@
 
				+#!/usr/bin/env python
			
 
				+# -*- coding: utf-8 -*-
			
 
				+"""
			
 
				+测试内容时效性审查是否正确处理 JTG B01-2011 的情况
			
 
				+"""
			
 
				+
			
 
				+import json
			
 
				+import asyncio
			
 
				+from core.construction_review.component.reviewers.timeliness_content_reviewer import (
			
 
				+    StandardExtractor, ContentTimelinessReviewer
			
 
				+)
			
 
				+
			
 
				+# 测试数据 - 模拟 problem.json 中的情况
			
 
				+test_tertiary_details = [
			
 
				+    {
			
 
				+        "third_category_name": "国家方针、政策、标准和设计文件",
			
 
				+        "third_category_code": "NationalPoliciesStandardsAndDesignDocument",
			
 
				+        "start_line": 80,
			
 
				+        "end_line": 82,
			
 
				+        "content": """<80> 国家方针、政策、标准和设计文件
			
 
				+<81> 《公路工程技术标准》（JTG B01-2011）
			
 
				+<82> 《公路桥涵设计通用规范》（JTG D60-2015）"""
			
 
				+    }
			
 
				+]
			
 
				+
			
 
				+# 测试提取器
			
 
				+def test_extractor():
			
 
				+    print("=" * 60)
			
 
				+    print("测试规范提取器")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    extractor = StandardExtractor()
			
 
				+
			
 
				+    for detail in test_tertiary_details:
			
 
				+        refs = extractor.extract_from_content(detail["content"])
			
 
				+        print(f"\n从 '{detail['third_category_name']}' 提取到 {len(refs)} 个规范引用:")
			
 
				+        for ref in refs:
			
 
				+            print(f"  - 原始文本: {ref.original_text}")
			
 
				+            print(f"    名称: {ref.name}")
			
 
				+            print(f"    编号: {ref.number}")
			
 
				+            print(f"    上下文: {ref.context[:100]}...")
			
 
				+
			
 
				+    return refs
			
 
				+
			
 
				+# 测试过滤逻辑
			
 
				+def test_filter_logic():
			
 
				+    print("\n" + "=" * 60)
			
 
				+    print("测试过滤逻辑")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    # 模拟 match_reference_files 返回的数据
			
 
				+    mock_match_result = [
			
 
				+        {
			
 
				+            "review_item": "《公路工程技术标准》（JTG B01-2011）",
			
 
				+            "has_related_file": True,
			
 
				+            "has_exact_match": False,
			
 
				+            "exact_match_info": "",
			
 
				+            "same_name_current": "《公路工程技术标准》（JTG B01-2014）状态为现行"
			
 
				+        },
			
 
				+        {
			
 
				+            "review_item": "《公路桥涵设计通用规范》（JTG D60-2015）",
			
 
				+            "has_related_file": True,
			
 
				+            "has_exact_match": True,
			
 
				+            "exact_match_info": "《公路桥涵设计通用规范》（JTG D60-2015）状态为现行",
			
 
				+            "same_name_current": ""
			
 
				+        }
			
 
				+    ]
			
 
				+
			
 
				+    print("\n模拟 match_reference_files 返回数据:")
			
 
				+    for idx, item in enumerate(mock_match_result):
			
 
				+        print(f"\n  项{idx}:")
			
 
				+        print(f"    review_item: {item['review_item']}")
			
 
				+        print(f"    has_related_file: {item['has_related_file']}")
			
 
				+        print(f"    has_exact_match: {item['has_exact_match']}")
			
 
				+        print(f"    exact_match_info: {item['exact_match_info']}")
			
 
				+        print(f"    same_name_current: {item['same_name_current']}")
			
 
				+
			
 
				+    # 测试旧过滤逻辑（只保留 exact_match_info 不为空的）
			
 
				+    old_filtered = [item for item in mock_match_result if item.get('exact_match_info')]
			
 
				+    print(f"\n旧过滤逻辑（只保留 exact_match_info 不为空的）: {len(old_filtered)} 个项")
			
 
				+    for item in old_filtered:
			
 
				+        print(f"  - {item['review_item']}")
			
 
				+
			
 
				+    # 测试新过滤逻辑（保留有相关信息的）
			
 
				+    new_filtered = [
			
 
				+        item for item in mock_match_result
			
 
				+        if item.get('has_related_file') or
			
 
				+           item.get('exact_match_info') or
			
 
				+           item.get('same_name_current')
			
 
				+    ]
			
 
				+    print(f"\n新过滤逻辑（保留有相关信息的）: {len(new_filtered)} 个项")
			
 
				+    for item in new_filtered:
			
 
				+        print(f"  - {item['review_item']}")
			
 
				+
			
 
				+    # 分析差异
			
 
				+    missed = [item for item in mock_match_result if item not in old_filtered]
			
 
				+    if missed:
			
 
				+        print(f"\n[警告] 旧逻辑漏检的项:")
			
 
				+        for item in missed:
			
 
				+            print(f"  - {item['review_item']}")
			
 
				+            print(f"    has_related_file: {item['has_related_file']}")
			
 
				+            print(f"    same_name_current: {item['same_name_current']}")
			
 
				+
			
 
				+# 完整测试
			
 
				+async def test_full_review():
			
 
				+    print("\n" + "=" * 60)
			
 
				+    print("完整审查测试（需要 Milvus 连接）")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    try:
			
 
				+        async with ContentTimelinessReviewer(max_concurrent=4) as reviewer:
			
 
				+            results = await reviewer.review_tertiary_content(
			
 
				+                tertiary_details=test_tertiary_details,
			
 
				+                collection_name="first_bfp_collection_status"
			
 
				+            )
			
 
				+
			
 
				+            print(f"\n审查完成，共 {len(results)} 个结果:")
			
 
				+            for idx, result in enumerate(results):
			
 
				+                print(f"\n  结果{idx}:")
			
 
				+                print(f"    check_item: {result.get('check_item')}")
			
 
				+                print(f"    exist_issue: {result.get('exist_issue')}")
			
 
				+                print(f"    risk_info: {result.get('risk_info')}")
			
 
				+                check_result = result.get('check_result', {})
			
 
				+                print(f"    issue_point: {check_result.get('issue_point')}")
			
 
				+                print(f"    suggestion: {check_result.get('suggestion')}")
			
 
				+                print(f"    reason: {check_result.get('reason')}")
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        print(f"测试失败: {e}")
			
 
				+        import traceback
			
 
				+        traceback.print_exc()
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    # 测试提取器
			
 
				+    refs = test_extractor()
			
 
				+
			
 
				+    # 测试过滤逻辑
			
 
				+    test_filter_logic()
			
 
				+
			
 
				+    # 完整测试（可选）
			
 
				+    # asyncio.run(test_full_review())
			
--- a/views/construction_review/file_upload.py
+++ b/views/construction_review/file_upload.py
@@ -4,19 +4,17 @@
 
				 """
			
 
				 import ast
			
 
				 import traceback
			
 
				-import uuid
			
 
				 import time
			
 
				 from datetime import datetime
			
 
				 
			
 
				-from pydantic import BaseModel, Field
			
 
				-from typing import Optional,List
			
 
				+from pydantic import BaseModel
			
 
				+from typing import List
			
 
				 from foundation.utils import md5
			
 
				 from foundation.infrastructure.config import config_handler
			
 
				 from .schemas.error_schemas import FileUploadErrors
			
 
				 from core.base.workflow_manager import WorkflowManager
			
 
				 from foundation.observability.logger.loggering import review_logger as logger
			
 
				 from fastapi import APIRouter, UploadFile, File, Form, HTTPException, Request
			
 
				-from core.base.redis_duplicate_checker import RedisDuplicateChecker
			
 
				 from foundation.infrastructure.tracing import TraceContext, auto_trace
			
 
				 
			
 
				 
			
--- a/views/construction_review/review_results.py
+++ b/views/construction_review/review_results.py
@@ -3,14 +3,9 @@
 
				 模拟风险统计、总结报告和问题条文返回
			
 
				 """
			
 
				 
			
 
				-import random
			
 
				-import os
			
 
				-import json
			
 
				-from datetime import datetime
			
 
				 from fastapi import APIRouter, HTTPException, Query
			
 
				 from pydantic import BaseModel
			
 
				-from typing import Optional, Dict, Any
			
 
				-from .schemas.error_schemas import ReviewResultsErrors
			
 
				+from typing import Dict, Any
			
 
				 from foundation.observability.cachefiles import cache, CacheBaseDir
			
 
				 
			
 
				 
			
--- a/views/construction_review/task_control.py
+++ b/views/construction_review/task_control.py
@@ -3,7 +3,6 @@
 
				 提供任务终止、查询等控制功能
			
 
				 """
			
 
				 
			
 
				-import asyncio
			
 
				 from typing import List, Optional, Dict, Any
			
 
				 from pydantic import BaseModel, Field
			
 
				 from fastapi import APIRouter, HTTPException, Query
			
--- a/views/construction_write/content_completion.py
+++ b/views/construction_write/content_completion.py
@@ -6,7 +6,6 @@ API URL: https://dashscope.aliyuncs.com/compatible-mode/v1
 
				 模型：qwen3-30b-a3b-instruct-2507
			
 
				 """
			
 
				 
			
 
				-import os
			
 
				 import uuid
			
 
				 import json
			
 
				 import time
			
--- a/views/construction_write/outline_views.py
+++ b/views/construction_write/outline_views.py
@@ -10,7 +10,6 @@
 
				 - POST /sgbx/context_generate: SSE 流式上下文生成 (新增)
			
 
				 """
			
 
				 
			
 
				-import os
			
 
				 import uuid
			
 
				 import json
			
 
				 import time
			
@@ -26,7 +25,6 @@ from foundation.infrastructure.config.config import config_handler
 
				 from core.base.workflow_manager import WorkflowManager
			
 
				 from core.base.sse_manager import unified_sse_manager
			
 
				 from core.base.progress_manager import ProgressManager
			
 
				-from redis import asyncio as redis_async  # 新增这行
			
 
				 from redis.asyncio import Redis as AsyncRedis
			
 
				 
			
 
				 # 创建路由