пре 1 недеља · 78bcae0dcb
--- a/config/config.ini.template
+++ b/config/config.ini.template
@@ -145,13 +145,10 @@ MYSQL_HOST=192.168.92.61
 
															 MYSQL_PORT=13306
														
 
															 MYSQL_USER=root
														
 
															 MYSQL_PASSWORD=Lq123456!
														
 
															-MYSQL_DB=lq_db
														
 
															+MYSQL_DB=lq_db_dev
														
 
															 MYSQL_MIN_SIZE=1
														
 
															 MYSQL_MAX_SIZE=5
														
 
															 MYSQL_AUTO_COMMIT=True
														
 
															-MYSQL_CONNECT_TIMEOUT=30
														
 
															-MYSQL_READ_TIMEOUT=60
														
 
															-MYSQL_WRITE_TIMEOUT=30
														
 
															 [pgvector]
														
@@ -241,5 +238,9 @@ MAX_TOKENS=1024
 
															 [construction_review]
														
 
															 MAX_CELERY_TASKS=1
														
 
															-
														
 
															+[timeliness_review]
														
 
															+# 时效性审查中用于匹配前需要去除的符号（第二轮处理）
														
 
															+# 这些符号会在基础规范化（去除空白、书名号、括号、HTML标签）之后去除
														
 
															+# 包含各种连接符：半角连字符(-)、全角连接号(－)、全角破折号(—)
														
 
															+REMOVE_SYMBOLS=),-,.,/,,:,[,],【,】,〔,〕,（,）,－,—
														
--- a/core/construction_review/component/ai_review_engine.py
+++ b/core/construction_review/component/ai_review_engine.py
@@ -1047,34 +1047,41 @@ class AIReviewEngine(BaseReviewer):
 
															                 elif isinstance(outline_raw, list):
														
 
															                     outline_chapters = outline_raw
														
 
															-            # 提取一级和二级信息
														
 
															-            outline_first = set()
														
 
															-            outline_secondary = {}
														
 
															+            # 🆕 提取一级和二级标题（用于独立模糊匹配）
														
 
															+            # 结构：{first_code: {'title': '章节标题', 'subsections': ['二级标题1', '二级标题2']}}
														
 
															+            outline_by_first: Dict[str, Dict] = {}
														
 
															             for chapter in outline_chapters:
														
 
															                 if not isinstance(chapter, dict):
														
 
															                     continue
														
 
															                 first_code = chapter.get('chapter_classification', '')
														
 
															-                if first_code:
														
 
															-                    outline_first.add(first_code)
														
 
															+                first_title = chapter.get('title', '')
														
 
															-                # 提取 subsections 中的二级章节
														
 
															+                if not first_code:
														
 
															+                    continue
														
 
															+                
														
 
															+                if first_code not in outline_by_first:
														
 
															+                    outline_by_first[first_code] = {
														
 
															+                        'title': first_title,
														
 
															+                        'subsections': []
														
 
															+                    }
														
 
															+                
														
 
															+                # 提取二级标题列表
														
 
															                 for sub in chapter.get('subsections', []):
														
 
															                     if not isinstance(sub, dict):
														
 
															                         continue
														
 
															-                    second_code = sub.get('secondary_category_code', '')
														
 
															-                    if first_code and second_code:
														
 
															-                        outline_secondary[(first_code, second_code)] = sub.get('title', '')
														
 
															+                    sub_title = sub.get('title', '')
														
 
															+                    if sub_title:
														
 
															+                        outline_by_first[first_code]['subsections'].append(sub_title)
														
 
															-            logger.info(f"[{name}] 获取到 {len(outline_first)} 个一级, {len(outline_secondary)} 个二级")
														
 
															-
														
 
															-            # 使用模糊匹配
														
 
															+            logger.info(f"[{name}] 获取到 {len(outline_by_first)} 个一级章节")
														
 
															+            
														
 
															+            # 使用模糊匹配（基于标题）
														
 
															             matcher = OutlineCatalogueMatcher(csv_path, raw_content_csv)
														
 
															-            match_result = matcher.match_catalogue(
														
 
															-                outline_first=outline_first,
														
 
															-                outline_secondary=outline_secondary,
														
 
															-                threshold=0.6
														
 
															+            match_result = matcher.match_catalogue_by_title(
														
 
															+                outline_by_first=outline_by_first,
														
 
															+                threshold=0.6  # 阈值0.6
														
 
															             )
														
 
															             catalogue_result = {
														
--- a/core/construction_review/component/document_processor.py
+++ b/core/construction_review/component/document_processor.py
@@ -66,6 +66,91 @@ class DocumentComponents:
 
															     text_splitter: TextSplitter
														
 
															+# 二级分类标题关键词映射（用于outline的subsection分类）
														
 
															+# 基于 StandardCategoryTable.csv，严格匹配标准目录名
														
 
															+SECONDARY_CATEGORY_KEYWORDS = {
														
 
															+    # 编制依据 (basis)
														
 
															+    "basis": {
														
 
															+        "LawsAndRegulations": ["法律法规"],  # 严格匹配
														
 
															+        "StandardsAndSpecifications": ["标准规范"],  # 严格匹配
														
 
															+        "DocumentSystems": ["文件制度"],  # 严格匹配
														
 
															+        "CompilationPrinciples": ["编制原则"],  # 严格匹配
														
 
															+        "CompilationScope": ["编制范围"],  # 严格匹配
														
 
															+    },
														
 
															+    # 工程概况 (overview)
														
 
															+    "overview": {
														
 
															+        "DesignSummary": ["设计概况"],  # 严格匹配
														
 
															+        "GeologyWeather": ["工程地质与水文气象"],  # 严格匹配标准目录名
														
 
															+        "Surroundings": ["周边环境"],  # 严格匹配
														
 
															+        "LayoutPlan": ["施工平面及立面布置"],  # 严格匹配标准目录名
														
 
															+        "RequirementsTech": ["施工要求和技术保证条件"],  # 严格匹配标准目录名
														
 
															+        "RiskLevel": ["风险辨识与分级"],  # 严格匹配标准目录名
														
 
															+        "Stakeholders": ["参建各方责任主体单位"],  # 严格匹配标准目录名
														
 
															+    },
														
 
															+    # 施工计划 (plan)
														
 
															+    "plan": {
														
 
															+        "Schedule": ["施工进度计划"],  # 严格匹配标准目录名
														
 
															+        "Materials": ["施工材料计划"],  # 严格匹配标准目录名
														
 
															+        "Equipment": ["施工设备计划"],  # 严格匹配标准目录名
														
 
															+        "Workforce": ["劳动力计划"],  # 严格匹配
														
 
															+        "SafetyCost": ["安全生产费用使用计划"],  # 严格匹配标准目录名
														
 
															+    },
														
 
															+    # 施工工艺技术 (technology)
														
 
															+    "technology": {
														
 
															+        # 按标准目录严格匹配，优先匹配完整名称避免歧义
														
 
															+        "MethodsOverview": ["主要施工方法概述", "施工方法概述"],  # 不包含"施工方法"避免与Operations冲突
														
 
															+        "TechParams": ["技术参数"],  # 不包含"参数"避免过于宽泛
														
 
															+        "Process": ["工艺流程"],  # 不包含"流程"避免过于宽泛
														
 
															+        "PrepWork": ["施工准备"],  # 不包含"准备"避免过于宽泛
														
 
															+        "Operations": ["施工方法及操作要求", "施工方案及操作要求", "操作要求", "施工方案"],  # 最具体的放前面
														
 
															+        "Inspection": ["检查要求"],  # 不包含"检查""验收"避免与其他章节冲突
														
 
															+    },
														
 
															+    # 安全保证措施 (safety)
														
 
															+    "safety": {
														
 
															+        "SafetySystem": ["安全保证体系"],  # 严格匹配标准目录名
														
 
															+        "Organization": ["组织保证措施"],  # 严格匹配
														
 
															+        "TechMeasures": ["技术保障措施", "技术保证措施"],  # 严格匹配（包含常见变体）
														
 
															+        "Protection": ["安全防护措施"],  # 🆕 新增缺失的分类
														
 
															+        "Monitoring": ["监测监控措施"],  # 严格匹配
														
 
															+        "Emergency": ["应急处置措施"],  # 严格匹配
														
 
															+    },
														
 
															+    # 质量保证措施 (quality)
														
 
															+    "quality": {
														
 
															+        "QualitySystem": ["质量保证体系"],  # 严格匹配
														
 
															+        "QualityGoals": ["质量目标"],  # 严格匹配
														
 
															+        "Excellence": ["工程创优规划"],  # 严格匹配
														
 
															+        "QualityControl": ["质量控制程序与具体措施"],  # 严格匹配标准目录名
														
 
															+    },
														
 
															+    # 环境保证措施 (environment)
														
 
															+    "environment": {
														
 
															+        "EnvSystem": ["环境保证体系"],  # 严格匹配
														
 
															+        "EnvOrg": ["环境保护组织机构"],  # 严格匹配
														
 
															+        "EnvProtection": ["环境保护及文明施工措施"],  # 严格匹配标准目录名
														
 
															+    },
														
 
															+    # 施工管理及作业人员配备与分工 (management)
														
 
															+    "management": {
														
 
															+        "Managers": ["施工管理人员"],  # 严格匹配
														
 
															+        "SafetyStaff": ["专职安全生产管理人员"],  # 严格匹配标准目录名
														
 
															+        "SpecialWorkers": ["特种作业人员"],  # 严格匹配
														
 
															+        "OtherWorkers": ["其他作业人员"],  # 严格匹配
														
 
															+    },
														
 
															+    # 验收要求 (acceptance)
														
 
															+    "acceptance": {
														
 
															+        "Standards": ["验收标准"],  # 严格匹配
														
 
															+        "Procedure": ["验收程序"],  # 严格匹配
														
 
															+        "Content": ["验收内容"],  # 严格匹配
														
 
															+        "Timing": ["验收时间"],  # 严格匹配
														
 
															+        "Personnel": ["验收人员"],  # 严格匹配
														
 
															+    },
														
 
															+    # 其他资料 (other)
														
 
															+    "other": {
														
 
															+        "Calculations": ["计算书"],  # 严格匹配
														
 
															+        "Drawings": ["相关施工图纸"],  # 严格匹配标准目录名
														
 
															+        "Tables": ["附图附表"],  # 严格匹配
														
 
															+        "Team": ["编制及审核人员情况"],  # 严格匹配标准目录名
														
 
															+    },
														
 
															+}
														
 
															+
														
 
															 class DocumentProcessor:
														
 
															     """
														
 
															     文档处理器
														
@@ -734,3 +819,4 @@ class DocumentProcessor:
 
															         except Exception as e:
														
 
															             logger.error(f"基础PDF处理失败: {str(e)}", exc_info=True)
														
 
															             raise
														
 
															+
														
--- a/core/construction_review/component/outline_catalogue_matcher.py
+++ b/core/construction_review/component/outline_catalogue_matcher.py
@@ -8,6 +8,7 @@
 
															 """
														
 
															 import difflib
														
 
															+import logging
														
 
															 import re
														
 
															 from typing import Dict, List, Optional, Set, Tuple, Any
														
 
															 from collections import defaultdict
														
@@ -15,6 +16,8 @@ from pathlib import Path
 
															 import pandas as pd
														
 
															+logger = logging.getLogger(__name__)
														
 
															+
														
 
															 class OutlineCatalogueMatcher:
														
 
															     """
														
@@ -227,161 +230,198 @@ class OutlineCatalogueMatcher:
 
															         return min(sum(scores), 1.0)
														
 
															-    def match_catalogue(
														
 
															+    def _match_by_title_fuzzy(
														
 
															+        self,
														
 
															+        standard_name: str,
														
 
															+        candidate_titles: List[str],
														
 
															+        threshold: float
														
 
															+    ) -> Tuple[bool, float, Optional[str]]:
														
 
															+        """
														
 
															+        在候选标题中找到与标准名称最相似的一个
														
 
															+        
														
 
															+        Returns:
														
 
															+            (是否匹配, 最佳分数, 匹配的标题)
														
 
															+        """
														
 
															+        best_score = 0.0
														
 
															+        best_title = None
														
 
															+        
														
 
															+        for title in candidate_titles:
														
 
															+            score = self._calculate_enhanced_similarity(standard_name, title)
														
 
															+            if score > best_score:
														
 
															+                best_score = score
														
 
															+                best_title = title
														
 
															+        
														
 
															+        is_match = best_score >= threshold
														
 
															+        return is_match, best_score, best_title
														
 
															+    
														
 
															+    def match_catalogue_by_title(
														
 
															         self,
														
 
															-        outline_first: Set[str],
														
 
															-        outline_secondary: Dict[Tuple[str, str], str],
														
 
															+        outline_by_first: Dict[str, Dict[str, any]],
														
 
															         threshold: float = 0.6
														
 
															     ) -> Dict[str, Any]:
														
 
															         """
														
 
															-        执行目录匹配
														
 
															+        🆕 基于标题的独立模糊匹配（一二级都独立）
														
 
															         Args:
														
 
															-            outline_first: 从outline中提取的一级code集合
														
 
															-            outline_secondary: 从outline中提取的二级 {(first_code, second_code): title}
														
 
															-            threshold: 模糊匹配阈值（默认0.6）
														
 
															+            outline_by_first: {
														
 
															+                first_code: {
														
 
															+                    'title': '一级标题',
														
 
															+                    'subsections': ['二级标题1', '二级标题2', ...]
														
 
															+                }
														
 
															+            }
														
 
															+            threshold: 匹配阈值，默认0.6
														
 
															         Returns:
														
 
															-            匹配结果，包含：
														
 
															-            - matched_first: 匹配的一级code集合
														
 
															-            - matched_second: 匹配的二级key集合
														
 
															-            - missing_first: 缺失的一级列表
														
 
															-            - missing_second: 缺失的二级列表
														
 
															-            - match_details: 匹配详情
														
 
															+            匹配结果
														
 
															         """
														
 
															-        required_first = set(self.first_names.keys())
														
 
															-        required_second = set(self.second_names.keys())
														
 
															+        logger.info(f"[独立模糊匹配] 开始，阈值={threshold}")
														
 
															+        
														
 
															+        # ========== 一级目录匹配（独立模糊）==========
														
 
															+        actual_first_titles = {
														
 
															+            code: info['title'] 
														
 
															+            for code, info in outline_by_first.items()
														
 
															+        }
														
 
															-        # 一级匹配
														
 
															-        matched_first = outline_first & required_first
														
 
															-        missing_first = required_first - matched_first
														
 
															+        matched_first = set()
														
 
															+        missing_first = []
														
 
															+        
														
 
															+        for req_code, req_name in self.first_names.items():
														
 
															+            # 优先：直接用code精确匹配，因为一级分类通常较准
														
 
															+            if req_code in actual_first_titles:
														
 
															+                matched_first.add(req_code)
														
 
															+                logger.debug(f"[一级匹配] {req_name}: 存在")
														
 
															+            else:
														
 
															+                # 尝试用标题模糊匹配
														
 
															+                is_match, score, matched_title = self._match_by_title_fuzzy(
														
 
															+                    req_name,
														
 
															+                    list(actual_first_titles.values()),
														
 
															+                    threshold
														
 
															+                )
														
 
															+                if is_match:
														
 
															+                    # 找到匹配的标题，反向查找code
														
 
															+                    for code, title in actual_first_titles.items():
														
 
															+                        if title == matched_title:
														
 
															+                            matched_first.add(req_code)
														
 
															+                            logger.debug(f"[一级模糊匹配] {req_name} -> {matched_title} ({score:.3f})")
														
 
															+                            break
														
 
															+                else:
														
 
															+                    missing_first.append({
														
 
															+                        'first_code': req_code,
														
 
															+                        'first_name': req_name,
														
 
															+                        'first_seq': self.first_seq.get(req_code, 0)
														
 
															+                    })
														
 
															+                    logger.debug(f"[一级缺失] {req_name}")
														
 
															+        
														
 
															+        # ========== 二级目录匹配（结合一级 + 全局兜底）==========
														
 
															+        # 🆕 先收集所有二级标题用于全局兜底
														
 
															+        all_actual_second_titles = []
														
 
															+        for fc, info in outline_by_first.items():
														
 
															+            for sub_title in info.get('subsections', []):
														
 
															+                all_actual_second_titles.append({
														
 
															+                    'first_code': fc,
														
 
															+                    'title': sub_title
														
 
															+                })
														
 
															-        # 二级匹配
														
 
															         matched_second = set()
														
 
															-        missing_second = set()
														
 
															+        missing_second = []
														
 
															         match_details = []
														
 
															+        matched_actual_titles = set()  # 防重复
														
 
															-        # 精确匹配
														
 
															-        outline_second_keys = set(outline_secondary.keys())
														
 
															-        exact_matches = outline_second_keys & required_second
														
 
															-        matched_second.update(exact_matches)
														
 
															-        
														
 
															-        for key in exact_matches:
														
 
															-            first_code, second_code = key
														
 
															+        for req_key, req_name in self.second_names.items():
														
 
															+            first_code, second_code = req_key
														
 
															+            
														
 
															+            # 🆕 步骤1：优先在同一一级下匹配
														
 
															+            same_group_titles = outline_by_first.get(first_code, {}).get('subsections', [])
														
 
															+            best_score_same = 0.0
														
 
															+            best_match_same = None
														
 
															+            
														
 
															+            for title in same_group_titles:
														
 
															+                if title in matched_actual_titles:
														
 
															+                    continue
														
 
															+                score = self._calculate_enhanced_similarity(req_name, title)
														
 
															+                if score > best_score_same:
														
 
															+                    best_score_same = score
														
 
															+                    best_match_same = title
														
 
															+            
														
 
															+            # 同组匹配成功
														
 
															+            if best_score_same >= threshold and best_match_same:
														
 
															+                matched_second.add(req_key)
														
 
															+                matched_actual_titles.add(best_match_same)
														
 
															+                match_details.append({
														
 
															+                    'level': 'second',
														
 
															+                    'required_first_code': first_code,
														
 
															+                    'required_second_code': second_code,
														
 
															+                    'required_second_name': req_name,
														
 
															+                    'matched': True,
														
 
															+                    'match_type': 'same_group_fuzzy',
														
 
															+                    'similarity': best_score_same,
														
 
															+                    'matched_title': best_match_same
														
 
															+                })
														
 
															+                logger.debug(f"[二级同组匹配] {req_name} -> {best_match_same} ({best_score_same:.3f})")
														
 
															+                continue
														
 
															+            
														
 
															+            # 🆕 步骤2：同组失败，尝试全局匹配（提高阈值防误匹配）
														
 
															+            GLOBAL_THRESHOLD = 0.7  # 全局匹配阈值更高
														
 
															+            best_score_global = 0.0
														
 
															+            best_match_global = None
														
 
															+            best_match_fc = None
														
 
															+            
														
 
															+            for actual in all_actual_second_titles:
														
 
															+                if actual['title'] in matched_actual_titles:
														
 
															+                    continue
														
 
															+                score = self._calculate_enhanced_similarity(req_name, actual['title'])
														
 
															+                if score > best_score_global:
														
 
															+                    best_score_global = score
														
 
															+                    best_match_global = actual['title']
														
 
															+                    best_match_fc = actual['first_code']
														
 
															+            
														
 
															+            # 全局匹配成功（且跨组）
														
 
															+            if best_score_global >= GLOBAL_THRESHOLD and best_match_global:
														
 
															+                matched_second.add(req_key)
														
 
															+                matched_actual_titles.add(best_match_global)
														
 
															+                match_details.append({
														
 
															+                    'level': 'second',
														
 
															+                    'required_first_code': first_code,
														
 
															+                    'required_second_code': second_code,
														
 
															+                    'required_second_name': req_name,
														
 
															+                    'matched': True,
														
 
															+                    'match_type': 'cross_group_fuzzy',  # 标记为跨组匹配
														
 
															+                    'similarity': best_score_global,
														
 
															+                    'matched_title': best_match_global,
														
 
															+                    'matched_actual_first': best_match_fc  # 实际匹配到的一级
														
 
															+                })
														
 
															+                logger.warning(f"[二级跨组匹配] {req_name}(应在{first_code}) -> {best_match_global}(实际在{best_match_fc}) ({best_score_global:.3f})")
														
 
															+                continue
														
 
															+            
														
 
															+            # 都失败，记为缺失
														
 
															+            best_score = max(best_score_same, best_score_global)
														
 
															+            best_attempt = best_match_same or best_match_global
														
 
															+            missing_second.append({
														
 
															+                'first_code': first_code,
														
 
															+                'first_name': self.first_names.get(first_code, ''),
														
 
															+                'secondary_code': second_code,
														
 
															+                'secondary_name': req_name,
														
 
															+                'second_seq': self.second_seq.get(req_key, 0)
														
 
															+            })
														
 
															             match_details.append({
														
 
															                 'level': 'second',
														
 
															                 'required_first_code': first_code,
														
 
															                 'required_second_code': second_code,
														
 
															-                'required_second_name': self.second_names.get(key, ''),
														
 
															-                'matched': True,
														
 
															-                'match_type': 'exact',
														
 
															-                'similarity': 1.0
														
 
															-            })
														
 
															-        
														
 
															-        # 模糊匹配（对未精确匹配的）
														
 
															-        required_remaining = required_second - exact_matches
														
 
															-        outline_remaining = outline_second_keys - exact_matches
														
 
															-        
														
 
															-        if required_remaining and outline_remaining:
														
 
															-            # 准备outline数据
														
 
															-            outline_list = []
														
 
															-            for key in outline_remaining:
														
 
															-                first_code, second_code = key
														
 
															-                title = outline_secondary.get(key, "")
														
 
															-                outline_list.append({
														
 
															-                    'key': key,
														
 
															-                    'first_code': first_code,
														
 
															-                    'second_code': second_code,
														
 
															-                    'title': title
														
 
															-                })
														
 
															-            
														
 
															-            # 对每个required进行模糊匹配
														
 
															-            for req_key in required_remaining:
														
 
															-                first_code, second_code = req_key
														
 
															-                second_name = self.second_names.get(req_key, '')
														
 
															-                first_name = self.first_names.get(first_code, '')
														
 
															-                
														
 
															-                # 获取详细定义
														
 
															-                raw_content = self.second_raw_content.get((first_name, second_name))
														
 
															-                
														
 
															-                best_match = None
														
 
															-                best_score = 0.0
														
 
															-                
														
 
															-                for item in outline_list:
														
 
															-                    # 计算相似度
														
 
															-                    score1 = self._calculate_enhanced_similarity(second_name, item['title'])
														
 
															-                    score2 = self._calculate_enhanced_similarity(
														
 
															-                        f"{first_name}{second_name}",
														
 
															-                        item['title']
														
 
															-                    )
														
 
															-                    score = max(score1, score2)
														
 
															-                    
														
 
															-                    # 如果有详细定义，也计算
														
 
															-                    if raw_content:
														
 
															-                        score3 = self._calculate_enhanced_similarity(
														
 
															-                            second_name,
														
 
															-                            item['title'],
														
 
															-                            raw_content
														
 
															-                        )
														
 
															-                        score = max(score, score3)
														
 
															-                    
														
 
															-                    if score > best_score:
														
 
															-                        best_score = score
														
 
															-                        best_match = item
														
 
															-                
														
 
															-                if best_score >= threshold:
														
 
															-                    matched_second.add(req_key)
														
 
															-                    match_details.append({
														
 
															-                        'level': 'second',
														
 
															-                        'required_first_code': first_code,
														
 
															-                        'required_second_code': second_code,
														
 
															-                        'required_second_name': second_name,
														
 
															-                        'matched': True,
														
 
															-                        'match_type': 'fuzzy',
														
 
															-                        'similarity': best_score,
														
 
															-                        'matched_title': best_match['title'] if best_match else None,
														
 
															-                        'used_raw_content': raw_content is not None
														
 
															-                    })
														
 
															-                else:
														
 
															-                    missing_second.add(req_key)
														
 
															-                    match_details.append({
														
 
															-                        'level': 'second',
														
 
															-                        'required_first_code': first_code,
														
 
															-                        'required_second_code': second_code,
														
 
															-                        'required_second_name': second_name,
														
 
															-                        'matched': False,
														
 
															-                        'match_type': 'none',
														
 
															-                        'similarity': best_score
														
 
															-                    })
														
 
															-        else:
														
 
															-            missing_second = required_remaining
														
 
															-        
														
 
															-        # 构建缺失详情
														
 
															-        missing_first_details = []
														
 
															-        for code in sorted(missing_first, key=lambda x: self.first_seq.get(x, 0)):
														
 
															-            missing_first_details.append({
														
 
															-                'first_code': code,
														
 
															-                'first_name': self.first_names.get(code, code),
														
 
															-                'first_seq': self.first_seq.get(code, 0)
														
 
															+                'required_second_name': req_name,
														
 
															+                'matched': False,
														
 
															+                'match_type': 'none',
														
 
															+                'similarity': best_score,
														
 
															+                'best_attempt': best_attempt
														
 
															             })
														
 
															+            logger.debug(f"[二级缺失] {req_name} (最佳尝试: {best_attempt}, {best_score:.3f})")
														
 
															-        missing_second_details = []
														
 
															-        for key in sorted(missing_second, key=lambda x: (self.first_seq.get(x[0], 0), self.second_seq.get(x, 0))):
														
 
															-            first_code, second_code = key
														
 
															-            missing_second_details.append({
														
 
															-                'first_code': first_code,
														
 
															-                'first_name': self.first_names.get(first_code, first_code),
														
 
															-                'first_seq': self.first_seq.get(first_code, 0),
														
 
															-                'secondary_code': second_code,
														
 
															-                'secondary_name': self.second_names.get(key, ''),
														
 
															-                'second_seq': self.second_seq.get(key, 0)
														
 
															-            })
														
 
															+        logger.info(f"[独立模糊匹配] 完成：一级缺失 {len(missing_first)} 个，二级缺失 {len(missing_second)} 个")
														
 
															         return {
														
 
															             'matched_first': matched_first,
														
 
															             'matched_second': matched_second,
														
 
															-            'missing_first': missing_first_details,
														
 
															-            'missing_second': missing_second_details,
														
 
															+            'missing_first': missing_first,
														
 
															+            'missing_second': missing_second,
														
 
															             'missing_first_count': len(missing_first),
														
 
															             'missing_second_count': len(missing_second),
														
 
															             'match_details': match_details
														
--- a/core/construction_review/component/reviewers/standard_timeliness_reviewer.py
+++ b/core/construction_review/component/reviewers/standard_timeliness_reviewer.py
@@ -26,6 +26,10 @@
 
															         results = reviewer.review_standards(standards_list)
														
 
															 """
														
 
															 import asyncio
														
 
															+import json
														
 
															+import os
														
 
															+import threading
														
 
															+from datetime import datetime
														
 
															 from typing import List, Dict, Any, Optional
														
 
															 from dataclasses import dataclass, asdict
														
@@ -67,13 +71,14 @@ class StandardTimelinessReviewer:
 
															     对标准列表进行时效性审查。
														
 
															     """
														
 
															-    def __init__(self, db_pool=None, standard_service: Optional[StandardMatchingService] = None):
														
 
															+    def __init__(self, db_pool=None, standard_service: Optional[StandardMatchingService] = None, callback_task_id: Optional[str] = None):
														
 
															         """
														
 
															         初始化审查器
														
 
															         Args:
														
 
															             db_pool: 数据库连接池，用于初始化 StandardMatchingService（如未提供standard_service则必填）
														
 
															             standard_service: 已初始化的 StandardMatchingService 实例（优先级高于 db_pool）
														
 
															+            callback_task_id: 回调任务ID，用于持久化判定结果
														
 
															         Raises:
														
 
															             RuntimeError: 当db_pool和standard_service都为None时抛出异常
														
@@ -86,6 +91,8 @@ class StandardTimelinessReviewer:
 
															         self.db_pool = db_pool
														
 
															         self._service = standard_service
														
 
															         self._own_service = False  # 标记是否由本实例创建 service
														
 
															+        self.callback_task_id = callback_task_id
														
 
															+        self._log_lock = threading.Lock()
														
 
															     async def __aenter__(self):
														
 
															         """异步上下文管理器入口"""
														
@@ -102,6 +109,38 @@ class StandardTimelinessReviewer:
 
															             await self._service.close()
														
 
															         return False
														
 
															+    def _log_determination_results(self, review_results: List["TimelinessReviewResult"]) -> None:
														
 
															+        """将时效性判定结果持久化到JSON文件，不影响主逻辑"""
														
 
															+        if not self.callback_task_id:
														
 
															+            return
														
 
															+        try:
														
 
															+            with self._log_lock:
														
 
															+                log_dir = os.path.join("temp", "construction_review", "timeliness_result")
														
 
															+                os.makedirs(log_dir, exist_ok=True)
														
 
															+                log_path = os.path.join(log_dir, f"{self.callback_task_id}.json")
														
 
															+
														
 
															+                records = []
														
 
															+                if os.path.exists(log_path):
														
 
															+                    try:
														
 
															+                        with open(log_path, "r", encoding="utf-8") as f:
														
 
															+                            records = json.load(f)
														
 
															+                            if not isinstance(records, list):
														
 
															+                                records = []
														
 
															+                    except Exception:
														
 
															+                        records = []
														
 
															+
														
 
															+                for result in review_results:
														
 
															+                    records.append({
														
 
															+                        "timestamp": datetime.now().isoformat(),
														
 
															+                        "callback_task_id": self.callback_task_id,
														
 
															+                        **result.to_dict()
														
 
															+                    })
														
 
															+
														
 
															+                with open(log_path, "w", encoding="utf-8") as f:
														
 
															+                    json.dump(records, f, ensure_ascii=False, indent=2)
														
 
															+        except Exception as e:
														
 
															+            logger.warning(f"记录时效性判定结果失败: {e}")
														
 
															+
														
 
															     def review_standards(self, standards: List[Dict[str, str]]) -> List[TimelinessReviewResult]:
														
 
															         """
														
 
															         审查标准列表的时效性
														
@@ -112,7 +151,7 @@ class StandardTimelinessReviewer:
 
															                 - standard_number: 标准号
														
 
															         Returns:
														
 
															-            List[TimelinessReviewResult]: 审查结果列表
														
 
															+            List[TimelinessReviewResult]: 审查结果列表（文件名为空的会被过滤掉）
														
 
															         """
														
 
															         if not self._service:
														
 
															             raise RuntimeError("服务未初始化，请使用异步上下文管理器或调用 initialize()")
														
@@ -123,12 +162,15 @@ class StandardTimelinessReviewer:
 
															         # 转换为时效性审查结果
														
 
															         review_results = []
														
 
															         for match_result in match_results:
														
 
															-            review_result = self._convert_match_to_review_result(match_result)
														
 
															-            review_results.append(review_result)
														
 
															+            # 跳过 match 返回 None 的情况（文件名为空）
														
 
															+            if match_result is not None:
														
 
															+                review_result = self._convert_match_to_review_result(match_result)
														
 
															+                review_results.append(review_result)
														
 
															+        self._log_determination_results(review_results)
														
 
															         return review_results
														
 
															-    def review_single(self, standard_name: str, standard_number: str, seq_no: int = 1) -> TimelinessReviewResult:
														
 
															+    def review_single(self, standard_name: str, standard_number: str, seq_no: int = 1) -> Optional[TimelinessReviewResult]:
														
 
															         """
														
 
															         审查单个标准的时效性
														
@@ -139,12 +181,18 @@ class StandardTimelinessReviewer:
 
															         Returns:
														
 
															             TimelinessReviewResult: 审查结果
														
 
															+            None: 当文件名为空时返回 None，表示跳过审查
														
 
															         """
														
 
															         if not self._service:
														
 
															             raise RuntimeError("服务未初始化，请使用异步上下文管理器或调用 initialize()")
														
 
															         match_result = self._service.check_single(seq_no, standard_name, standard_number)
														
 
															-        return self._convert_match_to_review_result(match_result)
														
 
															+        # 如果 match 返回 None（文件名为空），则返回 None
														
 
															+        if match_result is None:
														
 
															+            return None
														
 
															+        review_result = self._convert_match_to_review_result(match_result)
														
 
															+        self._log_determination_results([review_result])
														
 
															+        return review_result
														
 
															     def _convert_match_to_review_result(self, match_result: StandardMatchResult) -> TimelinessReviewResult:
														
 
															         """
														
@@ -163,8 +211,8 @@ class StandardTimelinessReviewer:
 
															             # 正常状态 - 无风险
														
 
															             return TimelinessReviewResult(
														
 
															                 seq_no=match_result.seq_no,
														
 
															-                standard_name=match_result.original_name,
														
 
															-                standard_number=match_result.original_number,
														
 
															+                standard_name=match_result.raw_name,
														
 
															+                standard_number=match_result.raw_number,
														
 
															                 process_result=match_result.process_result,
														
 
															                 status_code=status_code,
														
 
															                 has_issue=False,
														
@@ -176,8 +224,8 @@ class StandardTimelinessReviewer:
 
															             # 被替代 - high（与原有逻辑一致）
														
 
															             return TimelinessReviewResult(
														
 
															                 seq_no=match_result.seq_no,
														
 
															-                standard_name=match_result.original_name,
														
 
															-                standard_number=match_result.original_number,
														
 
															+                standard_name=match_result.raw_name,
														
 
															+                standard_number=match_result.raw_number,
														
 
															                 process_result=match_result.process_result,
														
 
															                 status_code=status_code,
														
 
															                 has_issue=True,
														
@@ -194,8 +242,8 @@ class StandardTimelinessReviewer:
 
															             # 废止无替代 - high（与原有逻辑一致）
														
 
															             return TimelinessReviewResult(
														
 
															                 seq_no=match_result.seq_no,
														
 
															-                standard_name=match_result.original_name,
														
 
															-                standard_number=match_result.original_number,
														
 
															+                standard_name=match_result.raw_name,
														
 
															+                standard_number=match_result.raw_number,
														
 
															                 process_result=match_result.process_result,
														
 
															                 status_code=status_code,
														
 
															                 has_issue=True,
														
@@ -210,8 +258,8 @@ class StandardTimelinessReviewer:
 
															             # 不匹配 - high（与原有逻辑一致：编号错误属于high）
														
 
															             return TimelinessReviewResult(
														
 
															                 seq_no=match_result.seq_no,
														
 
															-                standard_name=match_result.original_name,
														
 
															-                standard_number=match_result.original_number,
														
 
															+                standard_name=match_result.raw_name,
														
 
															+                standard_number=match_result.raw_number,
														
 
															                 process_result=match_result.process_result,
														
 
															                 status_code=status_code,
														
 
															                 has_issue=True,
														
@@ -228,8 +276,8 @@ class StandardTimelinessReviewer:
 
															             # 标准库不存在 - 直接过滤，不返回问题
														
 
															             return TimelinessReviewResult(
														
 
															                 seq_no=match_result.seq_no,
														
 
															-                standard_name=match_result.original_name,
														
 
															-                standard_number=match_result.original_number,
														
 
															+                standard_name=match_result.raw_name,
														
 
															+                standard_number=match_result.raw_number,
														
 
															                 process_result=match_result.process_result,
														
 
															                 status_code=status_code,
														
 
															                 has_issue=False,
														
@@ -242,8 +290,8 @@ class StandardTimelinessReviewer:
 
															             logger.warning(f"未知的匹配状态码: {status_code}")
														
 
															             return TimelinessReviewResult(
														
 
															                 seq_no=match_result.seq_no,
														
 
															-                standard_name=match_result.original_name,
														
 
															-                standard_number=match_result.original_number,
														
 
															+                standard_name=match_result.raw_name,
														
 
															+                standard_number=match_result.raw_number,
														
 
															                 process_result="未知",
														
 
															                 status_code=status_code,
														
 
															                 has_issue=True,
														
@@ -253,6 +301,43 @@ class StandardTimelinessReviewer:
 
															                 final_result=match_result.final_result
														
 
															             )
														
 
															+    def _normalize_text(self, text: str) -> str:
														
 
															+        """
														
 
															+        规范化文本用于比较（与 StandardRepository._normalize_for_matching 保持一致）
														
 
															+        去除所有空白、标点符号、书名号、括号等
														
 
															+        从 config.ini 读取需要去除的符号
														
 
															+        """
														
 
															+        if not text:
														
 
															+            return ""
														
 
															+        import re
														
 
															+
														
 
															+        # 基础规范化（与 StandardRepository 一致）
														
 
															+        # 去除 HTML 标签
														
 
															+        text = re.sub(r'<[^>]+>', '', text)
														
 
															+        # 去除所有 Unicode 空白字符
														
 
															+        text = re.sub(r'\s+', '', text)
														
 
															+        # 去除书名号和括号（第一轮）
														
 
															+        text = text.replace('《', '').replace('》', '').replace('（', '').replace('）', '').replace('(', '').replace(')', '')
														
 
															+
														
 
															+        # 第二轮：从 config.ini 读取并去除指定符号
														
 
															+        default_symbols = '),-,.,/,,:,[,],【,】,〔,〕,（,）,－,—'
														
 
															+
														
 
															+        # 尝试从配置读取
														
 
															+        symbols_str = default_symbols
														
 
															+        try:
														
 
															+            from foundation.infrastructure.config.config import config_handler
														
 
															+            symbols_str = config_handler.get('timeliness_review', 'REMOVE_SYMBOLS', default_symbols)
														
 
															+        except Exception:
														
 
															+            pass  # 使用默认符号
														
 
															+
														
 
															+        # 解析并去除符号
														
 
															+        if symbols_str:
														
 
															+            symbols_to_remove = [s.strip() for s in symbols_str.split(',') if s.strip()]
														
 
															+            for symbol in symbols_to_remove:
														
 
															+                text = text.replace(symbol, '')
														
 
															+
														
 
															+        return text
														
 
															+
														
 
															     def convert_to_standardized_format(
														
 
															         self,
														
 
															         review_results: List[TimelinessReviewResult],
														
@@ -278,25 +363,36 @@ class StandardTimelinessReviewer:
 
															             # 标准库不存在或无问题的结果直接过滤，不返回
														
 
															             if result.status_code == MatchResultCode.NOT_FOUND.value or not result.has_issue:
														
 
															                 continue
														
 
															-            else:
														
 
															-                # 有问题
														
 
															-                standardized_results.append({
														
 
															-                    "check_item": check_item,
														
 
															-                    "chapter_code": chapter_code,
														
 
															-                    "check_item_code": check_item_code,
														
 
															-                    "check_result": {
														
 
															-                        "location": f"《{result.standard_name}》（{result.standard_number}）",
														
 
															-                        "description": result.reason or result.final_result,
														
 
															-                        "suggestion": result.suggestion,
														
 
															-                        "issue_type": result.issue_type,
														
 
															-                        "standard_name": result.standard_name,
														
 
															-                        "standard_number": result.standard_number,
														
 
															-                        "replacement_name": result.replacement_name,
														
 
															-                        "replacement_number": result.replacement_number,
														
 
															-                    },
														
 
															-                    "exist_issue": True,
														
 
															-                    "risk_info": {"risk_level": result.risk_level}
														
 
															-                })
														
 
															+
														
 
															+            # 【兜底逻辑】检查替代标准是否和原始标准实质相同（规范化后比较）
														
 
															+            if result.replacement_name and result.replacement_number:
														
 
															+                original_combined = self._normalize_text(f"{result.standard_name}{result.standard_number}")
														
 
															+                replacement_combined = self._normalize_text(f"{result.replacement_name}{result.replacement_number}")
														
 
															+
														
 
															+                if original_combined == replacement_combined:
														
 
															+                    logger.info(f"[兜底过滤] 替代标准与原始标准实质相同，跳过: "
														
 
															+                                f"{result.standard_name}({result.standard_number}) ~ "
														
 
															+                                f"{result.replacement_name}({result.replacement_number})")
														
 
															+                    continue  # 跳过这条问题，视为无风险
														
 
															+
														
 
															+            # 有问题
														
 
															+            standardized_results.append({
														
 
															+                "check_item": check_item,
														
 
															+                "chapter_code": chapter_code,
														
 
															+                "check_item_code": check_item_code,
														
 
															+                "check_result": {
														
 
															+                    "location": f"《{result.standard_name}》（{result.standard_number}）",
														
 
															+                    "description": result.reason or result.final_result,
														
 
															+                    "suggestion": result.suggestion,
														
 
															+                    "issue_type": result.issue_type,
														
 
															+                    "standard_name": result.standard_name,
														
 
															+                    "standard_number": result.standard_number,
														
 
															+                    "replacement_name": result.replacement_name,
														
 
															+                    "replacement_number": result.replacement_number,
														
 
															+                },
														
 
															+                "exist_issue": True,
														
 
															+                "risk_info": {"risk_level": result.risk_level}
														
 
															+            })
														
 
															         return standardized_results
														
--- a/core/construction_review/component/reviewers/timeliness_basis_reviewer.py
+++ b/core/construction_review/component/reviewers/timeliness_basis_reviewer.py
@@ -388,6 +388,10 @@ class BasisReviewService:
 
															         start_time = time.time()
														
 
															         total_batches = (len(items) + 2) // 3  # 计算总批次数
														
 
															+
														
 
															+        # 绑定 callback_task_id 到时效性审查器，用于记录判定结果
														
 
															+        if self._timeliness_reviewer and callback_task_id:
														
 
															+            self._timeliness_reviewer.callback_task_id = callback_task_id
														
 
															         # 发送开始审查的SSE推送(使用独立命名空间，避免与主流程进度冲突)
														
 
															         if progress_manager and callback_task_id:
														
--- a/core/construction_review/component/reviewers/timeliness_content_reviewer.py
+++ b/core/construction_review/component/reviewers/timeliness_content_reviewer.py
@@ -276,6 +276,9 @@ class ContentTimelinessReviewer:
 
															         try:
														
 
															             async with self._semaphore:
														
 
															+                # 绑定 callback_task_id，用于记录判定结果
														
 
															+                if callback_task_id:
														
 
															+                    self._timeliness_reviewer.callback_task_id = callback_task_id
														
 
															                 # 执行规则匹配审查
														
 
															                 review_results = self._timeliness_reviewer.review_standards(standards_list)
														
--- a/core/construction_review/component/reviewers/utils/directory_extraction.py
+++ b/core/construction_review/component/reviewers/utils/directory_extraction.py
@@ -43,7 +43,8 @@ SYSTEM = """
 
															 1) 只抽取包含书名号《 》的条目。
														
 
															 2) 每条条目包括：title（《》内名称，去掉书名号）、suffix（《》后面的版本/日期/修订说明，可为空）、raw（该条目原文）。
														
 
															 3) 忽略标题行、段落说明、无《》的行。
														
 
															-4) 输出必须严格符合格式要求，不要输出任何额外文字。
														
 
															+4) **重要：title 和 raw 必须保留原文的所有空格和格式，不要修改或去除任何空格。**
														
 
															+5) 输出必须严格符合格式要求，不要输出任何额外文字。
														
 
															 """
														
 
															 HUMAN ="""
														
 
															 文本如下：
														
--- a/core/construction_review/component/standard_matching/standard_dao.py
+++ b/core/construction_review/component/standard_matching/standard_dao.py
@@ -12,7 +12,7 @@ class StandardDAO:
 
															     def __init__(self, db_pool):
														
 
															         self.db_pool = db_pool
														
 
															-        self.table_name = "t_samp_standard_base_info"
														
 
															+        self.table_name = "t_samp_standard_base_info_status"
														
 
															     async def load_all_standards(self) -> List[Dict]:
														
 
															         """
														
--- a/core/construction_review/component/standard_matching/standard_service.py
+++ b/core/construction_review/component/standard_matching/standard_service.py
@@ -15,6 +15,14 @@ from enum import Enum
 
															 from foundation.observability.logger.loggering import review_logger as logger
														
 
															+# 导入配置处理器
														
 
															+try:
														
 
															+    from foundation.infrastructure.config.config import config_handler
														
 
															+    _CONFIG_AVAILABLE = True
														
 
															+except ImportError:
														
 
															+    _CONFIG_AVAILABLE = False
														
 
															+    config_handler = None
														
 
															+
														
 
															 class ValidityStatus(Enum):
														
 
															     """时效性状态"""
														
@@ -36,8 +44,12 @@ class MatchResultCode(Enum):
 
															 class StandardMatchResult:
														
 
															     """标准匹配结果数据结构"""
														
 
															     seq_no: int = 0                             # 序号
														
 
															-    original_name: str = ""                      # 原始标准名称
														
 
															-    original_number: str = ""                    # 原始标准号
														
 
															+    raw_name: str = ""                           # 原始输入名称（未修改，用于返回）
														
 
															+    raw_number: str = ""                         # 原始输入标准号（未修改，用于返回）
														
 
															+    normalized_name: str = ""                    # 规范化名称（用于匹配）
														
 
															+    normalized_number: str = ""                  # 规范化标准号（用于匹配）
														
 
															+    matched_name: str = ""                       # 匹配到的数据库原始名称
														
 
															+    matched_number: str = ""                     # 匹配到的数据库原始标准号
														
 
															     substitute_number: Optional[str] = None      # 替代标准号（如果有）
														
 
															     substitute_name: Optional[str] = None        # 替代标准名称（如果有）
														
 
															     process_result: str = ""                     # 处理结果状态
														
@@ -49,8 +61,10 @@ class StandardMatchResult:
 
															 class StandardRecord:
														
 
															     """标准记录数据结构"""
														
 
															     id: int
														
 
															-    standard_name: str
														
 
															-    standard_number: str
														
 
															+    standard_name: str           # 原始名称（数据库中的值，用于返回）
														
 
															+    standard_number: str         # 原始标准号（用于返回）
														
 
															+    normalized_name: str         # 规范化名称（用于匹配）
														
 
															+    normalized_number: str       # 规范化标准号（用于匹配）
														
 
															     validity: str
														
@@ -64,14 +78,19 @@ class StandardRepository:
 
															         # 原始数据列表
														
 
															         self._records: List[StandardRecord] = []
														
 
															-        # 索引结构，加速查询
														
 
															+        # 原始索引（用于返回数据）
														
 
															         self._number_index: Dict[str, StandardRecord] = {}  # 标准号 -> 记录
														
 
															         self._name_index: Dict[str, List[StandardRecord]] = {}  # 名称 -> 记录列表
														
 
															         self._current_records: List[StandardRecord] = []  # 现行/试行标准列表
														
 
															+        # 规范化索引（用于匹配）
														
 
															+        self._normalized_number_index: Dict[str, StandardRecord] = {}  # 规范化标准号 -> 记录
														
 
															+        self._normalized_name_index: Dict[str, List[StandardRecord]] = {}  # 规范化名称 -> 记录列表
														
 
															+
														
 
															     def load_data(self, raw_data: List[Dict]):
														
 
															         """
														
 
															         加载原始数据到内存并建立索引
														
 
															+        同时创建规范化索引用于匹配
														
 
															         Args:
														
 
															             raw_data: 从数据库查询的原始标准数据列表
														
@@ -80,6 +99,8 @@ class StandardRepository:
 
															         self._number_index = {}
														
 
															         self._name_index = {}
														
 
															         self._current_records = []
														
 
															+        self._normalized_number_index = {}
														
 
															+        self._normalized_name_index = {}
														
 
															         for item in raw_data:
														
 
															             # 跳过无效数据
														
@@ -88,28 +109,37 @@ class StandardRepository:
 
															             if not standard_number or not standard_name:
														
 
															                 continue
														
 
															+            # 创建规范化版本（用于匹配）
														
 
															+            normalized_name = self._normalize_for_matching(standard_name)
														
 
															+            normalized_number = self._normalize_for_matching(standard_number)
														
 
															+
														
 
															             record = StandardRecord(
														
 
															                 id=item.get("id", 0),
														
 
															-                standard_name=standard_name,
														
 
															-                standard_number=standard_number,
														
 
															+                standard_name=standard_name,           # 原始名称（用于返回）
														
 
															+                standard_number=standard_number,       # 原始标准号（用于返回）
														
 
															+                normalized_name=normalized_name,       # 规范化名称（用于匹配）
														
 
															+                normalized_number=normalized_number,   # 规范化标准号（用于匹配）
														
 
															                 validity=item.get("validity", "")
														
 
															             )
														
 
															             self._records.append(record)
														
 
															-            # 建立标准号索引
														
 
															+            # 建立原始索引（用于返回数据）
														
 
															             self._number_index[record.standard_number] = record
														
 
															-
														
 
															-            # 建立名称索引（一个名称可能对应多个标准号）
														
 
															             if record.standard_name not in self._name_index:
														
 
															                 self._name_index[record.standard_name] = []
														
 
															             self._name_index[record.standard_name].append(record)
														
 
															+            # 建立规范化索引（用于匹配）
														
 
															+            self._normalized_number_index[record.normalized_number] = record
														
 
															+            if record.normalized_name not in self._normalized_name_index:
														
 
															+                self._normalized_name_index[record.normalized_name] = []
														
 
															+            self._normalized_name_index[record.normalized_name].append(record)
														
 
															+
														
 
															             # 收集现行/试行标准
														
 
															             if record.validity in [ValidityStatus.CURRENT.value, ValidityStatus.TRIAL.value]:
														
 
															                 self._current_records.append(record)
														
 
															         # 对现行标准按标准号降序排序（用于找最新替代标准）
														
 
															-        # 处理可能的 None 值
														
 
															         self._current_records.sort(
														
 
															             key=lambda r: r.standard_number or "",
														
 
															             reverse=True
														
@@ -134,40 +164,98 @@ class StandardRepository:
 
															         return results
														
 
															     def find_by_number_fuzzy(self, standard_number: str) -> List[StandardRecord]:
														
 
															-        """模糊匹配标准号"""
														
 
															+        """模糊匹配标准号（使用规范化数据）"""
														
 
															         results = []
														
 
															-        # 提取前缀（如 GB/T 5972）
														
 
															-        parts = standard_number.split("-")
														
 
															-        prefix = parts[0] if parts else standard_number
														
 
															+        # 规范化输入的标准号
														
 
															+        normalized_input = self._normalize_for_matching(standard_number)
														
 
															-        for number, record in self._number_index.items():
														
 
															-            # 前缀匹配
														
 
															-            if number.startswith(prefix):
														
 
															+        # 使用规范化索引进行前缀匹配
														
 
															+        for normalized_number, record in self._normalized_number_index.items():
														
 
															+            # 前缀匹配：检查是否以规范化后的输入开头，或包含关系
														
 
															+            if normalized_number.startswith(normalized_input) or normalized_input in normalized_number:
														
 
															                 results.append(record)
														
 
															         return results
														
 
															-    def find_current_by_name(self, standard_name: str) -> List[StandardRecord]:
														
 
															-        """查询指定名称的现行/试行标准（支持模糊匹配）"""
														
 
															+    def find_current_by_name(self, normalized_standard_name: str) -> List[StandardRecord]:
														
 
															+        """查询指定名称的现行/试行标准（使用规范化名称匹配）"""
														
 
															         results = []
														
 
															         for record in self._current_records:
														
 
															-            # 精确匹配
														
 
															-            if record.standard_name == standard_name:
														
 
															-                results.append(record)
														
 
															-            # 模糊匹配（忽略空格、书名号等）
														
 
															-            elif self._is_name_fuzzy_match_for_repo(record.standard_name, standard_name):
														
 
															+            # 使用规范化名称匹配
														
 
															+            if record.normalized_name == normalized_standard_name:
														
 
															                 results.append(record)
														
 
															         return results
														
 
															-    def _is_name_fuzzy_match_for_repo(self, name1: str, name2: str) -> bool:
														
 
															-        """判断两个标准名称是否模糊匹配"""
														
 
															-        clean1 = name1.replace("《", "").replace("》", "").replace(" ", "").replace("　", "")
														
 
															-        clean2 = name2.replace("《", "").replace("》", "").replace(" ", "").replace("　", "")
														
 
															-        return clean1 == clean2
														
 
															+    def _is_name_fuzzy_match_for_repo(self, normalized_name1: str, normalized_name2: str) -> bool:
														
 
															+        """判断两个标准名称是否模糊匹配（使用规范化名称）"""
														
 
															+        return normalized_name1 == normalized_name2
														
 
															     def get_all_records(self) -> List[StandardRecord]:
														
 
															         """获取所有记录"""
														
 
															         return self._records.copy()
														
 
															+    def _normalize_for_matching(self, text: str) -> str:
														
 
															+        """
														
 
															+        规范化文本用于匹配
														
 
															+        第一轮：去除所有空白字符（包括空格、不间断空格、换行符等）、书名号、括号和 HTML 标签
														
 
															+        第二轮：从配置读取并去除指定符号
														
 
															+
														
 
															+        Args:
														
 
															+            text: 原始文本
														
 
															+
														
 
															+        Returns:
														
 
															+            规范化后的字符串（去除所有空白、分隔符、HTML 标签和配置指定的符号）
														
 
															+        """
														
 
															+        if not text:
														
 
															+            return ""
														
 
															+
														
 
															+        import re
														
 
															+
														
 
															+        # ========== 第一轮：基础规范化 ==========
														
 
															+        # 去除 HTML 标签（如 <1680>）
														
 
															+        text = re.sub(r'<[^>]+>', '', text)
														
 
															+        # 去除所有 Unicode 空白字符（包括普通空格、不间断空格、换行等）
														
 
															+        text = re.sub(r'\s+', '', text)
														
 
															+        # 去除书名号和括号
														
 
															+        text = text.replace('《', '').replace('》', '').replace('（', '').replace('）', '').replace('(', '').replace(')', '')
														
 
															+
														
 
															+        # ========== 第二轮：从配置读取并去除指定符号 ==========
														
 
															+        # 读取配置中的符号列表，默认使用常见符号
														
 
															+        # 包含各种连接符：半角连字符(-)、全角连接号(－)、全角破折号(—)
														
 
															+        default_symbols = '),-,.,/,,:,[,],【,】,〔,〕,（,）,－,—'
														
 
															+
														
 
															+        if _CONFIG_AVAILABLE and config_handler:
														
 
															+            try:
														
 
															+                symbols_str = config_handler.get('timeliness_review', 'REMOVE_SYMBOLS', default_symbols)
														
 
															+            except Exception:
														
 
															+                symbols_str = default_symbols
														
 
															+        else:
														
 
															+            symbols_str = default_symbols
														
 
															+
														
 
															+        # 解析符号列表（按逗号分割）
														
 
															+        if symbols_str:
														
 
															+            symbols_to_remove = [s.strip() for s in symbols_str.split(',') if s.strip()]
														
 
															+            # 去除每个符号
														
 
															+            for symbol in symbols_to_remove:
														
 
															+                text = text.replace(symbol, '')
														
 
															+
														
 
															+        return text
														
 
															+
														
 
															+    def find_by_normalized_number(self, normalized_number: str) -> Optional[StandardRecord]:
														
 
															+        """通过规范化标准号精确匹配"""
														
 
															+        return self._normalized_number_index.get(normalized_number)
														
 
															+
														
 
															+    def find_by_normalized_name(self, normalized_name: str) -> List[StandardRecord]:
														
 
															+        """通过规范化名称匹配"""
														
 
															+        return self._normalized_name_index.get(normalized_name, [])
														
 
															+
														
 
															+    def find_current_by_normalized_name(self, normalized_name: str) -> List[StandardRecord]:
														
 
															+        """查询指定规范化名称的现行/试行标准"""
														
 
															+        results = []
														
 
															+        for record in self._current_records:
														
 
															+            if record.normalized_name == normalized_name:
														
 
															+                results.append(record)
														
 
															+        return results
														
 
															+
														
 
															 class StandardMatcher:
														
 
															     """
														
@@ -178,52 +266,70 @@ class StandardMatcher:
 
															     def __init__(self, repository: StandardRepository):
														
 
															         self.repo = repository
														
 
															-    def match(self, seq_no: int, input_name: str, input_number: str) -> StandardMatchResult:
														
 
															+    def match(self, seq_no: int, input_name: str, input_number: str) -> Optional[StandardMatchResult]:
														
 
															         """
														
 
															         执行标准匹配
														
 
															         匹配流程:
														
 
															-        1. 标准号精确匹配
														
 
															-        2. 根据匹配结果进入不同分支处理
														
 
															+        1. 保存原始输入（用于返回）
														
 
															+        2. 创建规范化版本（用于匹配）
														
 
															+        3. 如果规范化后文件名为空，返回 None（跳过审查）
														
 
															+        4. 使用规范化数据进行匹配
														
 
															+        5. 返回结果中使用原始数据
														
 
															+
														
 
															+        Returns:
														
 
															+            StandardMatchResult: 匹配结果
														
 
															+            None: 当规范化文件名为空时返回 None，表示跳过审查
														
 
															         """
														
 
															-        # 去除前后空格
														
 
															-        input_name = input_name.strip() if input_name else input_name
														
 
															-        input_number = input_number.strip() if input_number else input_number
														
 
															+        # 1. 保存原始输入
														
 
															+        raw_name = input_name.strip() if input_name else ""
														
 
															+        raw_number = input_number.strip() if input_number else ""
														
 
															+
														
 
															+        # 2. 创建规范化版本（去除所有符号，只保留中文字符）
														
 
															+        normalized_name = self.repo._normalize_for_matching(raw_name)
														
 
															+        normalized_number = self.repo._normalize_for_matching(raw_number)
														
 
															-        # 清洗书名号和括号
														
 
															-        input_name = self._clean_brackets_and_booknames(input_name)
														
 
															-        input_number = self._clean_brackets_and_booknames(input_number)
														
 
															+        # 3. 如果规范化后文件名为空，跳过审查
														
 
															+        if not normalized_name:
														
 
															+            logger.info(f"文件名规范化后为空，跳过审查。原始名称: '{raw_name}'")
														
 
															+            return None
														
 
															+        # 4. 初始化结果（保存原始和规范化数据）
														
 
															         result = StandardMatchResult(
														
 
															             seq_no=seq_no,
														
 
															-            original_name=input_name,
														
 
															-            original_number=input_number
														
 
															+            raw_name=raw_name,
														
 
															+            raw_number=raw_number,
														
 
															+            normalized_name=normalized_name,
														
 
															+            normalized_number=normalized_number
														
 
															         )
														
 
															-        # 步骤1: 精确匹配标准号
														
 
															-        match_by_number = self.repo.find_by_number_exact(input_number)
														
 
															+        # 5. 使用规范化数据进行匹配
														
 
															+        match_by_number = self.repo.find_by_normalized_number(normalized_number)
														
 
															         if match_by_number:
														
 
															             # 分支A: 标准号匹配成功
														
 
															-            return self._handle_number_matched(result, match_by_number, input_name)
														
 
															+            return self._handle_number_matched(result, match_by_number)
														
 
															         else:
														
 
															             # 分支B: 标准号未匹配
														
 
															-            return self._handle_number_not_matched(result, input_name, input_number)
														
 
															+            return self._handle_number_not_matched(result, normalized_name, normalized_number)
														
 
															     def _handle_number_matched(
														
 
															         self,
														
 
															         result: StandardMatchResult,
														
 
															-        db_record: StandardRecord,
														
 
															-        input_name: str
														
 
															+        db_record: StandardRecord
														
 
															     ) -> StandardMatchResult:
														
 
															         """处理标准号匹配成功的情况"""
														
 
															-        # 检查名称是否匹配
														
 
															-        if db_record.standard_name == input_name:
														
 
															+        # 保存匹配到的数据库原始数据
														
 
															+        result.matched_name = db_record.standard_name
														
 
															+        result.matched_number = db_record.standard_number
														
 
															+
														
 
															+        # 使用规范化名称进行比较
														
 
															+        if db_record.normalized_name == result.normalized_name:
														
 
															             # 名称也匹配
														
 
															             return self._handle_full_match(result, db_record)
														
 
															         else:
														
 
															             # 名称不匹配
														
 
															-            return self._handle_name_mismatch(result, db_record, input_name)
														
 
															+            return self._handle_name_mismatch(result, db_record)
														
 
															     def _handle_full_match(
														
 
															         self,
														
@@ -231,39 +337,45 @@ class StandardMatcher:
 
															         db_record: StandardRecord
														
 
															     ) -> StandardMatchResult:
														
 
															         """处理名称和标准号都完全匹配的情况"""
														
 
															+        # 【调试日志】
														
 
															+        logger.info(f"[_handle_full_match] 匹配记录: name={db_record.standard_name}, "
														
 
															+                    f"number={db_record.standard_number}, validity={db_record.validity} "
														
 
															+                    f"(期望: {ValidityStatus.CURRENT.value}/{ValidityStatus.TRIAL.value}, "
														
 
															+                    f"实际是否匹配: {db_record.validity in [ValidityStatus.CURRENT.value, ValidityStatus.TRIAL.value]})")
														
 
															+
														
 
															         if db_record.validity in [ValidityStatus.CURRENT.value, ValidityStatus.TRIAL.value]:
														
 
															             # 情况1: 现行或试行 - 状态正常
														
 
															             return self._set_ok_result(result)
														
 
															         else:
														
 
															             # 废止状态 - 查找替代标准
														
 
															+            logger.info(f"[_handle_full_match] 进入废止处理流程")
														
 
															             return self._handle_abolished(result, db_record)
														
 
															     def _handle_name_mismatch(
														
 
															         self,
														
 
															         result: StandardMatchResult,
														
 
															-        db_record: StandardRecord,
														
 
															-        input_name: str
														
 
															+        db_record: StandardRecord
														
 
															     ) -> StandardMatchResult:
														
 
															         """处理标准号匹配但名称不匹配的情况"""
														
 
															-        # 首先检查是否是名称模糊匹配（忽略空格、书名号等）
														
 
															-        if self._is_name_fuzzy_match(db_record.standard_name, input_name):
														
 
															-            # 名称模糊匹配成功，按完全匹配处理
														
 
															+        # 首先检查是否是名称模糊匹配（使用规范化名称）
														
 
															+        if self._is_name_fuzzy_match(db_record.normalized_name, result.normalized_name):
														
 
															+            # 名称规范化后匹配成功，按完全匹配处理
														
 
															             return self._handle_full_match(result, db_record)
														
 
															-        # 尝试用输入的名称模糊匹配
														
 
															-        name_matches = self.repo.find_by_name_fuzzy(input_name)
														
 
															+        # 尝试用规范化名称模糊匹配
														
 
															+        name_matches = self.repo.find_by_normalized_name(result.normalized_name)
														
 
															-        # 查找精确名称匹配
														
 
															-        exact_match = self._find_exact_name_match(name_matches, input_name)
														
 
															+        # 查找精确名称匹配（使用规范化名称）
														
 
															+        exact_match = self._find_exact_name_match(name_matches, result.normalized_name)
														
 
															         if exact_match:
														
 
															-            # 找到名称匹配的记录
														
 
															-            return self._handle_fuzzy_name_match(result, exact_match)
														
 
															-
														
 
															-        # 尝试在模糊匹配结果中查找模糊名称匹配
														
 
															-        for match in name_matches:
														
 
															-            if self._is_name_fuzzy_match(match.standard_name, input_name):
														
 
															-                return self._handle_fuzzy_name_match(result, match)
														
 
															+            # 找到名称匹配的记录，检查标准号是否一致
														
 
															+            if result.normalized_number == exact_match.normalized_number:
														
 
															+                # 标准号实质一致，按完全匹配处理
														
 
															+                return self._handle_full_match(result, exact_match)
														
 
															+            else:
														
 
															+                # 名称匹配但标准号不一致 = 标准号错误
														
 
															+                return self._set_mismatch_result(result, exact_match)
														
 
															         # 名称完全不匹配，但标准号已匹配成功
														
 
															         # 说明该标准存在于库中，应返回不匹配而非不存在
														
@@ -277,42 +389,34 @@ class StandardMatcher:
 
															     def _handle_number_not_matched(
														
 
															         self,
														
 
															         result: StandardMatchResult,
														
 
															-        input_name: str,
														
 
															-        input_number: str
														
 
															+        normalized_name: str,
														
 
															+        normalized_number: str
														
 
															     ) -> StandardMatchResult:
														
 
															         """处理标准号未匹配的情况"""
														
 
															-        # 尝试模糊匹配标准号
														
 
															-        fuzzy_number_matches = self.repo.find_by_number_fuzzy(input_number)
														
 
															+        # 尝试模糊匹配标准号（使用原始数据的方法，可能需要改进）
														
 
															+        fuzzy_number_matches = self.repo.find_by_number_fuzzy(normalized_number)
														
 
															         if fuzzy_number_matches:
														
 
															             # 检查名称是否匹配
														
 
															-            return self._check_name_in_records(result, fuzzy_number_matches, input_name)
														
 
															+            return self._check_name_in_records(result, fuzzy_number_matches, normalized_name)
														
 
															         else:
														
 
															             # 尝试直接按名称查询
														
 
															-            return self._search_by_name_only(result, input_name)
														
 
															+            return self._search_by_name_only(result, normalized_name)
														
 
															     def _check_name_in_records(
														
 
															         self,
														
 
															         result: StandardMatchResult,
														
 
															         records: List[StandardRecord],
														
 
															-        input_name: str
														
 
															+        normalized_name: str
														
 
															     ) -> StandardMatchResult:
														
 
															-        """在一批记录中查找名称匹配"""
														
 
															-        # 首先尝试精确匹配
														
 
															+        """在一批记录中查找名称匹配（标准号已模糊匹配成功）"""
														
 
															+        # 首先尝试精确匹配（使用规范化名称）
														
 
															         for record in records:
														
 
															-            if record.standard_name == input_name:
														
 
															+            if record.normalized_name == normalized_name:
														
 
															                 # 名称匹配，检查状态
														
 
															                 if record.validity in [ValidityStatus.CURRENT.value, ValidityStatus.TRIAL.value]:
														
 
															-                    return self._set_mismatch_result(result, record)
														
 
															-                elif record.validity == ValidityStatus.ABOLISHED.value:
														
 
															-                    return self._handle_abolished(result, record)
														
 
															-
														
 
															-        # 尝试模糊名称匹配（忽略空格和书名号）
														
 
															-        for record in records:
														
 
															-            if self._is_name_fuzzy_match(record.standard_name, input_name):
														
 
															-                # 名称模糊匹配成功
														
 
															-                if record.validity in [ValidityStatus.CURRENT.value, ValidityStatus.TRIAL.value]:
														
 
															-                    return self._set_mismatch_result(result, record)
														
 
															+                    # 标准号模糊匹配成功 + 名称匹配 + 现行/试行 = 正常
														
 
															+                    return self._set_ok_result(result)
														
 
															                 elif record.validity == ValidityStatus.ABOLISHED.value:
														
 
															                     return self._handle_abolished(result, record)
														
@@ -322,35 +426,22 @@ class StandardMatcher:
 
															     def _search_by_name_only(
														
 
															         self,
														
 
															         result: StandardMatchResult,
														
 
															-        input_name: str
														
 
															+        normalized_name: str
														
 
															     ) -> StandardMatchResult:
														
 
															-        """仅通过名称查询"""
														
 
															-        # 精确匹配名称
														
 
															-        name_match = self.repo.find_by_name_exact(input_name)
														
 
															+        """仅通过名称查询（标准号未匹配）"""
														
 
															+        # 精确匹配规范化名称
														
 
															+        name_matches = self.repo.find_by_normalized_name(normalized_name)
														
 
															-        if name_match:
														
 
															+        if name_matches:
														
 
															+            # 取第一个匹配的记录
														
 
															+            name_match = name_matches[0]
														
 
															             if name_match.validity in [ValidityStatus.CURRENT.value, ValidityStatus.TRIAL.value]:
														
 
															+                # 标准号不匹配但名称匹配 + 现行/试行 = 标准号错误（不匹配）
														
 
															                 return self._set_mismatch_result(result, name_match)
														
 
															             elif name_match.validity == ValidityStatus.ABOLISHED.value:
														
 
															-                return self._set_not_found_result(result)
														
 
															-
														
 
															-        # 模糊匹配名称
														
 
															-        fuzzy_matches = self.repo.find_by_name_fuzzy(input_name)
														
 
															-
														
 
															-        # 首先尝试精确匹配
														
 
															-        exact_match = self._find_exact_name_match(fuzzy_matches, input_name)
														
 
															-        if exact_match:
														
 
															-            if exact_match.validity in [ValidityStatus.CURRENT.value, ValidityStatus.TRIAL.value]:
														
 
															-                return self._set_mismatch_result(result, exact_match)
														
 
															-
														
 
															-        # 尝试模糊名称匹配（忽略空格、书名号等）
														
 
															-        for match in fuzzy_matches:
														
 
															-            if self._is_name_fuzzy_match(match.standard_name, input_name):
														
 
															-                if match.validity in [ValidityStatus.CURRENT.value, ValidityStatus.TRIAL.value]:
														
 
															-                    return self._set_mismatch_result(result, match)
														
 
															-                elif match.validity == ValidityStatus.ABOLISHED.value:
														
 
															-                    return self._handle_abolished(result, match)
														
 
															+                return self._handle_abolished(result, name_match)
														
 
															+        # 名称未找到
														
 
															         return self._set_not_found_result(result)
														
 
															     def _handle_fuzzy_name_match(
														
@@ -358,9 +449,10 @@ class StandardMatcher:
 
															         result: StandardMatchResult,
														
 
															         match_record: StandardRecord
														
 
															     ) -> StandardMatchResult:
														
 
															-        """处理模糊名称匹配成功的情况"""
														
 
															+        """处理模糊名称匹配成功的情况（标准号已匹配）"""
														
 
															         if match_record.validity in [ValidityStatus.CURRENT.value, ValidityStatus.TRIAL.value]:
														
 
															-            return self._set_mismatch_result(result, match_record)
														
 
															+            # 标准号匹配 + 名称模糊匹配 + 现行/试行 = 正常
														
 
															+            return self._set_ok_result(result)
														
 
															         elif match_record.validity == ValidityStatus.ABOLISHED.value:
														
 
															             return self._handle_abolished(result, match_record)
														
 
															         return self._set_not_found_result(result)
														
@@ -371,8 +463,8 @@ class StandardMatcher:
 
															         abolished_record: StandardRecord
														
 
															     ) -> StandardMatchResult:
														
 
															         """处理已废止标准的情况"""
														
 
															-        # 查询同名现行标准作为替代
														
 
															-        substitutes = self.repo.find_current_by_name(abolished_record.standard_name)
														
 
															+        # 查询同名现行标准作为替代（使用规范化名称）
														
 
															+        substitutes = self.repo.find_current_by_normalized_name(abolished_record.normalized_name)
														
 
															         if substitutes:
														
 
															             # 有替代标准，取最新的（已按标准号降序）
														
@@ -422,26 +514,27 @@ class StandardMatcher:
 
															         result: StandardMatchResult,
														
 
															         substitute: StandardRecord
														
 
															     ) -> StandardMatchResult:
														
 
															-        """设置被替代的结果"""
														
 
															+        """设置被替代的结果 - 使用原始数据显示"""
														
 
															         result.substitute_name = self._format_standard_name(substitute.standard_name)
														
 
															         result.substitute_number = self._format_standard_number(substitute.standard_number)
														
 
															         result.process_result = "被替代"
														
 
															         result.status_code = MatchResultCode.SUBSTITUTED.value
														
 
															+        # 使用 raw_name（原始输入）和 matched_name（数据库原始值）显示
														
 
															         result.final_result = (
														
 
															-            f"{self._format_standard_name(result.original_name)}"
														
 
															-            f"{self._format_standard_number(result.original_number)}已废止，"
														
 
															+            f"{self._format_standard_name(result.raw_name)}"
														
 
															+            f"{self._format_standard_number(result.raw_number)}已废止，"
														
 
															             f"替代{self._format_standard_name(substitute.standard_name)}"
														
 
															             f"{self._format_standard_number(substitute.standard_number)}"
														
 
															         )
														
 
															         return result
														
 
															     def _set_abolished_result(self, result: StandardMatchResult) -> StandardMatchResult:
														
 
															-        """设置废止无替代的结果"""
														
 
															+        """设置废止无替代的结果 - 使用原始数据显示"""
														
 
															         result.process_result = "废止无现行"
														
 
															         result.status_code = MatchResultCode.ABOLISHED.value
														
 
															         result.final_result = (
														
 
															-            f"{self._format_standard_name(result.original_name)}"
														
 
															-            f"{self._format_standard_number(result.original_number)}已废止，无现行状态"
														
 
															+            f"{self._format_standard_name(result.raw_name)}"
														
 
															+            f"{self._format_standard_number(result.raw_number)}已废止，无现行状态"
														
 
															         )
														
 
															         return result
														
@@ -450,40 +543,37 @@ class StandardMatcher:
 
															         result: StandardMatchResult,
														
 
															         actual: StandardRecord
														
 
															     ) -> StandardMatchResult:
														
 
															-        """设置不匹配的结果"""
														
 
															+        """设置不匹配的结果 - 使用原始数据显示"""
														
 
															         result.substitute_name = self._format_standard_name(actual.standard_name)
														
 
															         result.substitute_number = self._format_standard_number(actual.standard_number)
														
 
															         result.process_result = "不匹配"
														
 
															         result.status_code = MatchResultCode.MISMATCH.value
														
 
															         result.final_result = (
														
 
															-            f"{self._format_standard_name(result.original_name)}"
														
 
															-            f"{self._format_standard_number(result.original_number)}"
														
 
															+            f"{self._format_standard_name(result.raw_name)}"
														
 
															+            f"{self._format_standard_number(result.raw_number)}"
														
 
															             f"与实际{self._format_standard_name(actual.standard_name)}"
														
 
															             f"{self._format_standard_number(actual.standard_number)}不匹配"
														
 
															         )
														
 
															         return result
														
 
															     def _set_not_found_result(self, result: StandardMatchResult) -> StandardMatchResult:
														
 
															-        """设置不存在的结果"""
														
 
															+        """设置不存在的结果 - 使用原始数据显示"""
														
 
															         result.process_result = "标准库不存在"
														
 
															         result.status_code = MatchResultCode.NOT_FOUND.value
														
 
															         result.final_result = (
														
 
															-            f"{self._format_standard_name(result.original_name)}"
														
 
															-            f"{self._format_standard_number(result.original_number)}标准库不存在，请确认"
														
 
															+            f"{self._format_standard_name(result.raw_name)}"
														
 
															+            f"{self._format_standard_number(result.raw_number)}标准库不存在，请确认"
														
 
															         )
														
 
															         return result
														
 
															     # ========== 工具方法 ==========
														
 
															-    def _is_name_fuzzy_match(self, name1: str, name2: str) -> bool:
														
 
															+    def _is_name_fuzzy_match(self, normalized_name1: str, normalized_name2: str) -> bool:
														
 
															         """
														
 
															         判断两个标准名称是否模糊匹配
														
 
															-        只去除书名号，保留中间空格（中间空格属于名称的一部分）
														
 
															+        使用规范化后的名称进行比较（已去除空格、括号、书名号等）
														
 
															         """
														
 
															-        # 清理书名号，但保留中间空格
														
 
															-        clean1 = name1.replace("《", "").replace("》", "")
														
 
															-        clean2 = name2.replace("《", "").replace("》", "")
														
 
															-        return clean1 == clean2
														
 
															+        return normalized_name1 == normalized_name2
														
 
															     def _clean_brackets_and_booknames(self, text: str) -> str:
														
 
															         """
														
@@ -545,14 +635,49 @@ class StandardMatcher:
 
															         return text
														
 
															+    def _extract_chinese_chars(self, text: str) -> str:
														
 
															+        """
														
 
															+        提取字符串中的中文字符和空格
														
 
															+        保留：中文字符（\u4e00-\u9fa5）、中文标点、空格（无换行符时）
														
 
															+        删除：英文、数字、特殊符号、换行符等
														
 
															+        特殊处理：如果存在换行符，则去除所有空格
														
 
															+        """
														
 
															+        if not text:
														
 
															+            return text
														
 
															+
														
 
															+        import re
														
 
															+
														
 
															+        # 检查是否存在换行符（在清洗前检查）
														
 
															+        has_newline = '\n' in text or '\r' in text
														
 
															+
														
 
															+        # 首先去除换行符及其旁边的所有空格
														
 
															+        text = re.sub(r'\s*[\n\r]+\s*', '', text)
														
 
															+        # 去除制表符
														
 
															+        text = text.replace('\t', '')
														
 
															+
														
 
															+        if has_newline:
														
 
															+            # 有换行符时：提取中文字符，去除所有空格
														
 
															+            chinese_pattern = re.compile(r'[\u4e00-\u9fa5\u3000-\u303F\uFF00-\uFFEF]+')
														
 
															+            matches = chinese_pattern.findall(text)
														
 
															+            result = ''.join(matches)
														
 
															+            # 去除所有空格（包括全角空格）
														
 
															+            result = result.replace(' ', '').replace('　', '')
														
 
															+            return result.strip()
														
 
															+        else:
														
 
															+            # 无换行符时：提取中文字符和空格，保留中间空格
														
 
															+            chinese_pattern = re.compile(r'[\u4e00-\u9fa5\u3000-\u303F\uFF00-\uFFEF\s]+')
														
 
															+            matches = chinese_pattern.findall(text)
														
 
															+            result = ''.join(matches)
														
 
															+            return result.strip()
														
 
															+
														
 
															     def _find_exact_name_match(
														
 
															         self,
														
 
															         records: List[StandardRecord],
														
 
															-        target_name: str
														
 
															+        target_normalized_name: str
														
 
															     ) -> Optional[StandardRecord]:
														
 
															-        """在记录列表中查找精确名称匹配"""
														
 
															+        """在记录列表中查找规范化名称精确匹配"""
														
 
															         for record in records:
														
 
															-            if record.standard_name == target_name:
														
 
															+            if record.normalized_name == target_normalized_name:
														
 
															                 return record
														
 
															         return None
														
@@ -632,7 +757,7 @@ class StandardMatchingService:
 
															                 - standard_number: 标准号(原始)
														
 
															         Returns:
														
 
															-            List[StandardMatchResult]: 匹配结果列表
														
 
															+            List[StandardMatchResult]: 匹配结果列表（文件名为空的会被过滤掉）
														
 
															         """
														
 
															         if not self._initialized:
														
 
															             raise RuntimeError("服务未初始化，请先调用 initialize()")
														
@@ -644,7 +769,9 @@ class StandardMatchingService:
 
															                 input_name=std.get("standard_name", ""),
														
 
															                 input_number=std.get("standard_number", "")
														
 
															             )
														
 
															-            results.append(result)
														
 
															+            # 跳过文件名为空的情况（match 返回 None）
														
 
															+            if result is not None:
														
 
															+                results.append(result)
														
 
															         return results
														
 
															     def check_single(
														
@@ -652,7 +779,7 @@ class StandardMatchingService:
 
															         seq_no: int,
														
 
															         standard_name: str,
														
 
															         standard_number: str
														
 
															-    ) -> StandardMatchResult:
														
 
															+    ) -> Optional[StandardMatchResult]:
														
 
															         """
														
 
															         检查单个标准
														
@@ -663,6 +790,7 @@ class StandardMatchingService:
 
															         Returns:
														
 
															             StandardMatchResult: 匹配结果
														
 
															+            None: 当文件名为空时返回 None，表示跳过审查
														
 
															         """
														
 
															         if not self._initialized:
														
 
															             raise RuntimeError("服务未初始化，请先调用 initialize()")