Bladeren bron

Merge branch 'dev_sgsc_wxm' of CRBC-MaaS-Platform-Project/LQAgentPlatform into dev

WangXuMing 11 uur geleden
bovenliggende
commit
155f0d161c

+ 1 - 1
core/construction_review/component/report_generator.py

@@ -370,7 +370,7 @@ class ReportGenerator:
             'completeness_check': '完整性审查',
             'semantic_logic_check': '语义逻辑审查',
             'reference_check': '参考文献审查',
-            'sensitive_word_check': '敏感词审查',
+            'sensitive_word_check': '词句语法检查',
             'grammar_check': '词句语法检查',
             'mandatory_standards_check': '强制性标准审查',
             'technical_parameters_check': '技术参数审查',

+ 4 - 4
core/construction_review/component/reviewers/grammar_check_reviewer.py

@@ -88,7 +88,7 @@ class GrammarCheckReviewer:
             result = ReviewResult(
                 success=True,
                 details={
-                    "name": "grammar_check",
+                    "name": "sensitive_word_check",
                     "response": model_response
                 },
                 error_message=None,
@@ -98,7 +98,7 @@ class GrammarCheckReviewer:
             # 推送审查完成信息
             if state and state.get("progress_manager"):
                 review_result_data = {
-                    'name': 'grammar_check',
+                    'name': 'sensitive_word_check',
                     'success': result.success,
                     'details': result.details,
                     'error_message': result.error_message,
@@ -130,7 +130,7 @@ class GrammarCheckReviewer:
             # 返回失败结果
             result = ReviewResult(
                 success=False,
-                details={"name": "grammar_check"},
+                details={"name": "sensitive_word_check"},
                 error_message=error_msg,
                 execution_time=execution_time
             )
@@ -138,7 +138,7 @@ class GrammarCheckReviewer:
             # 推送失败信息
             if state and state.get("progress_manager"):
                 review_result_data = {
-                    'name': 'grammar_check',
+                    'name': 'sensitive_word_check',
                     'success': False,
                     'details': result.details,
                     'error_message': error_msg,

+ 8 - 3
core/construction_review/component/reviewers/prompt/basic_reviewers.yaml

@@ -10,7 +10,7 @@ grammar_check:
     ## workflow
     - 负责检查文本中的错别字和重复字词等语法问题。
     - 检查待审查的词句语法标点格式是否符合规则。
-    - 检查错别字、多字、少字、重复字词等语法错误。
+    - 检查错别字、异体字、多字、少字、重复字词等语法错误。
     - 如果发现一个句子有错误,请正确的定位其错误位置,而不是想当然的去找问题。如句子末尾未加句号不要定位到句中去了。
     - 给出了最终建议后,需要再次考虑如果按照建议去做了,原文是否通顺合理。
     - 请减少对标点符号的严格审查,如果有问题请三思你所说的位置有没有符号,符号对不对。
@@ -66,7 +66,12 @@ grammar_check:
     10. **语义逻辑问题**:任何与语义、逻辑、事实相关的内容
     11. **技术操作规程**:操作步骤的顺序是否正确、工艺参数是否合理、安全操作规范的技术正确性 —— 这些由专业技术审查流程处理,你只检查其中的文字书写错误(如错别字、漏字)
 
-    **你的职责范围仅限于**:错别字(如”混泥土”→”混凝土”)、多字/少字、重复字词(如”公司公司”)、标点符号错误、”的地得”混用、明显的语法结构错误。
+    **你的职责范围仅限于**:错别字(如”混泥土”→”混凝土”)、异体字(如”毎”→”每”、”出”→”凸出”)、多字/少字、重复字词(如”公司公司”)、标点符号错误、”的地得”混用、明显的语法结构错误。
+
+    ### 异体字处理规则(强制执行)
+    1. 异体字属于审查范围,应当报告。
+    2. **issue_point 命名规范**:异体字问题必须以`[异体字]`开头(如`[异体字]”毎”应为”每”`),错别字以`[错别字]`开头,禁止混用。
+    3. 如果不确定某个字是否为异体字,按”拿不准就不报”处理。
     超出以上范围的所有问题,请忽略并输出”无明显问题”。
 
     ## output
@@ -85,7 +90,7 @@ grammar_check:
     - 低风险:形式问题、不影响实质内容的词句错误。
 
   user_prompt_template: |
-    请审查以下内容的词句语法错误,**仅限**错别字、多字、少字、重复字词、标点符号错误、"的地得"混用、明显的语法结构错误。
+    请审查以下内容的词句语法错误,**仅限**错别字、异体字、多字、少字、重复字词、标点符号错误、"的地得"混用、明显的语法结构错误。
 
     【待检查文本】
     {review_content}

+ 1 - 11
core/construction_review/component/reviewers/sensitive_words/色情词库.txt

@@ -538,7 +538,6 @@ cao你
 操我
 厕奴
 插比
-插b
 插逼
 插你
 插我
@@ -819,13 +818,4 @@ cao你
 自拍
 自慰
 作爱
-18禁
-a片
-gay片
-g点
-g片
-h动画
-h动漫
-sm女王
-xing伴侣
-yin荡
+

+ 2 - 1
core/construction_review/workflows/core_functions/ai_review_core_fun.py

@@ -381,10 +381,11 @@ class AIReviewCoreFun:
         if func_name == "grammar_check":
             raw_result = await method(trace_id, review_content, state, stage_name)
             # 基础审查方法,放入 basic_compliance
+            # 注意:前端传的配置键是 sensitive_word_check,basic_compliance 的 key 必须保持这个名称
             return UnitReviewResult(
                 unit_index=chunk_index,
                 unit_content=chunk,
-                basic_compliance={func_name: raw_result},
+                basic_compliance={"sensitive_word_check": raw_result},
                 technical_compliance={},
                 rag_enhanced={},
                 overall_risk=self._calculate_single_result_risk(raw_result),