AI 意图识别流程梳理（`shudao-aichat` + `shudao-chat-py`）

本文档专门梳理当前项目中两套“意图识别”实现：

shudao-aichat
shudao-main/shudao-chat-py

重点说明：

每套流程的入口在哪里
输入输出结构是什么
Prompt 如何构造
模型如何调用
JSON 如何解析与容错
意图识别结果如何影响后续问答 / 检索 / 报告流程
两套实现的能力差异与架构差异

1. 总体结论

当前项目存在两套明显不同的意图识别体系：

`shudao-aichat`

更像一个“结构化前置决策器”
意图识别产出不仅是类别，还包含：
- 是否专业问题
- 路由策略
- 是否需要离线模型
- 原始问题
- 主关键词
- 扩展关键词
- 公司名称 / 别名
- 内部查询场景
- 摘要回答
- 前端展示用思考摘要
这套结果会直接驱动后面的报告流、检索流和在线/离线路由

`shudao-chat-py`

更像一个“轻量分类器 + RAG 开关”
意图识别主要只回答一个问题：
- 当前消息是不是 greeting（问候） / faq（常见问题） / query_knowledge_base（知识库查询）
主要影响：
- 是否直接给固定回复
- 是否触发 RAG 检索
不负责复杂路由，不负责内部查询边界，不输出结构化检索策略

一句话概括：

shudao-aichat 的意图识别是“流程编排中枢”
shudao-chat-py 的意图识别是“问答前分类开关”

2. 两套流程的入口位置

2.1 `shudao-aichat`

路由注册

主应用在 main.py 注册 intent.router

独立接口入口

独立意图识别接口是 analyze_intent
路径是：POST /api/v1/intent/analyze

被主流程内部调用的位置

报告主流程在 report.py 内直接调用 analyze_intent()

这说明 aichat 的意图识别既可以单独调用，也可以作为完整流程中的一个内部节点复用。

2.2 `shudao-chat-py`

路由注册

主应用在 main.py 注册 api_router
chat 路由在 routers/init.py 中挂到 /apiv1

独立意图识别接口

独立接口是 intent_recognition
路径是：POST /apiv1/intent_recognition

被其他问答接口复用的位置

非流式问答 send_deepseek_message 在 chat.py 调用意图识别
无 DB 流式问答 stream_chat 在 chat.py 调用意图识别
主流式问答 stream_chat-with-db 没有单独先做意图识别，而是直接做 RAG 检索，见 chat.py

这说明 chat-py 的意图识别复用并不统一。

3. `shudao-aichat` 的意图识别流程

3.1 输入与输出模型

请求模型

定义在 models.py

字段：

user_question
conversation_history
enable_online_model

响应模型

定义在 models.py

字段包括：

is_professional_question
route
need_offline_model
origin_question
keywords
intent_description
summary
offline_instruction
intent_scene
company_name
fallback_keywords
company_aliases
thinking_content

这已经决定了它不是简单分类器，而是完整的结构化判定器。

3.2 第一步：进入接口并记录上下文

3.3 第二步：构建 Prompt

Prompt 里编码的关键规则

模板中定义了以下内容：

角色定位
见 intent_analysis_prompt.md
专业领域边界
见 intent_analysis_prompt.md
输出 JSON 结构
见 intent_analysis_prompt.md
专业 / 非专业判断规则
见 intent_analysis_prompt.md
关键词提取规则
见 intent_analysis_prompt.md
summary 的组织方式
见 intent_analysis_prompt.md
工作流说明
见 intent_analysis_prompt.md

这一步的实际作用

这份 Prompt 本质上已经把意图识别变成了“结构化问答规划”：

判定问题类型
给出下一跳路由
给出检索词
给出摘要与展示摘要
给出内部查询范围

3.4 第三步：代码层追加 system 约束

3.5 第四步：定义结构化输出 schema

3.6 第五步：调用离线 LLM

离线模型服务机制

OfflineLLMService 的特点：

支持 response_format
支持超时
支持重试
当上游不支持 json_schema 时会降级

具体降级逻辑：

json_schema
json_object
plain

这一步的实际效果

即使模型上游对结构化输出支持不稳定，这层也尽量把返回值稳定在“可解析”范围内。

3.7 第六步：第一次失败后的严格 JSON 重试

重试策略

第一次调用失败时，系统不会马上放弃，而是追加一组更强硬的消息：

第一个字符必须是 {
最后一个字符必须是 }
指定字段必须是数组
布尔值必须用 true/false
严禁输出 Thinking Process / 说明 / 代码块

这一步相当于“人工强约束修正回合”。

3.8 第七步：统一 JSON 提取与修复

解析流程

从模型输出中提取最可能的 JSON 段
尝试直接 json.loads
如果失败，修复常见问题
再次解析
还不行再尝试 Python literal 风格
最终抛出 JSONParseError

关键辅助函数

分离思考过程和正式内容：split_thinking_and_answer
从输出中提取 JSON：extract_json_from_model_output
查找真正 JSON 起点：json_parser.py

这一步的意义

aichat 的意图识别对“模型脏输出”的容忍度比较高，已经形成统一的 JSON 容错层。

3.9 第八步：生成安全可展示的 thinking_content

处理逻辑

先读取模型返回的 reasoning_summary
将其统一变成字符串数组
拼接为可展示文本
若内容太短，则自动补一段“安全可展示”的问题理解摘要
严格截断在配置范围内

这一步的设计目的

项目明确区分：

原始推理链：不能直接暴露
可展示的理解摘要：可以返回前端展示

这是 aichat 这套意图识别的重要特征。

3.10 第九步：本地兜底结果

兜底逻辑

如果模型两次都没有返回可解析 JSON，则：

用简单规则判断是否专业问题
按 enable_online_model 推导 route
专业问题的关键词退化为原问题
非专业问题返回默认引导语

默认规则：

专业问题 + 开启在线模型 → online_then_offline（先在线后离线）
非专业问题 + 开启在线模型 → online_only（仅在线）
其他情况 → offline_only（仅离线）

这一步的意义

即使意图识别模型挂了，后面的问答主流程仍然可以继续跑下去。

3.11 第十步：标准化响应并返回

最终输出字段

这里会统一清洗：

keywords
fallback_keywords
company_aliases

然后组装 IntentAnalyzeResponse

这里的注意点

is_professional_question 缺失时会偏保守地默认为 True
说明它的设计倾向是“尽量不中断后续专业流程”

3.12 第十一步：被报告主流程消费

aichat 的意图识别真正价值体现在后续主流程里。

消费方式

先发 SSE 状态 status:intent
构造 IntentAnalyzeRequest
调用 analyze_intent()
将结果通过 SSE 发回前端

决策点

1. 路由矫正

若未启用在线模型，但意图识别给出 online_only（仅在线） 或 online_then_offline（先在线后离线）
则在 report.py 中强制改为 offline_only（仅离线）

2. 非专业问题直接终止后续流程

在 report.py

3. `online_only（仅在线）` 直接走在线回答

在 report.py

4. `online_then_offline（先在线后离线）` 异步启动在线回答，同时继续检索 / 报告

在 report.py

5. `internal_query（内部查询）` 决定后续检索策略

在 report.py

小结

aichat 中的意图识别结果，直接决定：

是否继续流程
走哪条模型路由
是否做在线检索
是否做内部查询
用哪些关键词检索

4. `shudao-chat-py` 的意图识别流程

4.1 总体定位

和 aichat 相比，chat-py 的意图识别明显轻量很多。

它主要用于解决三个问题：

这是不是问候语
这是不是关于 AI 助手本身的 FAQ
如果都不是，是不是走知识库查询

它不负责：

在线 / 离线路由
内部查询边界
公司识别
扩展检索词
安全展示型思考摘要

4.2 使用到的几个入口

独立意图识别接口

intent_recognition

非流式问答中的意图识别

send_deepseek_message

无 DB 流式问答中的意图识别

stream_chat

主流式问答 `stream/chat-with-db`

这里并没有先走意图识别，而是直接 RAG 检索 + 生成，见 chat.py

这意味着 chat-py 内部不同问答入口对意图识别的依赖程度不一致。

4.3 Prompt 配置与模板文件

Prompt 加载器

通用加载器是 prompt_loader.py

Prompt 配置

配置文件是 prompt_config.yaml

其中意图识别模板配置为：

intent_recognition
对应文件：prompts/yitushibie_template_lite.md

实际模板

模板文件是 yitushibie_template_lite.md

模板定义的分类体系

模板只定义了 3 类：

greeting（问候）
faq（常见问题）
query_knowledge_base（知识库查询）

并要求返回 JSON：

{
  "intent": "意图类别",
  "confidence": 0.9,
  "search_queries": ["用户原始问题"],
  "direct_answer": "直接回答内容或空字符串"
}

这套 Prompt 的设计风格

和 aichat 不同，这里完全没有：

route
need_offline_model
intent_scene
company_name
fallback_keywords
reasoning_summary

所以它的定位就是“前分类”。

4.4 第一步：调用 `qwen_service.intent_recognition`

执行步骤

通过 load_prompt("intent_recognition", userMessage=message) 加载意图识别 Prompt
构造一条 user 消息
调用 self.chat(...)
使用专门的意图识别模型和专门的意图识别 API

特别点

QwenService 初始化时给意图识别单独配置了：

self.intent_api_url
self.intent_model

见 qwen_service.py

也就是说：

chat-py 的“回答模型”与“意图识别模型”是可以分开的

4.5 第二步：实际 HTTP 调用模型

特点

使用单独的 Intent API 配置
若是普通 Qwen3 主模型目标地址，会支持 DeepSeek 回退
但意图识别调用通常不是 Qwen3 主 URL，而是独立 Intent URL，因此不会自动走主问答那套回退逻辑

认证头处理

若配置了 settings.intent.token，会在 qwen_service.py 自动带上 Authorization

4.6 第三步：用正则从模型输出中提取 JSON

处理逻辑

去除 Markdown 代码块标记
用正则 \{.*\} 匹配最外层 JSON
尝试 json.loads
兼容字段名 intent / intent_type
统一设置 result["intent_type"]

这里的容错特点

相比 aichat：

chat-py 的解析容错更轻
没有统一 JSON 修复器
没有二次严格 JSON 重试
没有 schema 强约束

失败时的默认结果

若解析失败，直接返回：

{
  "intent_type": "general_chat",
  "confidence": 0.5,
  "reason": "...",
  "response": ""
}

其中 general_chat 表示“通用聊天”。

见 qwen_service.py

4.7 第四步：根据 intent_type 组装直接回复

处理逻辑

如果解析成功：

greeting（问候）
- 使用 direct_answer，若没有则填默认欢迎语
faq（常见问题）
- 使用 direct_answer，若没有则填默认 FAQ 引导
其他类型
- response = direct_answer or ""

这说明 chat-py 中“意图识别”其实还承担了“固定回复生成器”的角色。

4.8 第五步：独立接口 `/intent_recognition` 的行为

请求结构

message
save_to_db
ai_conversation_id

执行过程

从 request.state.user 取用户
调 qwen_service.intent_recognition(data.message)
读取：
- intent_type
- response_text
如果 save_to_db=true 且意图是 greeting（问候） / faq（常见问题）
- 创建或复用 AIConversation
- 写入 user 消息
- 写入 AI 消息
- 返回 ai_conversation_id 与 ai_message_id
其他情况只返回识别结果，不落库

这里的核心逻辑

独立接口更多是为“问候 / FAQ 快速返回 + 可选写历史”设计的，而不是为复杂编排设计的。

4.9 第六步：在非流式问答中的使用方式

执行流程

当 business_type == 0 时：

先调用 qwen_service.intent_recognition(message)
提取 intent_type
如果意图属于：
- query_knowledge_base（知识库查询）
- 知识库查询
- 技术咨询
才触发 _rag_search(message, top_k=10)
再使用 final_answer prompt 组织最终问答
调用 qwen_service.chat(messages) 生成答案
若响应中含 <think>，再调用 summarize_thinking_content() 生成可展示摘要

这里意图识别的作用

只用于控制：

要不要做 RAG 检索

它不参与：

在线 / 离线路由
场景识别
检索范围决定

4.10 第七步：在无 DB 流式问答中的使用方式

执行流程

先做 qwen_service.intent_recognition(message)
如果结果是知识库查询类，则执行 _rag_search(message)
使用 final_answer prompt 组织消息
调用 qwen_service.stream_chat(messages) 流式输出
若输出带 <think>，调用 summarize_thinking_content() 把原始思考转成展示摘要

这里的关键点

和非流式版本一样，意图识别仍然只承担“RAG 开关”的角色。

4.11 第八步：RAG 检索本身怎么做

执行逻辑

读取 settings.search.api_url
调用外部检索服务
请求体：
- query
- n_results
从返回结果提取文档内容
拼成一大段 rag_context

注意点

这里的 _rag_search() 使用的是“用户原问题”直接检索，而不是意图识别结果中的 search_queries。

也就是说：

Prompt 虽然要求模型输出 search_queries
但当前主链路并没有真正消费这个字段

这是 chat-py 意图识别和主流程之间一个比较明显的“设计上有、实现上未充分使用”的点。

4.12 第九步：思考过程摘要不是意图识别的一部分

与 `aichat` 的区别

chat-py 的意图识别结果本身并不带 thinking_content。

它的“思考过程摘要”是在后续主回答阶段：

从主模型输出里提取 <think>
再二次总结

而 aichat 是在意图识别阶段就直接产出一份安全展示型摘要。

5. 两套实现的逐步对比

5.1 输入输出能力对比

维度	`shudao-aichat`	`shudao-chat-py`
输入	问题 + 历史 + 在线开关	主要是单条问题
输出	结构化决策对象	轻量分类结果
分类粒度	专业 / 非专业 + 内部查询 + 路由	`greeting（问候） / faq（常见问题） / query_knowledge_base（知识库查询）`
关键词	主关键词 + fallback 关键词	Prompt 要求有 `search_queries`，但主流程几乎未使用
路由	`offline_only（仅离线）` / `online_only（仅在线）` / `online_then_offline（先在线后离线）`	无
内部查询	有 `intent_scene` / `company_name` / `company_aliases`	无
展示摘要	意图识别阶段直接生成 `thinking_content`	在主回答阶段再总结 `<think>`

5.2 Prompt 设计对比

`aichat`

Prompt 更重、更像任务编排器
规则包含：
- 领域边界
- 路由规则
- 内部查询规则
- 关键词规则
- 摘要与展示摘要规则

`chat-py`

Prompt 更轻、更像分类器
规则主要围绕：
- 3 个意图类别
- greeting（问候） / faq（常见问题） 的直接回答
- query_knowledge_base（知识库查询） 需要检索

5.3 模型调用与容错对比

`aichat`

使用离线模型服务
支持 json_schema
支持结构化输出降级
支持二次严格 JSON 重试
支持统一 JSON 提取与修复
支持本地兜底结果

`chat-py`

使用单独的 intent 模型与 API
用正则做轻量 JSON 抽取
失败直接退回 general_chat（通用聊天）
没有统一 JSON 修复器
没有 schema 级强约束

5.4 与主流程耦合方式对比

`aichat`

意图识别是主流程前置控制中心：

是否继续执行
走哪条路由
是否内部查询
用哪些词检索

`chat-py`

意图识别只决定：

要不要做 RAG
是否直接返回 greeting（问候） / faq（常见问题）

所以两边的架构定位完全不同。

6. 两套流程的完整步骤清单

6.1 `shudao-aichat`

路由进入 intent.py
读取请求模型 models.py
从 prompts.py 构建意图识别 Prompt
加载模板 intent_analysis_prompt.md
追加 system 规则 intent.py
构造 JSON schema intent.py
调用离线模型 offline_llm_service.py
若格式异常则严格重试 intent.py
统一 JSON 提取与修复 json_parser.py
生成 thinking_content intent.py
如仍失败则本地兜底 intent.py
返回结构化结果 intent.py
在报告主流程中被消费 report.py

6.2 `shudao-chat-py`

路由进入 chat.py 或被问答接口内部调用
通过 prompt_loader.py 加载 Prompt
Prompt 配置来自 prompt_config.yaml
模板文件是 yitushibie_template_lite.md
调用 QwenService.intent_recognition
使用专门的 intent 模型和 URL qwen_service.py
用正则提取 JSON qwen_service.py
将结果映射为 intent_type 和 response
在非流式问答中决定是否做 _rag_search() chat.py
在流式问答中决定是否做 _rag_search() chat.py
若是 greeting（问候） / faq（常见问题），独立接口可选写入 DB chat.py

7. 为什么两套流程会不同

从代码看，两套实现服务于不同阶段的架构目标：

`shudao-chat-py`

更早期
更贴近“聊天接口先分类，再决定要不要查库”
所以意图识别更轻、更快、更窄

`shudao-aichat`

更偏后期编排服务
需要控制：
- SSE 主流程
- 报告生成
- 在线模型 / 离线模型
- 内部查询边界
- 文档检索
所以意图识别被扩展成“结构化路由器”

8. 当前实现的几个关键差异与注意点

8.1 `aichat` 的优势

结构化输出能力更强
JSON 容错更完整
可直接驱动后续复杂流程
安全展示型 thinking_content 设计更成熟

8.2 `chat-py` 的优势

逻辑简单
响应快
接入聊天链路成本低
greeting（问候） / faq（常见问题） 这类简单问题处理直接

8.3 `chat-py` 当前的局限

分类粒度太粗
Prompt 中定义的 search_queries 没被主流程充分消费
没有结构化路由能力
没有统一 JSON 修复层
不支持内部查询边界识别

8.4 `aichat` 当前的代价

Prompt 更重
输出字段更多
解析链路更复杂
更依赖模型按 schema 输出

9. 最终总结

如果只看“意图识别”这个名词，两套实现看起来像是在做同一件事；但从代码职责来看，它们其实不是一个层级的能力：

`shudao-chat-py`

更接近：

问句分类器
RAG 触发器
greeting（问候） / faq（常见问题） 的前置处理器

`shudao-aichat`

更接近：

结构化流程路由器
查询场景识别器
检索参数生成器
问题摘要与展示摘要生成器
报告主流程的前置决策节点

如果后续只保留一套更完整的方案，从现有代码能力看，明显是 shudao-aichat 这套更适合作为统一的意图识别中枢。

10. 后续可继续补充的内容

若后续还要继续深挖，建议补以下几份配套分析：

意图识别结果字段字典
- 每个字段由谁生成、在哪里消费、有什么业务语义
aichat 与 chat-py 的问答主链对比
- 从“用户发问”到“最终回答”的完整对比链路
Prompt 对比文档
- 把 intent_analysis_prompt.md 和 yitushibie_template_lite.md 逐段对照
迁移建议
- 如果后续要收敛为一套意图识别能力，哪些部分应该保留、哪些部分应该删掉

ai-intent-recognition-flow.md 33 KB Permalink Verlauf Originalformat

AI 意图识别流程梳理（shudao-aichat + shudao-chat-py）

1. 总体结论

shudao-aichat

shudao-chat-py

2. 两套流程的入口位置

2.1 shudao-aichat

路由注册

独立接口入口

被主流程内部调用的位置

2.2 shudao-chat-py

路由注册

独立意图识别接口

被其他问答接口复用的位置

3. shudao-aichat 的意图识别流程

3.1 输入与输出模型

请求模型

响应模型

3.2 第一步：进入接口并记录上下文

相关代码位置

3.3 第二步：构建 Prompt

相关代码位置

Prompt 里编码的关键规则

这一步的实际作用

3.4 第三步：代码层追加 system 约束

相关代码位置

3.5 第四步：定义结构化输出 schema

相关代码位置

3.6 第五步：调用离线 LLM

相关代码位置

离线模型服务机制

这一步的实际效果

3.7 第六步：第一次失败后的严格 JSON 重试

相关代码位置

重试策略

3.8 第七步：统一 JSON 提取与修复

相关代码位置

解析流程

关键辅助函数

这一步的意义

3.9 第八步：生成安全可展示的 thinking_content

相关代码位置

处理逻辑

这一步的设计目的

3.10 第九步：本地兜底结果

相关代码位置

兜底逻辑

这一步的意义

3.11 第十步：标准化响应并返回

相关代码位置

最终输出字段

这里的注意点

3.12 第十一步：被报告主流程消费

相关代码位置

消费方式

决策点

1. 路由矫正

2. 非专业问题直接终止后续流程

3. online_only（仅在线） 直接走在线回答

4. online_then_offline（先在线后离线） 异步启动在线回答，同时继续检索 / 报告

5. internal_query（内部查询） 决定后续检索策略

小结

4. shudao-chat-py 的意图识别流程

4.1 总体定位

4.2 使用到的几个入口

独立意图识别接口

非流式问答中的意图识别

无 DB 流式问答中的意图识别

主流式问答 stream/chat-with-db

4.3 Prompt 配置与模板文件

Prompt 加载器

Prompt 配置

实际模板

模板定义的分类体系

这套 Prompt 的设计风格

4.4 第一步：调用 qwen_service.intent_recognition

相关代码位置

执行步骤

特别点

4.5 第二步：实际 HTTP 调用模型

ai-intent-recognition-flow.md 33 KB

Permalink Verlauf Originalformat

AI 意图识别流程梳理（`shudao-aichat` + `shudao-chat-py`）

`shudao-aichat`

`shudao-chat-py`

2.1 `shudao-aichat`

2.2 `shudao-chat-py`

3. `shudao-aichat` 的意图识别流程

3. `online_only（仅在线）` 直接走在线回答

4. `online_then_offline（先在线后离线）` 异步启动在线回答，同时继续检索 / 报告

5. `internal_query（内部查询）` 决定后续检索策略

4. `shudao-chat-py` 的意图识别流程

主流式问答 `stream/chat-with-db`

4.4 第一步：调用 `qwen_service.intent_recognition`

4.8 第五步：独立接口 `/intent_recognition` 的行为

与 `aichat` 的区别

`aichat`

`chat-py`

`aichat`

`chat-py`

`aichat`

`chat-py`

6.1 `shudao-aichat`

6.2 `shudao-chat-py`

`shudao-chat-py`

`shudao-aichat`

8.1 `aichat` 的优势

8.2 `chat-py` 的优势

8.3 `chat-py` 当前的局限

8.4 `aichat` 当前的代价

`shudao-chat-py`

`shudao-aichat`