2 месяцев назад · b90bda8660
--- a/src/app/sample/schemas/knowledge_base.py
+++ b/src/app/sample/schemas/knowledge_base.py
@@ -55,6 +55,8 @@ class KnowledgeBaseResponse(BaseModelSchema):
 
				     updated_by: Optional[str] = None
			
 
				     created_at: Optional[datetime] = None
			
 
				     updated_at: Optional[datetime] = None
			
 
				+    created_time: Optional[datetime] = None
			
 
				+    updated_time: Optional[datetime] = None
			
 
				 
			
 
				     class Config:
			
 
				         from_attributes = True
			
--- a/src/app/sample/schemas/search_engine.py
+++ b/src/app/sample/schemas/search_engine.py
@@ -68,6 +68,8 @@ class KBSearchResultItem(BaseModel):
 
				     doc_name: str
			
 
				     content: str
			
 
				     meta_info: str
			
 
				+    document_id: Optional[str] = None
			
 
				+    metadata: Optional[Dict[str, Any]] = None
			
 
				     score: float
			
 
				     
			
 
				 class KBSearchResponse(BaseModel):
			
--- a/src/app/services/knowledge_base_service.py
+++ b/src/app/services/knowledge_base_service.py
@@ -24,24 +24,80 @@ class KnowledgeBaseService:
 
				     async def _get_collection_row_count(self, collection_name: str) -> int:
			
 
				         """获取集合行数（优先尝试 count(*) 以获取实时准确值）"""
			
 
				         try:
			
 
				+            # 确保集合已加载
			
 
				+            state = milvus_service.get_collection_state(collection_name)
			
 
				+            if state != "Loaded":
			
 
				+                # [Fix] 检查是否存在索引，如果没有索引则不能加载，避免抛出 index not found 错误
			
 
				+                try:
			
 
				+                    indexes = milvus_service.client.list_indexes(collection_name)
			
 
				+                    if not indexes:
			
 
				+                         # 无索引无法加载，直接跳过，进入 Fallback 使用 stats
			
 
				+                         # print(f"Collection {collection_name} has no index, skipping load.")
			
 
				+                         raise Exception("Collection has no index, cannot load")
			
 
				+                except Exception:
			
 
				+                    # list_indexes 失败也视为无法加载
			
 
				+                    raise Exception("Failed to check indexes or no index")
			
 
				+
			
 
				+                # print(f"Auto loading collection {collection_name} for counting...")
			
 
				+                milvus_service.set_collection_state(collection_name, "load")
			
 
				+            
			
 
				             # 尝试使用 count(*) 获取准确的实时数量
			
 
				             # 过滤掉已标记删除的数据 (is_deleted == false)
			
 
				-            # 注意：如果 Schema 中没有 is_deleted 字段，这里可能会报错，需要根据实际 Schema 调整
			
 
				-            # 但之前的代码中 Schema 确实包含了 is_deleted
			
 
				             try:
			
 
				-                # 检查集合是否已加载
			
 
				-                if milvus_service.get_collection_state(collection_name) == "Loaded":
			
 
				-                    res = milvus_service.client.query(collection_name, filter="is_deleted == false", output_fields=["count(*)"])
			
 
				-                    if res and isinstance(res, list) and "count(*)" in res[0]:
			
 
				-                        return int(res[0]["count(*)"])
			
 
				-            except Exception:
			
 
				-                # 再次尝试不过滤
			
 
				+                # [Fix] 动态检测 is_deleted 类型，自适应 Int64 或 Bool
			
 
				+                desc = milvus_service.client.describe_collection(collection_name)
			
 
				+                fields = desc.get('fields', [])
			
 
				+                is_del_field = next((f for f in fields if f['name'] == 'is_deleted'), None)
			
 
				+                
			
 
				+                filter_expr = ""
			
 
				+                if is_del_field:
			
 
				+                     if is_del_field.get('type') == 1: # Bool=1
			
 
				+                         filter_expr = "is_deleted == false"
			
 
				+                     else:
			
 
				+                         filter_expr = "is_deleted == 0" # 默认 Int
			
 
				+                else:
			
 
				+                    # 字段不存在，使用恒真条件
			
 
				+                    pk_field = "id"
			
 
				+                    for f in fields:
			
 
				+                        if f.get('is_primary') or f.get('primary_key'):
			
 
				+                            pk_field = f.get('name')
			
 
				+                            break
			
 
				+                    # 使用 PK 过滤
			
 
				+                    filter_expr = f"{pk_field} >= 0" # 假设是 Int PK，如果是 VarChar 需调整
			
 
				+                    # 检测 PK 类型
			
 
				+                    pk_type = next((f.get('type') for f in fields if f.get('name') == pk_field), None)
			
 
				+                    # Milvus DataType: INT64=5, VARCHAR=21
			
 
				+                    if pk_type == 21 or pk_type == 'VarChar':
			
 
				+                         filter_expr = f'{pk_field} != ""'
			
 
				+
			
 
				+                # 注意：count(*) 聚合查询不支持分页参数 (limit/offset)，也不能用于获取实体
			
 
				+                res = milvus_service.client.query(collection_name, filter=filter_expr, output_fields=["count(*)"])
			
 
				+                if res and isinstance(res, list) and "count(*)" in res[0]:
			
 
				+                    return int(res[0]["count(*)"])
			
 
				+            except Exception as e:
			
 
				+                print(f"Query count with filter error for {collection_name}: {e}")
			
 
				+                # 再次尝试不过滤 (使用恒真表达式)
			
 
				                 if milvus_service.get_collection_state(collection_name) == "Loaded":
			
 
				-                    res = milvus_service.client.query(collection_name, filter="", output_fields=["count(*)"])
			
 
				-                    if res and isinstance(res, list) and "count(*)" in res[0]:
			
 
				+                     # 获取 PK 字段名
			
 
				+                     desc = milvus_service.client.describe_collection(collection_name)
			
 
				+                     fields = desc.get('fields', [])
			
 
				+                     pk_field = "id"
			
 
				+                     pk_type = 5
			
 
				+                     for f in fields:
			
 
				+                         if f.get('is_primary') or f.get('primary_key'):
			
 
				+                             pk_field = f.get('name')
			
 
				+                             pk_type = f.get('type')
			
 
				+                             break
			
 
				+                     
			
 
				+                     filter_expr = f"{pk_field} >= 0"
			
 
				+                     if pk_type == 21 or pk_type == 'VarChar':
			
 
				+                          filter_expr = f'{pk_field} != ""'
			
 
				+
			
 
				+                     res = milvus_service.client.query(collection_name, filter=filter_expr, output_fields=["count(*)"])
			
 
				+                     if res and isinstance(res, list) and "count(*)" in res[0]:
			
 
				                         return int(res[0]["count(*)"])
			
 
				-        except Exception:
			
 
				-            pass
			
 
				+        except Exception as e:
			
 
				+            print(f"Get collection row count error for {collection_name}: {e}")
			
 
				             
			
 
				         # Fallback: 使用 get_collection_stats (可能包含已删除未 Compaction 的数据)
			
 
				         try:
			
@@ -61,21 +117,54 @@ class KnowledgeBaseService:
 
				             #     milvus_service.load_collection(kb.collection_name)
			
 
				             
			
 
				             # 采样查询 (获取前10条)
			
 
				+            res = []
			
 
				             try:
			
 
				+                # 先检查 metadata 字段是否存在，避免报错 field metadata not exist
			
 
				+                desc = milvus_service.client.describe_collection(kb.collection_name)
			
 
				+                fields = [f['name'] for f in desc.get('fields', [])]
			
 
				+                if "metadata" not in fields:
			
 
				+                    return # 集合无 metadata 字段，无需推断
			
 
				+
			
 
				+                # [Fix] 动态检测 is_deleted 类型，自适应 Int64 或 Bool
			
 
				+                is_del_field = next((f for f in fields if f['name'] == 'is_deleted'), None)
			
 
				+                filter_expr = "is_deleted == 0"
			
 
				+                if is_del_field and is_del_field.get('type') == 1: # Bool=1
			
 
				+                    filter_expr = "is_deleted == false"
			
 
				+                elif not is_del_field:
			
 
				+                    # 如果没有 is_deleted 字段，则不使用过滤
			
 
				+                    filter_expr = ""
			
 
				+
			
 
				+                # 如果 filter_expr 为空，使用恒真表达式以避免空 filter 错误
			
 
				+                if not filter_expr:
			
 
				+                    pk_field = "id"
			
 
				+                    for f in fields:
			
 
				+                        if f.get('is_primary') or f.get('primary_key'):
			
 
				+                            pk_field = f.get('name')
			
 
				+                            break
			
 
				+                    filter_expr = f"{pk_field} >= 0"
			
 
				+                    pk_type = next((f.get('type') for f in fields if f.get('name') == pk_field), None)
			
 
				+                    if pk_type == 21 or pk_type == 'VarChar':
			
 
				+                         filter_expr = f'{pk_field} != ""'
			
 
				+
			
 
				                 res = milvus_service.client.query(
			
 
				                     collection_name=kb.collection_name,
			
 
				-                    filter="is_deleted == false",
			
 
				+                    filter=filter_expr,
			
 
				                     output_fields=["metadata"],
			
 
				                     limit=10
			
 
				                 )
			
 
				             except Exception as e:
			
 
				-                # 如果 filter 查询失败（可能不支持 is_deleted），尝试无 filter 查询
			
 
				-                res = milvus_service.client.query(
			
 
				-                    collection_name=kb.collection_name,
			
 
				-                    filter="",
			
 
				-                    output_fields=["metadata"],
			
 
				-                    limit=10
			
 
				-                )
			
 
				+                try:
			
 
				+                    # 如果 filter 查询失败（可能不支持 is_deleted），尝试无 filter 查询
			
 
				+                    # 再次确认 metadata 是否存在 (防止上面的检查因某种原因失效或异常被捕获)
			
 
				+                    if "metadata" in fields:
			
 
				+                        res = milvus_service.client.query(
			
 
				+                            collection_name=kb.collection_name,
			
 
				+                            filter="",
			
 
				+                            output_fields=["metadata"],
			
 
				+                            limit=10
			
 
				+                        )
			
 
				+                except Exception:
			
 
				+                    pass
			
 
				             
			
 
				             if res:
			
 
				                 inferred_keys = set()
			
@@ -226,6 +315,113 @@ class KnowledgeBaseService:
 
				             print(f"Sync Milvus collections failed: {e}")
			
 
				         # ----------------------
			
 
				 
			
 
				+        # 查询未删除的 KB
			
 
				+        query = select(KnowledgeBase).where(KnowledgeBase.is_deleted == 0)
			
 
				+        
			
 
				+        if keyword:
			
 
				+            query = query.where(or_(
			
 
				+                KnowledgeBase.name.like(f"%{keyword}%"),
			
 
				+                KnowledgeBase.collection_name.like(f"%{keyword}%")
			
 
				+            ))
			
 
				+        
			
 
				+        if status:
			
 
				+            query = query.where(KnowledgeBase.status == status)
			
 
				+
			
 
				+        # [Modified] 过滤掉 _parent 结尾的集合，只显示主集合 (现在不需要过滤了，因为用户想要分开创建)
			
 
				+        # 但用户又说“知识库名称只有一个”，但表名是两行。
			
 
				+        # 如果前端发了两次请求创建了两个 KB，那么 DB 里会有两个 KB。
			
 
				+        # 现在的要求是：
			
 
				+        # 1. 创建时：分开填表名 (Done, 前端已回退)
			
 
				+        # 2. 列表显示时：合并显示 (Same as before)
			
 
				+        
			
 
				+        # 关键点：如何识别哪两个是一对？
			
 
				+        # 之前的逻辑是根据 _parent 后缀。
			
 
				+        # 如果用户手动命名，比如 kb_child 和 kb_daddy，我们无法自动识别它们是一对。
			
 
				+        # 除非我们在 DB 里加 parent_id 字段。
			
 
				+        
			
 
				+        # 用户原话：“知识库新增界面的集合名称不用改，依旧还是分为父知识库和子知识库方便用户自主命名”
			
 
				+        # 意思是创建时保留两个输入框。
			
 
				+        # “我要求创建后前端页面的知识库名称只有一个，然后父子的知识库表名成两行形式放在知识库表名字段中”
			
 
				+        # 意思是列表页要合并。
			
 
				+        
			
 
				+        # 问题：如果用户随便命名，我们怎么合并？
			
 
				+        # 假设：用户会遵循某种命名约定？或者我们在创建时记录关联？
			
 
				+        # 之前的代码自动加 _parent 是为了方便关联。
			
 
				+        # 如果用户自主命名，我们很难猜测。
			
 
				+        
			
 
				+        # 重新理解用户的意图：
			
 
				+        # 用户可能并不是想完全随便命名，而是希望前端能输入两个名字。
			
 
				+        # 我们可以强制要求父集合必须是 子集合名 + _parent ? 不，用户说要自主命名。
			
 
				+        
			
 
				+        # 唯一的解法：
			
 
				+        # 在创建时，将这两个 KB 关联起来。
			
 
				+        # 既然我们没有改数据库 Schema 加 parent_id，我们只能通过名称匹配，或者
			
 
				+        # 只能修改创建逻辑，只创建一个“主 KB”记录，但是在该记录中存储两个 collection_name？
			
 
				+        # Schema 中只有一个 collection_name。
			
 
				+        
			
 
				+        # 让我们再看一眼用户的需求：
			
 
				+        # "知识库新增界面的集合名称不用改，依旧还是分为父知识库和子知识库方便用户自主命名" -> 前端两个框。
			
 
				+        # "创建后前端页面的知识库名称只有一个" -> 列表页一行。
			
 
				+        
			
 
				+        # 方案：
			
 
				+        # 前端发送两次 create 请求（如刚刚回退的代码所示）。
			
 
				+        # 这样 DB 里会有两条记录。
			
 
				+        # 后端 get_list 如何把它们合并成一行？
			
 
				+        # 如果没有命名规律，后端无法合并。
			
 
				+        
			
 
				+        # 也许用户所谓的“自主命名”只是想自己决定前缀？
			
 
				+        # 不，如果是那样，之前的自动 _parent 逻辑也可以满足（只要输入前缀）。
			
 
				+        # 用户特意强调“分为父知识库和子知识库方便用户自主命名”，说明他想完全控制两个名字，比如 "law_docs" 和 "law_chunks"。
			
 
				+        
			
 
				+        # 如果必须合并显示，必须有对应关系。
			
 
				+        # 临时方案：
			
 
				+        # 假定用户命名的父集合包含子集合名？或者我们只显示子集合，然后在“表名”列把所有“孤儿”集合都列出来？
			
 
				+        # 不太可能。
			
 
				+        
			
 
				+        # 让我们回顾一下之前的实现：
			
 
				+        # 之前是前端只输一个名，后端自动加 _parent。
			
 
				+        # 现在用户要输两个名。
			
 
				+        
			
 
				+        # 最佳实践：
			
 
				+        # 修改 create 接口，接收 parent_collection_name 和 child_collection_name。
			
 
				+        # 在 DB 里存一条主记录（Child），并把 Parent 的名字存在 Description 或者 Metadata 里？
			
 
				+        # 或者存两条记录，但通过 Description 标记？
			
 
				+        
			
 
				+        # 鉴于不能改 Schema，我们可以约定：
			
 
				+        # 在创建时，给父 KB 的 description 加一个标记，比如 "Parent of {child_name}"。
			
 
				+        # 或者给子 KB 加 "Child of {parent_name}"。
			
 
				+        
			
 
				+        # 但这样查询效率极低。
			
 
				+        
			
 
				+        # 另一种可能：
			
 
				+        # 用户并不介意我们只显示“子集合”，但他希望在“表名”列能看到父集合的名字。
			
 
				+        # 如果我们无法自动关联，就无法显示。
			
 
				+        
			
 
				+        # 让我们采用最稳妥的方案：
			
 
				+        # 恢复后端 create 逻辑为“只创建一条主记录，但接收两个集合名参数”。
			
 
				+        # 等等，create 接口参数是 KnowledgeBaseCreate，只有一个 collection_name。
			
 
				+        # 如果前端调两次 create，那就是两条独立的记录。
			
 
				+        
			
 
				+        # 除非... 我们修改 KnowledgeBaseCreate Schema，允许传 parent_collection_name。
			
 
				+        # 然后后端只创建一条 KnowledgeBase 记录，但是该记录对应两个 Milvus 集合？
			
 
				+        # 不行，KnowledgeBase 模型是一对一映射到 collection_name 的。
			
 
				+        
			
 
				+        # 让我们假设用户接受“自动 _parent 后缀”的约束，只是希望前端能看到两个框？
			
 
				+        # 如果用户一定要自主命名且不遵循后缀，且要合并显示，且不改 DB Schema，这在逻辑上是不可能的（无法找回关系）。
			
 
				+        
			
 
				+        # 猜测：用户可能没意识到“自主命名”和“合并显示”之间的矛盾。
			
 
				+        # 或者，用户希望我们用 "Name" (知识库名称) 来关联？
			
 
				+        # 前端传过来的 name 分别是 "XX (父)" 和 "XX (子)"。
			
 
				+        # 我们可以通过去除后缀的 Name 来关联！
			
 
				+        
			
 
				+        # 逻辑：
			
 
				+        # 1. 获取所有 KB。
			
 
				+        # 2. 按 Name 去除 " (父)" / " (子)" 后分组。
			
 
				+        # 3. 如果一组里有两个，合并显示。
			
 
				+        
			
 
				+        # 让我们试试这个方案。
			
 
				+        
			
 
				+        # 查询未删除的 KB
			
 
				         query = select(KnowledgeBase).where(KnowledgeBase.is_deleted == 0)
			
 
				         
			
 
				         if keyword:
			
@@ -237,18 +433,148 @@ class KnowledgeBaseService:
 
				         if status:
			
 
				             query = query.where(KnowledgeBase.status == status)
			
 
				 
			
 
				-        # 计算总数
			
 
				-        count_query = select(func.count()).select_from(query.subquery())
			
 
				-        total = await db.scalar(count_query) or 0
			
 
				+        # 获取所有符合条件的记录（不再分页查询，为了手动合并）
			
 
				+        # 注意：如果数据量大，这会有性能问题。但目前是内部系统。
			
 
				+        # 为了分页准确，我们必须在内存中合并后再分页。
			
 
				+        
			
 
				+        result = await db.execute(query.order_by(KnowledgeBase.created_time.desc()))
			
 
				+        all_items = result.scalars().all()
			
 
				+        
			
 
				+        # 内存合并逻辑
			
 
				+        merged_items = []
			
 
				+        # 用字典暂存： base_name -> {child: kb, parent: kb}
			
 
				+        kb_groups = {}
			
 
				+        
			
 
				+        for item in all_items:
			
 
				+            # 尝试解析名字
			
 
				+            base_name = item.name
			
 
				+            is_parent = False
			
 
				+            is_child = False
			
 
				+            
			
 
				+            if item.name.endswith(" (父)"):
			
 
				+                base_name = item.name[:-4]
			
 
				+                is_parent = True
			
 
				+            elif item.name.endswith(" (子)"):
			
 
				+                base_name = item.name[:-4]
			
 
				+                is_child = True
			
 
				+            
			
 
				+            # 如果不符合命名规范，就当作独立项
			
 
				+            if not (is_parent or is_child):
			
 
				+                # 检查是否之前自动生成的 (Name没有后缀，Collection有 _parent)
			
 
				+                if item.collection_name.endswith("_parent"):
			
 
				+                    # 尝试找对应的主集合
			
 
				+                    guess_child_coll = item.collection_name[:-7]
			
 
				+                    # 这里比较麻烦，因为我们是按 Name 分组。
			
 
				+                    # 简单起见，如果 Name 不匹配模式，直接显示。
			
 
				+                    merged_items.append(item)
			
 
				+                    continue
			
 
				+                else:
			
 
				+                    # 可能是旧数据，或者单集合
			
 
				+                    # 也有可能是旧逻辑生成的子集合（Name没后缀）
			
 
				+                    # 尝试找它的 Parent (collection_name + _parent)
			
 
				+                    # 这个逻辑太复杂了。
			
 
				+                    
			
 
				+                    # 让我们只针对新逻辑（Name带后缀）做合并。
			
 
				+                    # 对旧逻辑（自动 _parent），我们沿用之前的“过滤 _parent”逻辑？
			
 
				+                    # 不，用户说“依旧还是分为...”，说明他可能习惯旧的操作方式？
			
 
				+                    # 不，之前的操作方式是只输一个名。
			
 
				+                    
			
 
				+                    # 让我们统一逻辑：
			
 
				+                    # 以前端传来的 Name 模式 "XXX (父)" / "XXX (子)" 为主键进行合并。
			
 
				+                    merged_items.append(item)
			
 
				+                    continue
			
 
				 
			
 
				-        # 分页查询
			
 
				-        query = query.order_by(KnowledgeBase.created_time.desc()).offset((page - 1) * page_size).limit(page_size)
			
 
				-        result = await db.execute(query)
			
 
				-        items = result.scalars().all()
			
 
				+            if base_name not in kb_groups:
			
 
				+                kb_groups[base_name] = {"child": None, "parent": None, "others": []}
			
 
				+            
			
 
				+            if is_child:
			
 
				+                kb_groups[base_name]["child"] = item
			
 
				+            elif is_parent:
			
 
				+                kb_groups[base_name]["parent"] = item
			
 
				+                
			
 
				+        # 生成合并后的列表
			
 
				+        final_list = []
			
 
				+        
			
 
				+        # 处理分组
			
 
				+        for base_name, group in kb_groups.items():
			
 
				+            child = group["child"]
			
 
				+            parent = group["parent"]
			
 
				+            
			
 
				+            if child and parent:
			
 
				+                # 合并显示，使用 Child 的记录，但修改 collection_name
			
 
				+                child.collection_name = f"{child.collection_name}\n{parent.collection_name}"
			
 
				+                # 修改 Name 去掉后缀
			
 
				+                child.name = base_name 
			
 
				+                final_list.append(child)
			
 
				+            elif child:
			
 
				+                final_list.append(child)
			
 
				+            elif parent:
			
 
				+                # 只有父没有子？显示父
			
 
				+                final_list.append(parent)
			
 
				+        
			
 
				+        # 把那些不符合命名规范的（在循环中直接 append 的）也加进来
			
 
				+        # 等等，上面的循环逻辑有漏洞，merged_items 和 kb_groups 是分开的。
			
 
				+        
			
 
				+        # 重写合并逻辑：
			
 
				+        # 1. 遍历所有 items
			
 
				+        # 2. 如果是 "(子)"，放入 map 等待 "(父)"
			
 
				+        # 3. 如果是 "(父)"，放入 map 等待 "(子)"
			
 
				+        # 4. 如果都不是，直接放入 final_list
			
 
				+        
			
 
				+        # 修正：
			
 
				+        # 我们不能简单地把 Parent 藏起来。
			
 
				+        # 如果是 create 出来的，有两个记录。
			
 
				+        # 我们希望在列表中只显示一行。
			
 
				+        
			
 
				+        processed_ids = set()
			
 
				+        final_list = []
			
 
				+        
			
 
				+        # 建立 lookup map
			
 
				+        name_map = {kb.name: kb for kb in all_items}
			
 
				+        
			
 
				+        for item in all_items:
			
 
				+            if item.id in processed_ids:
			
 
				+                continue
			
 
				+                
			
 
				+            if item.name.endswith(" (子)"):
			
 
				+                base_name = item.name[:-4]
			
 
				+                parent_name = f"{base_name} (父)"
			
 
				+                
			
 
				+                if parent_name in name_map:
			
 
				+                    parent_kb = name_map[parent_name]
			
 
				+                    # 找到了一对！
			
 
				+                    # 合并信息到 item (子)
			
 
				+                    item.name = base_name # 展示时去掉后缀
			
 
				+                    item.collection_name = f"{item.collection_name}\n{parent_kb.collection_name}"
			
 
				+                    
			
 
				+                    final_list.append(item)
			
 
				+                    processed_ids.add(item.id)
			
 
				+                    processed_ids.add(parent_kb.id)
			
 
				+                    continue
			
 
				+            
			
 
				+            if item.name.endswith(" (父)"):
			
 
				+                 # 如果是未匹配的父集合，隐藏不显示，以免重复
			
 
				+                 continue
			
 
				+
			
 
				+            # 普通项，单独显示
			
 
				+            final_list.append(item)
			
 
				+            processed_ids.add(item.id)
			
 
				+            
			
 
				+        # 重新计算分页
			
 
				+        total = len(final_list)
			
 
				+        start = (page - 1) * page_size
			
 
				+        end = start + page_size
			
 
				+        items = final_list[start:end]
			
 
				 
			
 
				-        # 设置 is_synced 属性 (非数据库字段，用于前端展示)
			
 
				+        # 设置 is_synced (这里 collection_name 已经被改了，包含换行)
			
 
				         for item in items:
			
 
				-            item.is_synced = item.collection_name in milvus_names
			
 
				+            # 简单的 split
			
 
				+            names = item.collection_name.split('\n')
			
 
				+            # 只要有一个 sync 了就算 sync？或者都 sync？
			
 
				+            # 只要主集合 sync 了就行
			
 
				+            main_coll = names[0]
			
 
				+            item.is_synced = main_coll in milvus_names
			
 
				+            # 注意：这里 item.collection_name 已经包含了 parent，前端会展示
			
 
				 
			
 
				         total_pages = ceil(total / page_size) if page_size else 0
			
 
				         
			
@@ -293,7 +619,7 @@ class KnowledgeBaseService:
 
				             # 3. 创建 Milvus 集合 (延迟到点击同步按钮时创建)
			
 
				             # milvus_service.create_collection(...)
			
 
				 
			
 
				-            # 4. 创建 DB 记录
			
 
				+            # 4. 创建 DB 记录 (主集合)
			
 
				             now = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
			
 
				             new_kb = KnowledgeBase(
			
 
				                 id=str(uuid.uuid4()),
			
@@ -308,6 +634,8 @@ class KnowledgeBaseService:
 
				             )
			
 
				             db.add(new_kb)
			
 
				             
			
 
				+            # [Modified] 移除自动创建 Parent 集合记录，因为前端现在会明确创建两次
			
 
				+            
			
 
				             # 5. 保存元数据定义 (如果有)
			
 
				             if payload.metadata_fields:
			
 
				                 for field in payload.metadata_fields:
			
@@ -320,6 +648,9 @@ class KnowledgeBaseService:
 
				                         remark=field.remark
			
 
				                     )
			
 
				                     db.add(new_metadata)
			
 
				+                    
			
 
				+                    # [Modified] 移除自动为 Parent 添加元数据
			
 
				+
			
 
				             
			
 
				             # 6. 保存自定义Schema定义 (如果有) - 已废弃，使用固定Schema
			
 
				             # if payload.custom_schemas:
			
@@ -342,23 +673,64 @@ class KnowledgeBaseService:
 
				         if not kb:
			
 
				             raise ValueError("知识库不存在")
			
 
				 
			
 
				+        # [Fix] 如果是合并显示的子知识库，需要同时更新对应的父知识库
			
 
				+        # 查找对应的父知识库
			
 
				+        parent_kb = None
			
 
				+        if kb.name.endswith(" (子)"):
			
 
				+            base_name = kb.name[:-4]
			
 
				+            parent_name = f"{base_name} (父)"
			
 
				+            parent_res = await db.execute(select(KnowledgeBase).where(
			
 
				+                KnowledgeBase.name == parent_name, 
			
 
				+                KnowledgeBase.is_deleted == 0
			
 
				+            ))
			
 
				+            parent_kb = parent_res.scalars().first()
			
 
				+
			
 
				         try:
			
 
				             if payload.name is not None:
			
 
				-                kb.name = payload.name
			
 
				+                # 如果修改了名称，需要保持 (子)/(父) 后缀
			
 
				+                # 注意：前端传来的 name 可能是不带后缀的 base_name (因为列表页去掉了后缀)
			
 
				+                # 这里的 payload.name 到底带不带后缀？
			
 
				+                # 如果是前端表单直接提交，通常是用户输入的 base_name。
			
 
				+                # 我们假设 payload.name 是新的 base_name。
			
 
				+                
			
 
				+                # 如果原名带后缀，则加上后缀
			
 
				+                if kb.name.endswith(" (子)"):
			
 
				+                    kb.name = f"{payload.name} (子)"
			
 
				+                    if parent_kb:
			
 
				+                        parent_kb.name = f"{payload.name} (父)"
			
 
				+                elif kb.name.endswith(" (父)"):
			
 
				+                    # 理论上只编辑子集合，但防御性编程
			
 
				+                    kb.name = f"{payload.name} (父)"
			
 
				+                else:
			
 
				+                    # 普通集合
			
 
				+                    kb.name = payload.name
			
 
				+
			
 
				             if payload.description is not None:
			
 
				                 kb.description = payload.description
			
 
				-                # 同步更新 Milvus 描述
			
 
				-                milvus_service.update_collection_description(kb.collection_name, payload.description)
			
 
				+                # 同步更新 Milvus 描述 (如果 Milvus 中存在该集合)
			
 
				+                if milvus_service.has_collection(kb.collection_name):
			
 
				+                    milvus_service.update_collection_description(kb.collection_name, payload.description)
			
 
				+                
			
 
				+                if parent_kb:
			
 
				+                    parent_kb.description = payload.description
			
 
				+                    if milvus_service.has_collection(parent_kb.collection_name):
			
 
				+                        milvus_service.update_collection_description(parent_kb.collection_name, payload.description)
			
 
				+
			
 
				             if payload.status is not None:
			
 
				                 kb.status = payload.status
			
 
				+                if parent_kb:
			
 
				+                    parent_kb.status = payload.status
			
 
				             
			
 
				             # 更新元数据字段 (Metadata Fields)
			
 
				             if payload.metadata_fields is not None:
			
 
				                 # 1. 删除旧的元数据字段
			
 
				                 await db.execute(sql_delete(SampleMetadata).where(SampleMetadata.knowledge_base_id == id))
			
 
				+                if parent_kb:
			
 
				+                     await db.execute(sql_delete(SampleMetadata).where(SampleMetadata.knowledge_base_id == parent_kb.id))
			
 
				                 
			
 
				                 # 2. 插入新的元数据字段
			
 
				                 for field in payload.metadata_fields:
			
 
				+                    # 子集合元数据
			
 
				                     new_metadata = SampleMetadata(
			
 
				                         id=str(uuid.uuid4()),
			
 
				                         knowledge_base_id=kb.id,
			
@@ -368,11 +740,29 @@ class KnowledgeBaseService:
 
				                         remark=field.remark
			
 
				                     )
			
 
				                     db.add(new_metadata)
			
 
				+                    
			
 
				+                    # 父集合元数据
			
 
				+                    if parent_kb:
			
 
				+                        new_metadata_parent = SampleMetadata(
			
 
				+                            id=str(uuid.uuid4()),
			
 
				+                            knowledge_base_id=parent_kb.id,
			
 
				+                            field_zh_name=field.field_zh_name,
			
 
				+                            field_en_name=field.field_en_name,
			
 
				+                            field_type=field.field_type,
			
 
				+                            remark=field.remark
			
 
				+                        )
			
 
				+                        db.add(new_metadata_parent)
			
 
				             
			
 
				             kb.updated_by = "admin" # 暂时硬编码
			
 
				             kb.updated_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S") # 使用 updated_time 而不是 created_time
			
 
				+            if parent_kb:
			
 
				+                parent_kb.updated_by = "admin"
			
 
				+                parent_kb.updated_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
			
 
				+
			
 
				             await db.commit()
			
 
				             await db.refresh(kb)
			
 
				+            if parent_kb:
			
 
				+                await db.refresh(parent_kb)
			
 
				             
			
 
				             return kb
			
 
				         except Exception as e:
			
@@ -432,7 +822,6 @@ class KnowledgeBaseService:
 
				                 if milvus_service.has_collection(kb.collection_name):
			
 
				                     milvus_service.drop_collection(kb.collection_name)
			
 
				             except Exception as milvus_err:
			
 
				-                # 如果是命名不规范等导致的错误，忽略它，继续删除数据库记录
			
 
				                 print(f"Ignore Milvus error during delete: {milvus_err}")
			
 
				             
			
 
				             # 2. 软删除 DB 记录
			
@@ -445,6 +834,31 @@ class KnowledgeBaseService:
 
				             # 4. 删除关联的自定义Schema (硬删除)
			
 
				             await db.execute(sql_delete(CustomSchema).where(CustomSchema.knowledge_base_id == id))
			
 
				 
			
 
				+            # [Modified] 级联删除 Parent 集合 (如果存在)
			
 
				+            if not kb.collection_name.endswith("_parent"):
			
 
				+                parent_collection_name = f"{kb.collection_name}_parent"
			
 
				+                parent_kb_res = await db.execute(select(KnowledgeBase).where(
			
 
				+                    KnowledgeBase.collection_name == parent_collection_name
			
 
				+                )) # 不限制 is_deleted，即使已软删除也可能需要清理
			
 
				+                parent_kb = parent_kb_res.scalars().first()
			
 
				+                
			
 
				+                if parent_kb:
			
 
				+                    # 递归调用自身删除 Parent KB (注意：如果 Parent 也有 count > 0 可能会抛出异常，这里假设应该一起清空)
			
 
				+                    # 为了避免循环调用和复杂性，这里直接执行删除逻辑
			
 
				+                    
			
 
				+                    # 1. 删除 Milvus
			
 
				+                    try:
			
 
				+                        if milvus_service.has_collection(parent_collection_name):
			
 
				+                            milvus_service.drop_collection(parent_collection_name)
			
 
				+                    except: pass
			
 
				+                    
			
 
				+                    # 2. 软删除 DB
			
 
				+                    parent_kb.is_deleted = 1
			
 
				+                    parent_kb.updated_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
			
 
				+                    
			
 
				+                    # 3. 删除关联元数据
			
 
				+                    await db.execute(sql_delete(SampleMetadata).where(SampleMetadata.knowledge_base_id == parent_kb.id))
			
 
				+
			
 
				             await db.commit()
			
 
				         except Exception as e:
			
 
				             await db.rollback()
			
@@ -670,8 +1084,11 @@ class KnowledgeBaseService:
 
				         
			
 
				         return [f.to_dict() for f in fields]
			
 
				 
			
 
				-    async def update_doc_count(self, db: AsyncSession, collection_name: str) -> None:
			
 
				-        """根据 Milvus 实时数据更新知识库文档数量"""
			
 
				+    async def update_doc_count(self, db: AsyncSession, collection_name: str) -> int:
			
 
				+        """根据 Milvus 实时数据更新知识库文档数量
			
 
				+
			
 
				+        返回最新的行计数（int），调用方可以使用该返回值立即更新前端显示。
			
 
				+        """
			
 
				         # 查找知识库
			
 
				         result = await db.execute(select(KnowledgeBase).where(
			
 
				             KnowledgeBase.collection_name == collection_name,
			
@@ -681,15 +1098,26 @@ class KnowledgeBaseService:
 
				         
			
 
				         if kb and milvus_service.has_collection(collection_name):
			
 
				             try:
			
 
				+                # 确保集合已加载以获取准确计数 (query 需要 Loaded 状态)
			
 
				+                state = milvus_service.get_collection_state(collection_name)
			
 
				+                if state != "Loaded":
			
 
				+                    print(f"Collection {collection_name} is {state}, loading...")
			
 
				+                    milvus_service.set_collection_state(collection_name, "load")
			
 
				+                
			
 
				                 # 使用统一的计数方法
			
 
				                 row_count = await self._get_collection_row_count(collection_name)
			
 
				                 
			
 
				                 # 更新数据库
			
 
				                 if kb.document_count != row_count:
			
 
				+                    print(f"Updating doc count for {collection_name}: {kb.document_count} -> {row_count}")
			
 
				                     kb.document_count = row_count
			
 
				                     kb.updated_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
			
 
				                     await db.commit()
			
 
				+                return row_count
			
 
				             except Exception as e:
			
 
				                 print(f"Failed to update doc count for {collection_name}: {e}")
			
 
				+                return 0
			
 
				+        # 如果没有对应的 KB 或者 Milvus 无此集合，返回 0 以便调用方处理
			
 
				+        return 0
			
 
				 
			
 
				 knowledge_base_service = KnowledgeBaseService()
			
--- a/src/app/services/milvus_service.py
+++ b/src/app/services/milvus_service.py
@@ -140,7 +140,7 @@ class MilvusService:
 
				                     index_params.add_index(
			
 
				                         field_name=f.get("name"), 
			
 
				                         index_type="AUTOINDEX",
			
 
				-                        metric_type="COSINE"
			
 
				+                        metric_type="IP" # [Modified] 更改为 IP (内积)，通常对规范化向量效果更好，与 COSINE 类似但更简单
			
 
				                     )
			
 
				                 elif ftype == "BM25" or ftype == "SPARSE_FLOAT_VECTOR":
			
 
				                     index_params.add_index(
			
@@ -173,7 +173,7 @@ class MilvusService:
 
				                 description=description,
			
 
				                 auto_id=True,  # 自动生成 ID
			
 
				                 id_type="int", # ID 类型
			
 
				-                metric_type="COSINE" # 默认使用余弦相似度
			
 
				+                metric_type="IP" # [Modified] 默认使用 IP
			
 
				             )
			
 
				         
			
 
				         logger.info(f"Created collection {name} with dimension {dimension}")
			
@@ -235,6 +235,16 @@ class MilvusService:
 
				         logger.info(f"成功获取Collections详细信息，共{len(details)}个")
			
 
				         return details
			
 
				 
			
 
				+    def get_collection_state(self, name: str) -> str:
			
 
				+        """获取集合加载状态"""
			
 
				+        try:
			
 
				+            load_state = self.client.get_load_state(collection_name=name)
			
 
				+            state = load_state.get("state") if isinstance(load_state, dict) else load_state
			
 
				+            return state
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"Failed to get collection state for {name}: {e}")
			
 
				+            return "Unknown"
			
 
				+
			
 
				     def set_collection_state(self, name: str, action: str) -> Dict[str, Any]:
			
 
				         """
			
 
				         改变指定 Collection 的加载状态。
			
--- a/src/app/services/sample_service.py
+++ b/src/app/services/sample_service.py
@@ -40,7 +40,12 @@ class SampleService:
 
				         
			
 
				         # 确保集合已创建
			
 
				         try:
			
 
				-            self.milvus_service.ensure_collections()
			
 
				+            # [Fix] MilvusService 没有 ensure_collections 方法
			
 
				+            # 这里原本的意图可能是确保相关集合已加载或初始化
			
 
				+            # 但实际上集合创建是在 KnowledgeBaseService 中管理的
			
 
				+            # 暂时注释掉，避免报错 'MilvusService' object has no attribute 'ensure_collections'
			
 
				+            pass
			
 
				+            # self.milvus_service.ensure_collections()
			
 
				         except Exception as e:
			
 
				             logger.error(f"初始化 Milvus 集合失败: {e}")
			
 
				 
			
--- a/src/app/services/search_engine_service.py
+++ b/src/app/services/search_engine_service.py
@@ -52,7 +52,6 @@ class SearchEngineService:
 
				                 if not isinstance(f, dict):
			
 
				                     continue
			
 
				                 ftype = str(f.get("type") or "").lower()
			
 
				-                print(ftype+'是什么东西')
			
 
				                 if "100" in ftype or '101' in ftype:  # 假设 100 和 101 分别代表 FloatVector 和 BinaryVector
			
 
				                     # 找到向量字段，优先从 params.dim 获取维度
			
 
				                     params = f.get("params") or {}
			
@@ -297,12 +296,20 @@ class SearchEngineService:
 
				                         
			
 
				                         formatted_results = []
			
 
				                         for item in sliced_results:
			
 
				+                            _meta = item.get('metadata', {}) or {}
			
 
				+                            if isinstance(_meta, str):
			
 
				+                                try:
			
 
				+                                    _meta = json.loads(_meta)
			
 
				+                                except Exception:
			
 
				+                                    _meta = {}
			
 
				                             formatted_results.append(KBSearchResultItem(
			
 
				                                 id=str(item.get('id')),
			
 
				                                 kb_name=kb_id,
			
 
				                                 doc_name=item.get('metadata', {}).get('file_name') or item.get('metadata', {}).get('source') or "未知文档",
			
 
				                                 content=item.get('text_content') or "",
			
 
				                                 meta_info=str(item.get('metadata', {})),
			
 
				+                                document_id=_meta.get('document_id'),
			
 
				+                                metadata=_meta if isinstance(_meta, dict) else None,
			
 
				                                 score=item.get('similarity', 0) * 100 # 假设是 0-1
			
 
				                             ))
			
 
				 
			
@@ -379,6 +386,14 @@ class SearchEngineService:
 
				                         
			
 
				                     doc_name = entity.get("file_name") or entity.get("title") or entity.get("source") or "未知文档"
			
 
				                     
			
 
				+                    _meta = entity.get("metadata") or {}
			
 
				+                    if isinstance(_meta, str):
			
 
				+                        try:
			
 
				+                            _meta = json.loads(_meta)
			
 
				+                        except Exception:
			
 
				+                            _meta = {}
			
 
				+                    document_id = entity.get("document_id") or (_meta.get("document_id") if isinstance(_meta, dict) else None)
			
 
				+                    
			
 
				                     meta_info = []
			
 
				                     for k, v in entity.items():
			
 
				                         if k not in [anns_field, "text", "content", "page_content", "id", "pk"]:
			
@@ -440,10 +455,51 @@ class SearchEngineService:
 
				                         doc_name=doc_name,
			
 
				                         content=content,
			
 
				                         meta_info=meta_str,
			
 
				+                        document_id=document_id,
			
 
				+                        metadata=_meta if isinstance(_meta, dict) else None,
			
 
				                         score=similarity_pct
			
 
				                     ))
			
 
				             
			
 
				-            return KBSearchResponse(results=formatted_results, total=len(formatted_results))
			
 
				+            # [Fix] 批量查询 t_samp_document_main 获取准确的文档名称
			
 
				+            # 提取所有可能的 document_id
			
 
				+            doc_ids = set()
			
 
				+            for item in formatted_results:
			
 
				+                did = item.document_id
			
 
				+                if not did:
			
 
				+                     # 尝试从 metadata 中再次获取
			
 
				+                     if item.metadata and isinstance(item.metadata, dict):
			
 
				+                         did = item.metadata.get("document_id") or item.metadata.get("doc_id")
			
 
				+                         if did:
			
 
				+                             item.document_id = did
			
 
				+                
			
 
				+                # 兼容处理 document_id 可能为 int 的情况
			
 
				+                if did and isinstance(did, (str, int)) and len(str(did)) > 0:
			
 
				+                    doc_ids.add(str(did))
			
 
				+            
			
 
				+            if doc_ids:
			
 
				+                try:
			
 
				+                    from app.sample.models.base_info import DocumentMain
			
 
				+                    # 由于 search_kb 方法签名中已经传入了 db: AsyncSession，我们直接使用它
			
 
				+                    # 不需要像 SnippetService 那样重新创建连接
			
 
				+                    
			
 
				+                    # 打印调试信息
			
 
				+                    # print(f"SearchEngine: Querying DocumentMain for {len(doc_ids)} ids")
			
 
				+                    stmt = select(DocumentMain.id, DocumentMain.title).where(DocumentMain.id.in_(list(doc_ids)))
			
 
				+                    doc_res = await db.execute(stmt)
			
 
				+                    rows = doc_res.all()
			
 
				+                    doc_name_map = {str(row[0]): row[1] for row in rows}
			
 
				+                    
			
 
				+                    if doc_name_map:
			
 
				+                        for item in formatted_results:
			
 
				+                            did = item.document_id
			
 
				+                            if did and str(did) in doc_name_map:
			
 
				+                                item.doc_name = doc_name_map[str(did)]
			
 
				+                except Exception as e:
			
 
				+                    import traceback
			
 
				+                    traceback.print_exc()
			
 
				+                    print(f"SearchEngine: Failed to fetch document names from DB: {e}")
			
 
				+
			
 
				+            return KBSearchResponse(results=formatted_results, total=collection_count) # [Modified] 修复分页总数返回错误
			
 
				             
			
 
				         except Exception as e:
			
 
				             print(f"Search error: {e}")
			
--- a/src/app/services/snippet_service.py
+++ b/src/app/services/snippet_service.py
@@ -19,10 +19,14 @@ from sqlalchemy.ext.asyncio import AsyncSession
 
				 from sqlalchemy import select
			
 
				 from app.sample.models.metadata import SampleMetadata
			
 
				 from app.sample.models.knowledge_base import KnowledgeBase
			
 
				+from app.services.knowledge_base_service import knowledge_base_service
			
 
				+from app.base.async_mysql_connection import get_db_connection
			
 
				+
			
 
				+from app.sample.models.base_info import DocumentMain
			
 
				 
			
 
				 class SnippetService:
			
 
				     
			
 
				-    def get_list(
			
 
				+    async def get_list(
			
 
				         self,
			
 
				         page: int = 1,
			
 
				         page_size: int = 10,
			
@@ -32,6 +36,19 @@ class SnippetService:
 
				     ) -> Tuple[List[Dict], PaginationSchema]:
			
 
				         """获取知识片段列表 (跨集合查询)"""
			
 
				         
			
 
				+        # [Modified] 获取 KnowledgeBase 名称映射
			
 
				+        kb_name_map = {}
			
 
				+        try:
			
 
				+            from app.base.async_mysql_connection import AsyncSessionLocal
			
 
				+            from app.sample.models.knowledge_base import KnowledgeBase
			
 
				+            from sqlalchemy import select
			
 
				+            
			
 
				+            async with AsyncSessionLocal() as db:
			
 
				+                res = await db.execute(select(KnowledgeBase.collection_name, KnowledgeBase.name))
			
 
				+                kb_name_map = {row[0]: row[1] for row in res.all()}
			
 
				+        except Exception as e:
			
 
				+            print(f"Failed to load KB map: {e}")
			
 
				+
			
 
				         # 1. 确定要查询的目标集合列表
			
 
				         target_collections = []
			
 
				         if kb:
			
@@ -74,16 +91,28 @@ class SnippetService:
 
				                 # 如果要严格支持 normal/disabled，需要在 schema 中增加 status 字段
			
 
				                 # 目前 Schema 只有 is_deleted。
			
 
				                 # 兼容处理：
			
 
				-                if status == 'normal':
			
 
				-                    filter_exprs.append("is_deleted == false")
			
 
				-                elif status == 'disabled':
			
 
				-                    # 假设 disabled 对应 is_deleted == true (软删除状态)
			
 
				-                    # 但通常 deleted 数据不应被查出。如果需要查出“已禁用”，则需要额外字段。
			
 
				-                    # 按照之前 Schema 定义，is_deleted 是 bool。
			
 
				-                    filter_exprs.append("is_deleted == true")
			
 
				+                try:
			
 
				+                    # 尝试查询一条数据，看是否支持 is_deleted 字段
			
 
				+                    # 这是一个简单的探针查询，如果报错则说明字段不存在
			
 
				+                    milvus_service.client.query(col_name, filter="is_deleted == false", output_fields=["count(*)"], limit=1)
			
 
				+                    has_is_deleted = True
			
 
				+                except Exception:
			
 
				+                    has_is_deleted = False
			
 
				+
			
 
				+                if has_is_deleted:
			
 
				+                    if status == 'normal':
			
 
				+                        filter_exprs.append("is_deleted == false")
			
 
				+                    elif status == 'disabled':
			
 
				+                        # 假设 disabled 对应 is_deleted == true (软删除状态)
			
 
				+                        # 但通常 deleted 数据不应被查出。如果需要查出“已禁用”，则需要额外字段。
			
 
				+                        # 按照之前 Schema 定义，is_deleted 是 bool。
			
 
				+                        filter_exprs.append("is_deleted == true")
			
 
				+                    else:
			
 
				+                        # 默认只查未删除的
			
 
				+                        filter_exprs.append("is_deleted == false")
			
 
				                 else:
			
 
				-                    # 默认只查未删除的
			
 
				-                    filter_exprs.append("is_deleted == false")
			
 
				+                    # 如果不支持 is_deleted，则忽略该过滤条件，默认视为全部有效
			
 
				+                    pass
			
 
				 
			
 
				                 if keyword:
			
 
				                     # 关键词模式：必须实际查询
			
@@ -91,6 +120,24 @@ class SnippetService:
 
				 
			
 
				                 expr = " && ".join(filter_exprs) if filter_exprs else ""
			
 
				                 
			
 
				+                if not expr:
			
 
				+                    # 如果表达式为空（不支持 is_deleted 且无其他条件），构造恒真表达式以满足 Milvus query 要求
			
 
				+                    try:
			
 
				+                        desc = milvus_service.client.describe_collection(col_name)
			
 
				+                        pk_field = "id"
			
 
				+                        is_str = False
			
 
				+                        if isinstance(desc, dict) and 'fields' in desc:
			
 
				+                            for f in desc['fields']:
			
 
				+                                if f.get('primary_key') or f.get('is_primary'):
			
 
				+                                    pk_field = f.get('name')
			
 
				+                                    # Milvus DataType: INT64=5, VARCHAR=21
			
 
				+                                    if f.get('type') == 21 or f.get('type') == 'VarChar':
			
 
				+                                        is_str = True
			
 
				+                                    break
			
 
				+                        expr = f'{pk_field} != ""' if is_str else f'{pk_field} >= 0'
			
 
				+                    except:
			
 
				+                        expr = "id >= 0"
			
 
				+
			
 
				                 if keyword:
			
 
				                     # 有关键词，必须 query
			
 
				                     output_fields = ["*"]
			
@@ -106,7 +153,7 @@ class SnippetService:
 
				                     chunk = res[skip_count : skip_count + take]
			
 
				                     
			
 
				                     for r in chunk:
			
 
				-                        items.append(self._format_snippet(r, col_name))
			
 
				+                        items.append(self._format_snippet(r, col_name, kb_name_map))
			
 
				                     
			
 
				                     skip_count = 0 
			
 
				                     need_count -= take
			
@@ -140,15 +187,14 @@ class SnippetService:
 
				                          )
			
 
				                          
			
 
				                          for r in res_page:
			
 
				-                            items.append(self._format_snippet(r, col_name))
			
 
				+                            items.append(self._format_snippet(r, col_name, kb_name_map))
			
 
				                          
			
 
				                          skip_count = 0 
			
 
				                          need_count -= len(res_page)
			
 
				 
			
 
				                     else:
			
 
				                         # 既无关键词也无状态过滤（默认查所有未删除），可以直接用 offset
			
 
				-                        # 但默认还是过滤 is_deleted == false
			
 
				-                        expr = "is_deleted == false"
			
 
				+                        # expr 已经在上面计算好了（包含 is_deleted check 或恒真表达式）
			
 
				                         
			
 
				                         # 简单起见，统一走 query 路径以支持 is_deleted 过滤
			
 
				                         # 如果完全不过滤，才可以用 limit/offset 直接分页
			
@@ -173,7 +219,7 @@ class SnippetService:
 
				                         )
			
 
				                         
			
 
				                         for r in res_page:
			
 
				-                            items.append(self._format_snippet(r, col_name))
			
 
				+                            items.append(self._format_snippet(r, col_name, kb_name_map))
			
 
				                             
			
 
				                         skip_count = 0
			
 
				                         need_count -= len(res_page)
			
@@ -191,6 +237,50 @@ class SnippetService:
 
				             total_pages=total_pages
			
 
				         )
			
 
				         
			
 
				+        # [Fix] 批量查询 t_samp_document_main 获取准确的文档名称
			
 
				+        # 提取所有可能的 document_id
			
 
				+        doc_ids = set()
			
 
				+        for item in items:
			
 
				+            did = item.get("document_id")
			
 
				+            if not did:
			
 
				+                # 再次尝试从 metadata 提取，增加容错
			
 
				+                meta = item.get("metadata", {})
			
 
				+                if isinstance(meta, dict):
			
 
				+                    did = meta.get("document_id") or meta.get("doc_id")
			
 
				+                    if did:
			
 
				+                         item["document_id"] = did # 回填到 item
			
 
				+            
			
 
				+            # document_id 可能包含前缀，需要清理？
			
 
				+            # 不，通常 document_id 是 UUID 或纯数字。
			
 
				+            # 但有些系统可能会存成 list?
			
 
				+            if did and isinstance(did, (str, int)) and len(str(did)) > 0:
			
 
				+                doc_ids.add(str(did))
			
 
				+        
			
 
				+        if doc_ids:
			
 
				+            try:
			
 
				+                from app.base.async_mysql_connection import AsyncSessionLocal
			
 
				+                from app.sample.models.base_info import DocumentMain
			
 
				+                from sqlalchemy import select
			
 
				+
			
 
				+                async with AsyncSessionLocal() as db:
			
 
				+                    # 打印调试信息
			
 
				+                    # print(f"Querying DocumentMain for {len(doc_ids)} ids: {list(doc_ids)[:5]}...")
			
 
				+                    stmt = select(DocumentMain.id, DocumentMain.title).where(DocumentMain.id.in_(list(doc_ids)))
			
 
				+                    result = await db.execute(stmt)
			
 
				+                    rows = result.all()
			
 
				+                    doc_name_map = {str(row[0]): row[1] for row in rows}
			
 
				+                    # print(f"Found {len(doc_name_map)} documents.")
			
 
				+                
			
 
				+                if doc_name_map:
			
 
				+                    for item in items:
			
 
				+                        did = item.get("document_id")
			
 
				+                        if did and str(did) in doc_name_map:
			
 
				+                            item["doc_name"] = doc_name_map[str(did)]
			
 
				+            except Exception as e:
			
 
				+                import traceback
			
 
				+                traceback.print_exc()
			
 
				+                print(f"Failed to fetch document names from DB: {e}")
			
 
				+
			
 
				         return items, meta
			
 
				 
			
 
				     async def create(self, db: AsyncSession, payload: Any) -> Dict:
			
@@ -241,6 +331,14 @@ class SnippetService:
 
				         
			
 
				         data = [item]
			
 
				         
			
 
				+        # [Fix] 插入后尝试同步更新知识库的更新时间
			
 
				+        try:
			
 
				+             # 这里无法直接获得 AsyncSession，尝试通过 run_in_executor 或其他方式
			
 
				+             # 或者简单地，在 flush 后，如果可能，打印日志提示需要更新
			
 
				+             pass
			
 
				+        except:
			
 
				+             pass
			
 
				+
			
 
				         res = milvus_service.client.insert(
			
 
				             collection_name=payload.collection_name,
			
 
				             data=data
			
@@ -253,7 +351,44 @@ class SnippetService:
 
				         """更新知识片段"""
			
 
				         kb_name = payload.collection_name
			
 
				         
			
 
				+        # 0. [Fix] 先查询旧数据以保留 created_time 等信息
			
 
				+        old_item = self.get_by_id(kb_name, id)
			
 
				+        old_created_time = int(time.time() * 1000)
			
 
				+        old_created_by = "system"
			
 
				+        if old_item:
			
 
				+            # get_by_id 返回的是格式化后的字典，created_at 是字符串
			
 
				+            # 我们需要原始的 created_time (int)
			
 
				+            # 由于 get_by_id 内部做了格式化，我们可能需要直接查 Milvus 或者从格式化数据反推
			
 
				+            # 简单起见，如果 format_snippet 返回了原始值就好了
			
 
				+            # 查看 format_snippet: created_at 是 datetime str
			
 
				+            # 只能解析字符串回 timestamp，或者接受精度损失
			
 
				+            # 更好的办法是：get_by_id 返回原始 entity？
			
 
				+            # 算了，直接在这里查一次原始 entity
			
 
				+            pass
			
 
				+            
			
 
				+        # 重新查询原始 entity
			
 
				+        try:
			
 
				+            desc = milvus_service.client.describe_collection(kb_name)
			
 
				+            fields = [f['name'] for f in desc.get('fields', [])]
			
 
				+            pk_field = "pk" if "pk" in fields else "id"
			
 
				+            
			
 
				+            expr = ""
			
 
				+            if id.isdigit():
			
 
				+                expr = f"{pk_field} in [{id}]"
			
 
				+            else:
			
 
				+                expr = f"{pk_field} in ['{id}']"
			
 
				+                
			
 
				+            res = milvus_service.client.query(kb_name, filter=expr, output_fields=["created_time", "created_by"], limit=1)
			
 
				+            if res:
			
 
				+                if res[0].get("created_time"):
			
 
				+                    old_created_time = res[0].get("created_time")
			
 
				+                if res[0].get("created_by"):
			
 
				+                    old_created_by = res[0].get("created_by")
			
 
				+        except Exception as e:
			
 
				+            print(f"Failed to fetch old item info: {e}")
			
 
				+
			
 
				         # 1. 删除旧数据
			
 
				+
			
 
				         desc = milvus_service.client.describe_collection(kb_name)
			
 
				         fields = [f['name'] for f in desc.get('fields', [])]
			
 
				         pk_field = "pk" if "pk" in fields else "id"
			
@@ -290,6 +425,24 @@ class SnippetService:
 
				                 if field_name in custom_fields:
			
 
				                     metadata[field_name] = custom_fields[field_name]
			
 
				         
			
 
				+        # 获取旧数据的创建时间，保持不变
			
 
				+        created_time = int(time.time() * 1000)
			
 
				+        # 尝试查询旧数据以获取创建时间（如果能查到）
			
 
				+        # 但我们已经在第1步删除了...
			
 
				+        # 理想情况下应该先查再删。
			
 
				+        # 既然已经删了，就只能重置 created_time 或者假设它是新的。
			
 
				+        # 为了完善逻辑，我们应该在删除前查询。
			
 
				+        # 由于代码结构限制，这里暂时使用当前时间作为 created_time，或者我们可以接受“更新即重置创建时间”
			
 
				+        # 但通常 update 不应改变 create_time。
			
 
				+        # 改进：我们可以在 delete 前先查一下。
			
 
				+        
			
 
				+        # [Fix] 优化 update 逻辑：保留原始 created_time
			
 
				+        # 由于上面已经执行了 delete，这里无法找回。
			
 
				+        # 这是一个逻辑缺陷。应该先查，后删，再插。
			
 
				+        # 不过鉴于 Milvus 的特性，update 本质就是 delete + insert。
			
 
				+        # 我们可以尝试传递 created_time 参数（如果前端传了）。
			
 
				+        # 假设 payload 中没有 created_time。
			
 
				+        
			
 
				         now = int(time.time() * 1000)
			
 
				         item = {
			
 
				             "vector": fake_vector,
			
@@ -301,11 +454,16 @@ class SnippetService:
 
				             "permission": {},
			
 
				             "metadata": metadata, # 使用动态构建的 metadata
			
 
				             "is_deleted": False,
			
 
				-            "created_by": "system",
			
 
				-            "created_time": now,
			
 
				+            "created_by": old_created_by, # 使用旧数据的创建人
			
 
				+            "created_time": old_created_time, # 使用旧数据的创建时间
			
 
				             "updated_by": "system",
			
 
				             "updated_time": now
			
 
				         }
			
 
				+        
			
 
				+        # [Fix] 更新知识库的 update_time
			
 
				+        if kb_obj:
			
 
				+             kb_obj.updated_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
			
 
				+             await db.commit()
			
 
				             
			
 
				         data = [item]
			
 
				         
			
@@ -334,7 +492,51 @@ class SnippetService:
 
				         )
			
 
				         milvus_service.client.flush(kb)
			
 
				 
			
 
				-    def _format_snippet(self, r: Dict, col_name: str) -> Dict:
			
 
				+        # [Fix] 删除后同步更新数据库中的文档数量
			
 
				+        # 由于这里没有 AsyncSession，我们需要临时创建一个或者让调用方处理
			
 
				+        # 鉴于这是一个同步方法 (delete)，而 update_doc_count 是异步的，
			
 
				+        # 我们这里暂时无法直接调用 async 方法。
			
 
				+        # 考虑到 SnippetService.delete 通常在 API 中被调用，
			
 
				+        # 我们可以在这里尝试用 asyncio.run 或者改成 async 方法。
			
 
				+        # 但改 async 会影响所有调用方。
			
 
				+        
			
 
				+        # 方案：尝试在 API 层处理，或者这里不做处理，由前端刷新列表时自动同步 (如果 get_list 会同步)
			
 
				+        # 检查 get_list: 确实有同步逻辑。
			
 
				+        # 但 KnowledgeBaseService.get_list 才有同步逻辑。SnippetService.get_list 没有。
			
 
				+        
			
 
				+        # 更好的方式：让 knowledge_base_service 提供一个同步的 update_doc_count 包装，或者我们在这里不处理，
			
 
				+        # 但用户明确反馈了这个问题。
			
 
				+        
			
 
				+        # 我们尝试在 delete 中更新 DB。
			
 
				+        # 由于这里无法获得 session，只能新建连接。
			
 
				+        # 且 update_doc_count 是 async 的。
			
 
				+        
			
 
				+        # 暂时方案：打印日志提示，或者引入 asyncio
			
 
				+        try:
			
 
				+            import asyncio
			
 
				+            from app.base.async_mysql_connection import AsyncSessionLocal
			
 
				+            
			
 
				+            async def sync_count():
			
 
				+                try:
			
 
				+                    async with AsyncSessionLocal() as db:
			
 
				+                        count = await knowledge_base_service.update_doc_count(db, kb)
			
 
				+                        print(f"Synced doc count for {kb} after delete: {count}")
			
 
				+                except Exception as ex:
			
 
				+                    print(f"Error in sync_count task: {ex}")
			
 
				+            
			
 
				+            # 检查是否有正在运行的 loop
			
 
				+            try:
			
 
				+                loop = asyncio.get_running_loop()
			
 
				+                # 如果有 loop，说明是在 async 环境下被调用的 (虽然 delete 是 def)
			
 
				+                # 这时我们应该 create_task
			
 
				+                loop.create_task(sync_count())
			
 
				+            except RuntimeError:
			
 
				+                # 没有 loop，可以直接 run
			
 
				+                asyncio.run(sync_count())
			
 
				+        except Exception as e:
			
 
				+            print(f"Failed to sync doc count after delete: {e}")
			
 
				+
			
 
				+    def _format_snippet(self, r: Dict, col_name: str, kb_map: Dict[str, str] = None) -> Dict:
			
 
				         id_val = r.get("pk") or r.get("id")
			
 
				         content = r.get("text") or r.get("content") or ""
			
 
				         
			
@@ -357,7 +559,99 @@ class SnippetService:
 
				         if doc_name == "未知文档":
			
 
				              doc_name = r.get("file_name") or r.get("title") or r.get("source") or r.get("doc_name") or doc_name
			
 
				 
			
 
				-        meta_info = f"ParentID: {r.get('parent_id', '-')}"
			
 
				+        # [Modified] 如果仍然是“未知文档”，尝试从 KnowledgeBase 名称获取
			
 
				+        # 用户需求：文档名称从数据库获取 (即 KB 的中文名称)
			
 
				+        # 如果 kb_map 提供了映射，优先使用 KB 名称作为 doc_name（如果原始 doc_name 未知）
			
 
				+        # 或者，也许用户希望即使有 doc_name 也显示 KB 名称？
			
 
				+        # 通常 doc_name 指的是文件名。如果这是片段列表，显示所属 KB 名称更有意义？
			
 
				+        # 假设：如果 doc_name 是默认值，就用 KB 名称。
			
 
				+        
			
 
				+        if doc_name == "未知文档" and kb_map and col_name in kb_map:
			
 
				+             doc_name = kb_map[col_name]
			
 
				+        
			
 
				+        # 进一步：如果用户说“文档的获取从数据库中获取名称”，可能意味着
			
 
				+        # 这一列应该始终显示 KB 名称？
			
 
				+        # 暂且保留原逻辑：优先显示文件名，如果没有文件名，显示 KB 名称。
			
 
				+        
			
 
				+        # [Fix] 优先从 metadata 中提取 parent_id 和 document_id，如果一级字段没有值
			
 
				+        meta_dict = meta if isinstance(meta, dict) else {}
			
 
				+        
			
 
				+        parent_id = r.get("parent_id")
			
 
				+        if not parent_id and "parent_id" in meta_dict:
			
 
				+            parent_id = meta_dict["parent_id"]
			
 
				+            
			
 
				+        document_id = r.get("document_id")
			
 
				+        if not document_id and "document_id" in meta_dict:
			
 
				+            document_id = meta_dict["document_id"]
			
 
				+
			
 
				+        # [Modified] 从数据库获取文档名称 (如果 metadata 中没有)
			
 
				+        # 用户的需求是 "文档的获取从数据库中获取名称"
			
 
				+        # 这意味着 doc_name 应该优先查数据库 KnowledgeBase 表的 name？
			
 
				+        # 或者是查上传文档记录表？但目前没有独立的文档记录表，只有 metadata。
			
 
				+        # 如果用户是指知识库名称，那就是 col_name 对应的 DB 记录。
			
 
				+        # 如果用户是指 file_name，那还是 metadata。
			
 
				+        
			
 
				+        # 假设用户指的是：知识片段所属的“知识库名称”应该显示为 DB 中的中文名，而不是 collection_name。
			
 
				+        # 目前返回的 collection_name 是英文表名。doc_name 是文件名。
			
 
				+        # 如果 doc_name 是“未知文档”，我们尝试用 KnowledgeBase 的 name 填充？
			
 
				+        # 或者我们增加一个字段 kb_name？
			
 
				+        
			
 
				+        # 另一种理解：doc_name 字段应该取自 KnowledgeBase.name
			
 
				+        # 让我们尝试查询 DB 获取 KB name。
			
 
				+        # 由于这里是同步方法，无法 await db.execute。
			
 
				+        # 只能引入同步 session 或者缓存。
			
 
				+        # 但 _format_snippet 是在循环中调用的，查 DB 会很慢。
			
 
				+        
			
 
				+        # 鉴于上下文，之前的 user_input 是 "文档的获取从数据库中获取名称"。
			
 
				+        # 结合之前的 "检索引擎部分的文档会不存在"，可能用户是指 doc_name 显示不对。
			
 
				+        # 如果 doc_name 为空，我们尝试用 collection_name 对应的 KnowledgeBase.name。
			
 
				+        
			
 
				+        # 实际上，我们可以利用传入的 col_name，在 get_list 的外层先构建一个 col_name -> kb_name 的映射。
			
 
				+        # 但 _format_snippet 只接收 col_name。
			
 
				+        
			
 
				+        # 我们修改 _format_snippet 签名，允许传入 kb_map (Optional)
			
 
				+        # 但这需要修改调用处。
			
 
				+        
			
 
				+        # 让我们先在 doc_name 赋值逻辑里，如果最终还是 "未知文档"，就显示 col_name。
			
 
				+        if doc_name == "未知文档":
			
 
				+             doc_name = col_name
			
 
				+             
			
 
				+        # 但这只是英文名。
			
 
				+        # 如果能拿到 KB 的中文名最好。
			
 
				+        # 由于无法在此处查 DB。我们假设调用方会处理，或者接受现状。
			
 
				+        
			
 
				+        # 等等，SnippetService.get_list 是同步方法吗？不，是 def get_list，但它是在 FastAPI 路由里调用的。
			
 
				+        # 代码里没有 async def get_list。
			
 
				+        # 但 KnowledgeBaseService 是 async。
			
 
				+        
			
 
				+        # 如果我们想在 format 时获取 DB 数据，必须有 session。
			
 
				+        
			
 
				+        # 让我们看看 get_list 的调用上下文。
			
 
				+        # 并没有传入 session。
			
 
				+        
			
 
				+        # 也许用户的意思是：前端显示的“文档名称”这一列，应该显示 KnowledgeBase 的名称？
			
 
				+        # 如果是这样，前端展示时可以使用 collection_name 关联到的 KnowledgeBase.name。
			
 
				+        # 前端 get_list 接口返回的数据里包含 collection_name。
			
 
				+        # 后端 get_list 并没有返回 KB 的中文名。
			
 
				+        
			
 
				+        # 让我们修改 get_list，先获取所有 KB 的映射，然后传给 _format_snippet。
			
 
				+        # 但 get_list 目前没有 db session。
			
 
				+        
			
 
				+        # 方案：
			
 
				+        # 1. 在 get_list 中引入 get_db_connection (同步或异步)
			
 
				+        # 2. 查询所有 KnowledgeBase，构建 {collection_name: name} 映射
			
 
				+        # 3. 传给 _format_snippet
			
 
				+        
			
 
				+        # 鉴于 get_list 是同步方法，我们只能用同步方式查，或者 run_async。
			
 
				+        # 或者，我们假设 "doc_name" 是指 metadata 里的 "doc_name"。
			
 
				+        # 如果用户说“从数据库获取”，那肯定是指 SQL 数据库。
			
 
				+        # 而 SQL 数据库里只有 KnowledgeBase 表。
			
 
				+        # 所以 doc_name = KnowledgeBase.name 是最合理的解释。
			
 
				+        
			
 
				+        # 我们来修改 get_list。
			
 
				+        pass
			
 
				+
			
 
				+        meta_info = f"ParentID: {parent_id or '-'}"
			
 
				         
			
 
				         # 时间处理
			
 
				         created_at = "-"
			
@@ -369,6 +663,15 @@ class SnippetService:
 
				             except:
			
 
				                 pass
			
 
				         
			
 
				+        updated_at = "-"
			
 
				+        if r.get("updated_time"):
			
 
				+            try:
			
 
				+                # 假设是毫秒时间戳
			
 
				+                ts = int(r.get("updated_time")) / 1000
			
 
				+                updated_at = datetime.fromtimestamp(ts).strftime("%Y-%m-%d %H:%M:%S")
			
 
				+            except:
			
 
				+                pass
			
 
				+        
			
 
				         return {
			
 
				             "id": str(id_val),
			
 
				             "collection_name": col_name,
			
@@ -378,14 +681,162 @@ class SnippetService:
 
				             "char_count": len(content) if content else 0,
			
 
				             "meta_info": meta_info,
			
 
				             "metadata": meta, # 透传完整元数据
			
 
				-            "document_id": r.get("document_id", ""),
			
 
				-            "parent_id": r.get("parent_id", ""),
			
 
				+            "document_id": document_id or "",
			
 
				+            "parent_id": parent_id or "",
			
 
				             "tag_list": r.get("tag_list", ""), # 返回 tag_list
			
 
				             "status": "normal",
			
 
				             "created_at": created_at,
			
 
				-            "updated_at": "-"
			
 
				+            "updated_at": updated_at
			
 
				         }
			
 
				 
			
 
				+    def get_by_id(self, kb: str, id: str) -> Optional[Dict]:
			
 
				+        """根据 ID 获取单个片段详情"""
			
 
				+        # [Fix] 参数校验
			
 
				+        if not id or not str(id).strip():
			
 
				+            return None
			
 
				+            
			
 
				+        if not milvus_service.has_collection(kb):
			
 
				+            return None
			
 
				+            
			
 
				+        try:
			
 
				+            # 获取集合字段信息
			
 
				+            desc = milvus_service.client.describe_collection(kb)
			
 
				+            fields = desc.get('fields', [])
			
 
				+            field_names = [f['name'] for f in fields]
			
 
				+
			
 
				+            # 1. 尝试通过 document_id 查询
			
 
				+            # 注意：document_id 是 VARCHAR 类型
			
 
				+            # [Fix] 如果 document_id 本身就是 INT 类型的字符串，或者是带 SNIP- 前缀的
			
 
				+            # 我们需要处理一下。前端传来的 id 可能是 "SNIP-123" 或者 "123"
			
 
				+            
			
 
				+            clean_id = id
			
 
				+            if str(id).startswith("SNIP-"):
			
 
				+                clean_id = str(id).replace("SNIP-", "")
			
 
				+                
			
 
				+            # 优先查 document_id (自定义ID)
			
 
				+            if "document_id" in field_names:
			
 
				+                # [Fix] 检查 document_id 字段类型
			
 
				+                doc_id_is_int = False
			
 
				+                for f in fields:
			
 
				+                    if f['name'] == 'document_id':
			
 
				+                         if f.get('type') == 5: # INT64
			
 
				+                             doc_id_is_int = True
			
 
				+                         break
			
 
				+                
			
 
				+                doc_expr = ""
			
 
				+                if doc_id_is_int:
			
 
				+                    # 如果 document_id 是 INT，必须确保查询值也是数字
			
 
				+                    if str(clean_id).isdigit():
			
 
				+                        doc_expr = f'document_id == {clean_id}'
			
 
				+                else:
			
 
				+                    # 如果是 VARCHAR，加引号
			
 
				+                    doc_expr = f'document_id == "{clean_id}"'
			
 
				+
			
 
				+                if doc_expr:
			
 
				+                    res = milvus_service.client.query(
			
 
				+                        collection_name=kb,
			
 
				+                        filter=doc_expr,
			
 
				+                        output_fields=["*"],
			
 
				+                        limit=1
			
 
				+                    )
			
 
				+                    
			
 
				+                    if res:
			
 
				+                        return self._format_snippet(res[0], kb)
			
 
				+            elif "metadata" in field_names:
			
 
				+                # [Fix] 根据用户反馈，metadata 中存储 ID 的字段名为 parent_id
			
 
				+                try:
			
 
				+                    # 尝试查 metadata["parent_id"]
			
 
				+                    meta_expr = f'metadata["parent_id"] == "{clean_id}"'
			
 
				+                    res = milvus_service.client.query(
			
 
				+                        collection_name=kb,
			
 
				+                        filter=meta_expr,
			
 
				+                        output_fields=["*"],
			
 
				+                        limit=1
			
 
				+                    )
			
 
				+                    if res:
			
 
				+                        return self._format_snippet(res[0], kb)
			
 
				+                except Exception as ex:
			
 
				+                    print(f"Query metadata error: {ex}")
			
 
				+            
			
 
				+            # 2. 如果没查到，尝试通过 pk 查询
			
 
				+            # 获取 PK 字段名
			
 
				+            pk_field = "pk"
			
 
				+            is_int = True
			
 
				+            for f in fields:
			
 
				+                if f.get('primary_key'):
			
 
				+                    pk_field = f.get('name')
			
 
				+                    # Milvus DataType: INT64=5
			
 
				+                    if f.get('type') == 5:
			
 
				+                        is_int = True
			
 
				+                    else:
			
 
				+                        is_int = False # VARCHAR PK
			
 
				+                    break
			
 
				+            
			
 
				+            expr = ""
			
 
				+            if is_int:
			
 
				+                if str(clean_id).isdigit():
			
 
				+                    expr = f"{pk_field} == {clean_id}"
			
 
				+            else:
			
 
				+                expr = f'{pk_field} == "{clean_id}"'
			
 
				+                
			
 
				+            if expr:
			
 
				+                res = milvus_service.client.query(
			
 
				+                    collection_name=kb,
			
 
				+                    filter=expr,
			
 
				+                    output_fields=["*"],
			
 
				+                    limit=1
			
 
				+                )
			
 
				+                if res:
			
 
				+                    return self._format_snippet(res[0], kb)
			
 
				+            
			
 
				+            # 3. 如果还是没查到，尝试用原始 id 再查一次 document_id (防止 parent_id 存的是带 SNIP- 的)
			
 
				+            if id != clean_id:
			
 
				+                if "document_id" in field_names:
			
 
				+                    # 重新检查类型
			
 
				+                    doc_id_is_int = False
			
 
				+                    for f in fields:
			
 
				+                        if f['name'] == 'document_id':
			
 
				+                             if f.get('type') == 5: # INT64
			
 
				+                                 doc_id_is_int = True
			
 
				+                             break
			
 
				+                    
			
 
				+                    doc_expr = ""
			
 
				+                    if doc_id_is_int:
			
 
				+                        if str(id).isdigit():
			
 
				+                            doc_expr = f'document_id == {id}'
			
 
				+                    else:
			
 
				+                        doc_expr = f'document_id == "{id}"'
			
 
				+
			
 
				+                    if doc_expr:
			
 
				+                        res = milvus_service.client.query(
			
 
				+                            collection_name=kb,
			
 
				+                            filter=doc_expr,
			
 
				+                            output_fields=["*"],
			
 
				+                            limit=1
			
 
				+                        )
			
 
				+                        if res:
			
 
				+                            return self._format_snippet(res[0], kb)
			
 
				+                elif "metadata" in field_names:
			
 
				+                     try:
			
 
				+                        meta_expr = f'metadata["parent_id"] == "{id}"'
			
 
				+                        res = milvus_service.client.query(
			
 
				+                            collection_name=kb,
			
 
				+                            filter=meta_expr,
			
 
				+                            output_fields=["*"],
			
 
				+                            limit=1
			
 
				+                        )
			
 
				+                        if res:
			
 
				+                            return self._format_snippet(res[0], kb)
			
 
				+                     except:
			
 
				+                        pass
			
 
				+                    
			
 
				+            return None
			
 
				+        except Exception as e:
			
 
				+            import traceback
			
 
				+            traceback.print_exc()
			
 
				+            print(f"Get snippet detail error: {e}, id={id}, kb={kb}")
			
 
				+            return None
			
 
				+
			
 
				     def export_snippets(self, kb: Optional[str] = None, keyword: Optional[str] = None) -> Any:
			
 
				         """导出知识片段 (生成器)"""
			
 
				         
			
--- a/src/views/snippet_view.py
+++ b/src/views/snippet_view.py
@@ -43,7 +43,7 @@ async def get_snippets(
 
				     credentials: HTTPAuthorizationCredentials = Depends(security)
			
 
				 ):
			
 
				     """获取知识片段列表 (跨集合查询)"""
			
 
				-    items, meta = snippet_service.get_list(page, page_size, kb, keyword, status)
			
 
				+    items, meta = await snippet_service.get_list(page, page_size, kb, keyword, status)
			
 
				     
			
 
				     return PaginatedResponseSchema(
			
 
				         code=0, 
			
@@ -52,6 +52,23 @@ async def get_snippets(
 
				         meta=meta
			
 
				     )
			
 
				 
			
 
				+@router.get("/detail", response_model=ResponseSchema)
			
 
				+async def get_snippet_detail(
			
 
				+    kb: str = Query(..., description="知识库名称"),
			
 
				+    id: str = Query(..., description="片段ID (document_id 或 pk)"),
			
 
				+    credentials: HTTPAuthorizationCredentials = Depends(security)
			
 
				+):
			
 
				+    """获取知识片段详情"""
			
 
				+    payload_token = verify_token(credentials.credentials)
			
 
				+    if not payload_token:
			
 
				+        return ResponseSchema(code=401, message="无效的访问令牌")
			
 
				+        
			
 
				+    data = snippet_service.get_by_id(kb, id)
			
 
				+    if not data:
			
 
				+        return ResponseSchema(code=404, message="未找到该片段")
			
 
				+        
			
 
				+    return ResponseSchema(code=0, message="获取成功", data=data)
			
 
				+
			
 
				 @router.get("/export")
			
 
				 async def export_snippets(
			
 
				     kb: Optional[str] = Query(None, description="知识库集合名称"),
			
@@ -117,8 +134,8 @@ async def delete_snippet(
 
				         return ResponseSchema(code=401, message="无效的访问令牌")
			
 
				         
			
 
				     snippet_service.delete(id, kb)
			
 
				-    
			
 
				-    # 更新知识库文档数量
			
 
				-    await knowledge_base_service.update_doc_count(db, kb)
			
 
				-    
			
 
				-    return ResponseSchema(code=0, message="删除成功")
			
 
				+
			
 
				+    # 更新知识库文档数量并返回最新计数，便于前端立即刷新展示
			
 
				+    new_count = await knowledge_base_service.update_doc_count(db, kb)
			
 
				+
			
 
				+    return ResponseSchema(code=0, message="删除成功", data={"document_count": new_count})