2 月之前 · 0505c3a948
--- a/src/app/sample/models/custom_schema.py
+++ b/src/app/sample/models/custom_schema.py
@@ -0,0 +1,25 @@
 
				+"""
			
 
				+知识库自定义Schema定义模型
			
 
				+"""
			
 
				+from sqlalchemy import Column, String, Integer, Boolean, Text, DateTime, func
			
 
				+from sqlalchemy.dialects.mysql import CHAR, TINYINT
			
 
				+from app.base.async_mysql_connection import Base
			
 
				+import uuid
			
 
				+
			
 
				+class CustomSchema(Base):
			
 
				+    """知识库自定义Schema表"""
			
 
				+    __tablename__ = "t_samp_custom_schema"
			
 
				+
			
 
				+    id = Column(CHAR(36), primary_key=True, default=lambda: str(uuid.uuid4()), comment="主键ID")
			
 
				+    knowledge_base_id = Column(String(36), nullable=False, comment="知识库ID")
			
 
				+    field_name = Column(String(255), nullable=False, comment="字段名称(英文)")
			
 
				+    field_type = Column(String(50), nullable=False, comment="字段类型")
			
 
				+    max_length = Column(Integer, nullable=True, comment="最大长度")
			
 
				+    is_primary = Column(Boolean, default=False, comment="是否主键")
			
 
				+    description = Column(String(1000), nullable=True, comment="描述")
			
 
				+    
			
 
				+    created_time = Column(DateTime, default=func.now(), comment="创建时间")
			
 
				+    updated_time = Column(DateTime, default=func.now(), onupdate=func.now(), comment="修改时间")
			
 
				+
			
 
				+    def __repr__(self):
			
 
				+        return f"<CustomSchema kb_id={self.knowledge_base_id} field={self.field_name}>"
			
--- a/src/app/sample/models/metadata.py
+++ b/src/app/sample/models/metadata.py
@@ -0,0 +1,28 @@
 
				+"""
			
 
				+知识库元数据定义模型
			
 
				+"""
			
 
				+from sqlalchemy import Column, String, Text, DateTime, func
			
 
				+from sqlalchemy.dialects.mysql import CHAR, TINYINT
			
 
				+from app.base.async_mysql_connection import Base
			
 
				+import uuid
			
 
				+
			
 
				+class SampleMetadata(Base):
			
 
				+    """知识库元数据定义表"""
			
 
				+    __tablename__ = "t_samp_metadata"
			
 
				+
			
 
				+    id = Column(CHAR(36), primary_key=True, default=lambda: str(uuid.uuid4()), comment="主键ID")
			
 
				+    knowledge_base_id = Column(String(36), nullable=False, comment="知识库ID")
			
 
				+    field_zh_name = Column(String(255), nullable=False, comment="字段名称(中文)")
			
 
				+    field_en_name = Column(String(500), nullable=False, comment="字段英文名称")
			
 
				+    field_type = Column(String(10), nullable=False, comment="字段类型: text(文本), num(数字)")
			
 
				+    remark = Column(String(1000), nullable=True, comment="备注")
			
 
				+    
			
 
				+    def to_dict(self) -> dict:
			
 
				+        """转换为字典"""
			
 
				+        return {
			
 
				+            column.name: getattr(self, column.name)
			
 
				+            for column in self.__table__.columns
			
 
				+        }
			
 
				+
			
 
				+    def __repr__(self):
			
 
				+        return f"<SampleMetadata kb_id={self.knowledge_base_id} field={self.field_en_name}>"
			
--- a/src/app/sample/schemas/knowledge_base.py
+++ b/src/app/sample/schemas/knowledge_base.py
@@ -1,16 +1,33 @@
 
				-from typing import Optional
			
 
				+from typing import Optional, List
			
 
				 from pydantic import BaseModel, Field
			
 
				 from app.schemas.base import BaseModelSchema
			
 
				 
			
 
				+class MetadataField(BaseModel):
			
 
				+    """元数据字段定义"""
			
 
				+    field_zh_name: str = Field(..., description="中文名称")
			
 
				+    field_en_name: str = Field(..., description="英文名称")
			
 
				+    field_type: str = Field(..., description="字段类型: text/num")
			
 
				+    remark: Optional[str] = Field(None, description="备注")
			
 
				+
			
 
				 class KnowledgeBaseBase(BaseModel):
			
 
				     name: str = Field(..., description="知识库名称")
			
 
				     collection_name: str = Field(..., description="Milvus集合名称")
			
 
				     description: Optional[str] = Field(None, description="描述")
			
 
				     status: Optional[str] = Field("normal", description="状态")
			
 
				 
			
 
				+class CustomSchemaField(BaseModel):
			
 
				+    """自定义Schema字段定义"""
			
 
				+    field_name: str = Field(..., description="字段名称(英文)")
			
 
				+    field_type: str = Field(..., description="字段类型: BOOL/INT8/INT16/INT32/INT64/FLOAT/DOUBLE/VARCHAR/JSON")
			
 
				+    max_length: Optional[int] = Field(None, description="最大长度(VARCHAR需要)")
			
 
				+    is_primary: bool = Field(False, description="是否主键(通常不需要用户指定)")
			
 
				+    description: Optional[str] = Field(None, description="描述")
			
 
				+
			
 
				 class KnowledgeBaseCreate(KnowledgeBaseBase):
			
 
				     """创建知识库请求参数"""
			
 
				     dimension: int = Field(768, description="向量维度，默认768")
			
 
				+    metadata_fields: Optional[List[MetadataField]] = Field(None, description="元数据字段列表")
			
 
				+    custom_schemas: Optional[List[CustomSchemaField]] = Field(None, description="自定义Schema字段列表")
			
 
				 
			
 
				 class KnowledgeBaseUpdate(BaseModel):
			
 
				     """更新知识库请求参数"""
			
--- a/src/app/sample/schemas/search_engine.py
+++ b/src/app/sample/schemas/search_engine.py
@@ -44,14 +44,22 @@ class SearchEngineResponse(BaseModelSchema):
 
				 
			
 
				 # --- 新增：知识库搜索相关模型 ---
			
 
				 
			
 
				+class FilterCondition(BaseModel):
			
 
				+    field: str
			
 
				+    value: str
			
 
				+
			
 
				 class KBSearchRequest(BaseModel):
			
 
				     """知识库搜索请求"""
			
 
				     kb_id: str = Field(..., description="知识库ID或集合名称")
			
 
				     query: str = Field(..., description="检索关键字")
			
 
				-    metadata_field: Optional[str] = Field(None, description="元数据字典字段")
			
 
				-    metadata_value: Optional[str] = Field(None, description="元数据字典值")
			
 
				+    metadata_field: Optional[str] = Field(None, description="元数据字典字段(兼容旧版)")
			
 
				+    metadata_value: Optional[str] = Field(None, description="元数据字典值(兼容旧版)")
			
 
				+    filters: Optional[List[FilterCondition]] = Field(None, description="多重过滤条件")
			
 
				     top_k: int = Field(10, description="返回结果数量")
			
 
				     score_threshold: float = Field(0.0, description="相似度阈值")
			
 
				+    metric_type: Optional[str] = Field(None, description="相似度计算方式")
			
 
				+    page: int = Field(1, description="页码")
			
 
				+    page_size: int = Field(10, description="每页数量")
			
 
				 
			
 
				 class KBSearchResultItem(BaseModel):
			
 
				     """单条搜索结果"""
			
--- a/src/app/services/knowledge_base_service.py
+++ b/src/app/services/knowledge_base_service.py
@@ -4,11 +4,13 @@
 
				 from math import ceil
			
 
				 from typing import List, Optional, Tuple, Dict, Any
			
 
				 from sqlalchemy.ext.asyncio import AsyncSession
			
 
				-from sqlalchemy import select, func, or_
			
 
				+from sqlalchemy import select, func, or_, delete as sql_delete
			
 
				 from datetime import datetime
			
 
				 import uuid
			
 
				 
			
 
				 from app.sample.models.knowledge_base import KnowledgeBase
			
 
				+from app.sample.models.metadata import SampleMetadata
			
 
				+from app.sample.models.custom_schema import CustomSchema
			
 
				 from app.sample.schemas.knowledge_base import (
			
 
				     KnowledgeBaseCreate, 
			
 
				     KnowledgeBaseUpdate,
			
@@ -120,17 +122,13 @@ class KnowledgeBaseService:
 
				         if exists.scalars().first():
			
 
				             raise ValueError("知识库集合名称已存在")
			
 
				 
			
 
				-        # 2. 检查 Milvus 是否已存在
			
 
				-        if milvus_service.has_collection(payload.collection_name):
			
 
				-            raise ValueError("Milvus集合已存在，请使用其他名称")
			
 
				+        # 2. 检查 Milvus 是否已存在 (如果之前残留)
			
 
				+        # if milvus_service.has_collection(payload.collection_name):
			
 
				+        #     raise ValueError("Milvus集合已存在，请使用其他名称")
			
 
				 
			
 
				         try:
			
 
				-            # 3. 创建 Milvus 集合
			
 
				-            milvus_service.create_collection(
			
 
				-                name=payload.collection_name,
			
 
				-                dimension=payload.dimension,
			
 
				-                description=payload.description or ""
			
 
				-            )
			
 
				+            # 3. 创建 Milvus 集合 (延迟到点击同步按钮时创建)
			
 
				+            # milvus_service.create_collection(...)
			
 
				 
			
 
				             # 4. 创建 DB 记录
			
 
				             now = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
			
@@ -144,6 +142,36 @@ class KnowledgeBaseService:
 
				                 updated_time=now
			
 
				             )
			
 
				             db.add(new_kb)
			
 
				+            
			
 
				+            # 5. 保存元数据定义 (如果有)
			
 
				+            if payload.metadata_fields:
			
 
				+                for field in payload.metadata_fields:
			
 
				+                    new_metadata = SampleMetadata(
			
 
				+                        id=str(uuid.uuid4()),
			
 
				+                        knowledge_base_id=new_kb.id,
			
 
				+                        field_zh_name=field.field_zh_name,
			
 
				+                        field_en_name=field.field_en_name,
			
 
				+                        field_type=field.field_type,
			
 
				+                        remark=field.remark
			
 
				+                    )
			
 
				+                    db.add(new_metadata)
			
 
				+            
			
 
				+            # 6. 保存自定义Schema定义 (如果有)
			
 
				+            if payload.custom_schemas:
			
 
				+                for schema_field in payload.custom_schemas:
			
 
				+                    new_schema = CustomSchema(
			
 
				+                        id=str(uuid.uuid4()),
			
 
				+                        knowledge_base_id=new_kb.id,
			
 
				+                        field_name=schema_field.field_name,
			
 
				+                        field_type=schema_field.field_type,
			
 
				+                        max_length=schema_field.max_length,
			
 
				+                        is_primary=schema_field.is_primary,
			
 
				+                        description=schema_field.description,
			
 
				+                        created_time=now,
			
 
				+                        updated_time=now
			
 
				+                    )
			
 
				+                    db.add(new_schema)
			
 
				+
			
 
				             await db.commit()
			
 
				             await db.refresh(new_kb)
			
 
				 
			
@@ -214,14 +242,127 @@ class KnowledgeBaseService:
 
				 
			
 
				         try:
			
 
				             # 1. 删除 Milvus 集合 (强制删除)
			
 
				-            milvus_service.drop_collection(kb.collection_name)
			
 
				+            try:
			
 
				+                if milvus_service.has_collection(kb.collection_name):
			
 
				+                    milvus_service.drop_collection(kb.collection_name)
			
 
				+            except Exception as milvus_err:
			
 
				+                # 如果是命名不规范等导致的错误，忽略它，继续删除数据库记录
			
 
				+                print(f"Ignore Milvus error during delete: {milvus_err}")
			
 
				             
			
 
				             # 2. 软删除 DB 记录
			
 
				             kb.is_deleted = 1
			
 
				             kb.created_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
			
 
				+            
			
 
				+            # 3. 删除关联的元数据 (硬删除)
			
 
				+            await db.execute(sql_delete(SampleMetadata).where(SampleMetadata.knowledge_base_id == id))
			
 
				+            
			
 
				+            # 4. 删除关联的自定义Schema (硬删除)
			
 
				+            await db.execute(sql_delete(CustomSchema).where(CustomSchema.knowledge_base_id == id))
			
 
				+
			
 
				             await db.commit()
			
 
				         except Exception as e:
			
 
				             await db.rollback()
			
 
				             raise e
			
 
				 
			
 
				+    async def sync_to_milvus(self, db: AsyncSession, id: str) -> KnowledgeBase:
			
 
				+        """同步知识库到Milvus"""
			
 
				+        result = await db.execute(select(KnowledgeBase).where(KnowledgeBase.id == id, KnowledgeBase.is_deleted == 0))
			
 
				+        kb = result.scalars().first()
			
 
				+        
			
 
				+        if not kb:
			
 
				+            raise ValueError("知识库不存在")
			
 
				+            
			
 
				+        if milvus_service.has_collection(kb.collection_name):
			
 
				+            raise ValueError("Milvus集合已存在")
			
 
				+            
			
 
				+        # 查询自定义Schema
			
 
				+        schema_query = select(CustomSchema).where(CustomSchema.knowledge_base_id == id)
			
 
				+        schema_result = await db.execute(schema_query)
			
 
				+        custom_schemas = schema_result.scalars().all()
			
 
				+        
			
 
				+        fields = []
			
 
				+        # 1. 添加用户自定义的Schema字段
			
 
				+        if custom_schemas:
			
 
				+            for s in custom_schemas:
			
 
				+                fields.append({
			
 
				+                    "name": s.field_name,
			
 
				+                    "type": s.field_type,
			
 
				+                    "max_length": s.max_length,
			
 
				+                    "is_primary": s.is_primary,
			
 
				+                    "description": s.description
			
 
				+                })
			
 
				+        
			
 
				+        # 2. 自动添加 metadata 字段 (JSON类型)
			
 
				+        # 即使没有定义元数据字段，通常也需要一个 JSON 类型的 metadata 字段来存储灵活的元数据
			
 
				+        # 如果用户在 t_samp_metadata 中定义了元数据结构，这些结构实际上是存储在 metadata 字段中的 KV 对
			
 
				+        # 但为了方便检索，我们也可以选择将 metadata 作为一个独立的 JSON 字段存在 Milvus 中
			
 
				+        
			
 
				+        # 检查是否已经有名为 'metadata' 的自定义字段，避免冲突
			
 
				+        has_metadata_field = any(f['name'] == 'metadata' for f in fields)
			
 
				+        if not has_metadata_field:
			
 
				+            fields.append({
			
 
				+                "name": "metadata",
			
 
				+                "type": "JSON",
			
 
				+                "description": "默认元数据字段"
			
 
				+            })
			
 
				+        
			
 
				+        try:
			
 
				+            # 暂时无法获取维度信息，默认768，或者应该在数据库中存储维度
			
 
				+            # 假设默认 768，后续可以在 KnowledgeBase 模型中增加 dimension 字段
			
 
				+            milvus_service.create_collection(
			
 
				+                name=kb.collection_name,
			
 
				+                dimension=768, 
			
 
				+                description=kb.description or "",
			
 
				+                fields=fields if fields else None
			
 
				+            )
			
 
				+            return kb
			
 
				+        except Exception as e:
			
 
				+            raise e
			
 
				+
			
 
				+    async def get_metadata_and_schema(self, db: AsyncSession, kb_id: str) -> Dict[str, List[dict]]:
			
 
				+        """获取知识库的元数据字段列表和自定义Schema"""
			
 
				+        # 检查知识库是否存在
			
 
				+        result = await db.execute(select(KnowledgeBase).where(KnowledgeBase.id == kb_id, KnowledgeBase.is_deleted == 0))
			
 
				+        kb = result.scalars().first()
			
 
				+        if not kb:
			
 
				+            raise ValueError("知识库不存在")
			
 
				+
			
 
				+        # 查询元数据表
			
 
				+        meta_query = select(SampleMetadata).where(SampleMetadata.knowledge_base_id == kb_id)
			
 
				+        meta_result = await db.execute(meta_query)
			
 
				+        metadata_fields = [f.to_dict() for f in meta_result.scalars().all()]
			
 
				+        
			
 
				+        # 查询自定义Schema表
			
 
				+        schema_query = select(CustomSchema).where(CustomSchema.knowledge_base_id == kb_id)
			
 
				+        schema_result = await db.execute(schema_query)
			
 
				+        
			
 
				+        custom_schemas = []
			
 
				+        for s in schema_result.scalars().all():
			
 
				+            custom_schemas.append({
			
 
				+                "field_name": s.field_name,
			
 
				+                "field_type": s.field_type,
			
 
				+                "max_length": s.max_length,
			
 
				+                "description": s.description
			
 
				+            })
			
 
				+            
			
 
				+        return {
			
 
				+            "metadata_fields": metadata_fields,
			
 
				+            "custom_schemas": custom_schemas
			
 
				+        }
			
 
				+
			
 
				+    async def get_metadata_fields(self, db: AsyncSession, kb_id: str) -> List[dict]:
			
 
				+        """获取知识库的元数据字段列表"""
			
 
				+        # 检查知识库是否存在
			
 
				+        result = await db.execute(select(KnowledgeBase).where(KnowledgeBase.id == kb_id, KnowledgeBase.is_deleted == 0))
			
 
				+        kb = result.scalars().first()
			
 
				+        if not kb:
			
 
				+            raise ValueError("知识库不存在")
			
 
				+
			
 
				+        # 查询元数据表
			
 
				+        query = select(SampleMetadata).where(SampleMetadata.knowledge_base_id == kb_id)
			
 
				+        result = await db.execute(query)
			
 
				+        fields = result.scalars().all()
			
 
				+        
			
 
				+        return [f.to_dict() for f in fields]
			
 
				+
			
 
				 knowledge_base_service = KnowledgeBaseService()
			
--- a/src/app/services/milvus_service.py
+++ b/src/app/services/milvus_service.py
@@ -25,21 +25,99 @@ class MilvusService:
 
				         # 获取embedding model
			
 
				         self.emdmodel = get_embedding_model()
			
 
				 
			
 
				-    def create_collection(self, name: str, dimension: int = 768, description: str = "") -> None:
			
 
				-        """创建 Milvus 集合"""
			
 
				+    def create_collection(self, name: str, dimension: int = 768, description: str = "", fields: List[Dict] = None) -> None:
			
 
				+        """
			
 
				+        创建 Milvus 集合
			
 
				+        :param fields: 自定义字段列表，每个元素为 {"name": "age", "type": "INT64", ...}
			
 
				+        """
			
 
				         if self.client.has_collection(name):
			
 
				             logger.info(f"Collection {name} already exists.")
			
 
				             return
			
 
				         
			
 
				-        # 使用简化的 create_collection API
			
 
				-        self.client.create_collection(
			
 
				-            collection_name=name,
			
 
				-            dimension=dimension,
			
 
				-            description=description,
			
 
				-            auto_id=True,  # 自动生成 ID
			
 
				-            id_type="int", # ID 类型
			
 
				-            metric_type="COSINE" # 默认使用余弦相似度
			
 
				-        )
			
 
				+        # 如果有自定义字段，使用 schema 创建
			
 
				+        if fields:
			
 
				+            from pymilvus import MilvusClient, DataType
			
 
				+            
			
 
				+            # 1. 创建 Schema
			
 
				+            schema = MilvusClient.create_schema(
			
 
				+                auto_id=True,
			
 
				+                enable_dynamic_field=True,
			
 
				+                description=description
			
 
				+            )
			
 
				+            
			
 
				+            # 2. 添加必须的默认字段
			
 
				+            schema.add_field(field_name="id", datatype=DataType.INT64, is_primary=True, auto_id=True)
			
 
				+            schema.add_field(field_name="vector", datatype=DataType.FLOAT_VECTOR, dim=dimension)
			
 
				+            # schema.add_field(field_name="sparse", datatype=DataType.SPARSE_FLOAT_VECTOR) # 如果需要混合检索，可能需要
			
 
				+            
			
 
				+            # 3. 添加用户自定义字段
			
 
				+            # 映射字符串类型到 pymilvus DataType
			
 
				+            type_map = {
			
 
				+                "BOOL": DataType.BOOL,
			
 
				+                "INT8": DataType.INT8,
			
 
				+                "INT16": DataType.INT16,
			
 
				+                "INT32": DataType.INT32,
			
 
				+                "INT64": DataType.INT64,
			
 
				+                "FLOAT": DataType.FLOAT,
			
 
				+                "DOUBLE": DataType.DOUBLE,
			
 
				+                "VARCHAR": DataType.VARCHAR,
			
 
				+                "JSON": DataType.JSON,
			
 
				+                "FLOAT_VECTOR": DataType.FLOAT_VECTOR
			
 
				+            }
			
 
				+            
			
 
				+            for f in fields:
			
 
				+                dtype = type_map.get(f.get("type", "").upper())
			
 
				+                if not dtype:
			
 
				+                    continue # 忽略未知类型
			
 
				+                
			
 
				+                kwargs = {
			
 
				+                    "field_name": f.get("name"),
			
 
				+                    "datatype": dtype,
			
 
				+                    "description": f.get("description", "")
			
 
				+                }
			
 
				+                
			
 
				+                if dtype == DataType.VARCHAR:
			
 
				+                    kwargs["max_length"] = f.get("max_length", 65535)
			
 
				+                
			
 
				+                schema.add_field(**kwargs)
			
 
				+            
			
 
				+            # 4. 准备索引参数
			
 
				+            index_params = self.client.prepare_index_params()
			
 
				+            
			
 
				+            # 5. 添加向量索引
			
 
				+            index_params.add_index(
			
 
				+                field_name="vector", 
			
 
				+                index_type="AUTOINDEX",
			
 
				+                metric_type="COSINE"
			
 
				+            )
			
 
				+            
			
 
				+            # 6. 为自定义标量字段添加索引 (可选，这里为所有标量字段添加倒排索引以加速过滤)
			
 
				+            for f in fields:
			
 
				+                # VARCHAR/INT/BOOL 等支持索引
			
 
				+                if f.get("type", "").upper() in ["VARCHAR", "INT64", "INT32", "BOOL"]:
			
 
				+                    index_params.add_index(
			
 
				+                        field_name=f.get("name"),
			
 
				+                        index_type="INVERTED" # 标量字段倒排索引
			
 
				+                    )
			
 
				+
			
 
				+            # 7. 创建集合
			
 
				+            self.client.create_collection(
			
 
				+                collection_name=name,
			
 
				+                schema=schema,
			
 
				+                index_params=index_params
			
 
				+            )
			
 
				+            
			
 
				+        else:
			
 
				+            # 使用简化的 create_collection API
			
 
				+            self.client.create_collection(
			
 
				+                collection_name=name,
			
 
				+                dimension=dimension,
			
 
				+                description=description,
			
 
				+                auto_id=True,  # 自动生成 ID
			
 
				+                id_type="int", # ID 类型
			
 
				+                metric_type="COSINE" # 默认使用余弦相似度
			
 
				+            )
			
 
				+        
			
 
				         logger.info(f"Created collection {name} with dimension {dimension}")
			
 
				 
			
 
				     def drop_collection(self, name: str) -> None:
			
@@ -187,6 +265,8 @@ class MilvusService:
 
				 
			
 
				         # 提取索引信息
			
 
				         indices = []
			
 
				+        
			
 
				+        # 尝试从 describe_collection 结果中获取 (兼容旧逻辑)
			
 
				         if "indexes" in desc:
			
 
				             for idx in desc["indexes"]:
			
 
				                 index_info = {
			
@@ -197,6 +277,29 @@ class MilvusService:
 
				                     "params": idx.get("params"),
			
 
				                 }
			
 
				                 indices.append(index_info)
			
 
				+        
			
 
				+        # 如果没有获取到索引信息，尝试主动查询 list_indexes
			
 
				+        if not indices:
			
 
				+            try:
			
 
				+                # 获取索引列表 (通常返回索引名称列表)
			
 
				+                index_names = self.client.list_indexes(collection_name=name)
			
 
				+                if index_names:
			
 
				+                    for idx_name in index_names:
			
 
				+                        try:
			
 
				+                            # 获取索引详情
			
 
				+                            idx_desc = self.client.describe_index(collection_name=name, index_name=idx_name)
			
 
				+                            if idx_desc:
			
 
				+                                indices.append({
			
 
				+                                    "field_name": idx_desc.get("field_name"),
			
 
				+                                    "index_name": idx_desc.get("index_name"),
			
 
				+                                    "index_type": idx_desc.get("index_type"),
			
 
				+                                    "metric_type": idx_desc.get("metric_type"),
			
 
				+                                    "params": idx_desc.get("params"),
			
 
				+                                })
			
 
				+                        except Exception:
			
 
				+                            continue
			
 
				+            except Exception as e:
			
 
				+                logger.warning(f"Failed to list/describe indexes for {name}: {e}")
			
 
				 
			
 
				         detail = {
			
 
				             "name": name,
			
--- a/src/app/services/search_engine_service.py
+++ b/src/app/services/search_engine_service.py
@@ -23,6 +23,7 @@ from app.sample.schemas.search_engine import (
 
				 from app.schemas.base import PaginationSchema
			
 
				 from app.services.milvus_service import milvus_service
			
 
				 from app.utils.vector_utils import text_to_vector_algo
			
 
				+import logging
			
 
				 
			
 
				 class SearchEngineService:
			
 
				     
			
@@ -36,33 +37,300 @@ class SearchEngineService:
 
				             return KBSearchResponse(results=[], total=0)
			
 
				             
			
 
				         # 1. 使用算法生成向量 (替代 Embedding 模型)
			
 
				+        # 尝试从 Milvus collection 获取向量维度，动态匹配维度
			
 
				         # 这样相同的查询词会生成相同的向量，具备了基本的检索能力
			
 
				-        query_vector = text_to_vector_algo(payload.query, dim=768)
			
 
				+        try:
			
 
				+            collection_detail = milvus_service.get_collection_detail(kb_id)
			
 
				+        except Exception:
			
 
				+            collection_detail = None
			
 
				+
			
 
				+        dim = None
			
 
				+        if collection_detail and isinstance(collection_detail, dict):
			
 
				+            fields = collection_detail.get("fields", []) or []
			
 
				+            for f in fields:
			
 
				+                # 根据字段类型查找向量字段（Milvus 向量字段类型通常为 FloatVector / float_vector）
			
 
				+                if not isinstance(f, dict):
			
 
				+                    continue
			
 
				+                ftype = str(f.get("type") or "").lower()
			
 
				+                print(ftype+'是什么东西')
			
 
				+                if "100" in ftype or '101' in ftype:  # 假设 100 和 101 分别代表 FloatVector 和 BinaryVector
			
 
				+                    # 找到向量字段，优先从 params.dim 获取维度
			
 
				+                    params = f.get("params") or {}
			
 
				+                    if params and params.get("dim"):
			
 
				+                        try:
			
 
				+                            dim = int(params.get("dim"))
			
 
				+                            break
			
 
				+                        except Exception:
			
 
				+                            dim = None
			
 
				+        # 回退默认维度
			
 
				+        if not dim:
			
 
				+            dim = 768
			
 
				+
			
 
				+        # 选择 Milvus 向量字段名（anns_field），字段名可能不是固定的 "vector"，也可能叫 'dense'/'denser' 等
			
 
				+        anns_field = "vector"
			
 
				+        if collection_detail and isinstance(collection_detail, dict):
			
 
				+            fields = collection_detail.get("fields", []) or []
			
 
				+            # 优先寻找有 params.dim 的向量字段
			
 
				+            for f in fields:
			
 
				+                if not isinstance(f, dict):
			
 
				+                    continue
			
 
				+                params = f.get("params") or {}
			
 
				+                if params and params.get("dim") and f.get("name"):
			
 
				+                    anns_field = f.get("name")
			
 
				+                    try:
			
 
				+                        dim = int(params.get("dim"))
			
 
				+                    except Exception:
			
 
				+                        pass
			
 
				+                    break
			
 
				+
			
 
				+            # 若未找到带 dim 的字段，尝试匹配常见的向量字段名或字段类型包含 "vector"
			
 
				+            if anns_field == "vector":
			
 
				+                for f in fields:
			
 
				+                    if not isinstance(f, dict):
			
 
				+                        continue
			
 
				+                    fname = (f.get("name") or "")
			
 
				+                    ftype = str(f.get("type") or "").lower()
			
 
				+                    if fname and fname.lower() in ("vector", "denser", "dense", "embedding", "embeddings"):
			
 
				+                        anns_field = fname
			
 
				+                        break
			
 
				+                    if fname and "vector" in ftype:
			
 
				+                        anns_field = fname
			
 
				+                        break
			
 
				+
			
 
				+        # 1. 向量搜索 (Dense Retrieval)
			
 
				+        # 默认使用 Hybrid 混合检索逻辑，但为了简化，这里先保留向量检索的核心
			
 
				+        # 如果 metric_type 指定为 hybrid，则可能需要结合关键词搜索等
			
 
				+        # 目前后端实现主要是基于 Milvus 的 ANN 搜索
			
 
				+        
			
 
				+        # 强制使用 hybrid 混合检索模式作为基础（结合关键词匹配和向量相似度）
			
 
				+        # 除非用户明确指定了其他度量方式（通常不会）
			
 
				+        requested_metric = payload.metric_type
			
 
				+        use_hybrid = False
			
 
				+        
			
 
				+        # 只有当 metric_type 为 None 或者特定值时才尝试混合检索
			
 
				+        # 或者我们可以认为只要不指定，就优先尝试混合
			
 
				+        if not requested_metric or requested_metric.lower() == 'hybrid':
			
 
				+             use_hybrid = True
			
 
				+        
			
 
				+        search_params = {
			
 
				+            "metric_type": "L2", # 默认内部计算用 L2
			
 
				+            "params": {"nprobe": 10},
			
 
				+        }
			
 
				+        
			
 
				+        # 如果前端指定了 metric_type (虽然前端现在默认 hybrid，但保留参数兼容性)
			
 
				+        if payload.metric_type and payload.metric_type.upper() != 'HYBRID':
			
 
				+             search_params["metric_type"] = payload.metric_type
			
 
				         
			
 
				         # 2. 构建过滤表达式
			
 
				-        expr = ""
			
 
				+        expr_list = []
			
 
				+        
			
 
				+        # 兼容旧的单一字段过滤
			
 
				         if payload.metadata_field and payload.metadata_value:
			
 
				-            # 示例：假设元数据直接作为字段存在，或者在 extra_info JSON 中
			
 
				-            # 这里需要根据实际 Milvus Collection 的 Schema 调整
			
 
				-            # 暂时忽略，以免报错
			
 
				-            pass
			
 
				+            safe_field = payload.metadata_field.replace("'", "").replace('"', "").strip()
			
 
				+            safe_value = payload.metadata_value.replace("'", "").replace('"', "").strip()
			
 
				             
			
 
				+            if safe_field and safe_value:
			
 
				+                if safe_value.isdigit():
			
 
				+                    expr_list.append(f'{safe_field} == {safe_value}')
			
 
				+                else:
			
 
				+                    expr_list.append(f'{safe_field} == "{safe_value}"')
			
 
				+        
			
 
				+        # 处理新的多重过滤
			
 
				+        if payload.filters:
			
 
				+            for f in payload.filters:
			
 
				+                safe_field = f.field.replace("'", "").replace('"', "").strip()
			
 
				+                safe_value = f.value.replace("'", "").replace('"', "").strip()
			
 
				+                
			
 
				+                if safe_field and safe_value:
			
 
				+                    if safe_value.isdigit():
			
 
				+                        expr_list.append(f'{safe_field} == {safe_value}')
			
 
				+                    else:
			
 
				+                        expr_list.append(f'{safe_field} == "{safe_value}"')
			
 
				+        
			
 
				+        # 组合所有条件 (使用 AND)
			
 
				+        expr = " and ".join(expr_list) if expr_list else ""
			
 
				+        
			
 
				+        # 选择 Milvus 向量字段名后生成向量 (移到这里，因为之前代码被替换掉了)
			
 
				+        query_vector = text_to_vector_algo(payload.query, dim=dim)
			
 
				+        
			
 
				+        # 检测 collection 使用的 metric (恢复这部分逻辑，因为后续 search 需要)
			
 
				+        metric_type = None
			
 
				+        # 优先从 collection_detail 检测真实 metric
			
 
				+        if collection_detail and isinstance(collection_detail, dict):
			
 
				+            indices = collection_detail.get("indices") or []
			
 
				+            if isinstance(indices, list) and len(indices) > 0:
			
 
				+                for idx in indices:
			
 
				+                    try:
			
 
				+                        mt = idx.get("metric_type") or idx.get("metric")
			
 
				+                        if mt:
			
 
				+                            metric_type = str(mt).upper()
			
 
				+                            break
			
 
				+                    except Exception:
			
 
				+                        continue
			
 
				+        
			
 
				+        # 尝试从 properties 中读取
			
 
				+        if not metric_type and collection_detail and isinstance(collection_detail, dict):
			
 
				+            props = collection_detail.get("properties") or {}
			
 
				+            if isinstance(props, dict):
			
 
				+                mt = props.get("metric_type") or props.get("metric")
			
 
				+                if mt:
			
 
				+                    metric_type = str(mt).upper()
			
 
				+        
			
 
				+        actual_search_metric = metric_type
			
 
				+        if not actual_search_metric:
			
 
				+             # 如果无法检测到 collection metric (如无索引)，则可以使用用户请求的或默认 L2
			
 
				+             actual_search_metric = requested_metric if requested_metric and requested_metric.upper() != 'HYBRID' else "L2"
			
 
				+        
			
 
				+        metric_type = actual_search_metric
			
 
				+        
			
 
				+        logger = logging.getLogger(__name__)
			
 
				+        logger.info(f"Search KB={kb_id} using anns_field={anns_field}, dim={dim}, metric={metric_type} (requested={requested_metric})")
			
 
				+
			
 
				         # 3. 执行 Milvus 搜索
			
 
				         try:
			
 
				+            # 使用 collection 实际的 metric_type 作为检索度量，避免 mismatch 错误
			
 
				+            # metric_type 已在上面检测并存放于变量 metric_type
			
 
				             search_params = {
			
 
				-                "metric_type": "COSINE", 
			
 
				+                "metric_type": metric_type,
			
 
				                 "params": {"nprobe": 10}
			
 
				             }
			
 
				+
			
 
				+            # 如果 top_k <= 0 或未指定，解释为返回该 collection 中的所有文段
			
 
				+            # 优先使用 page/page_size 计算 limit 和 offset
			
 
				+            page = payload.page if payload.page and payload.page > 0 else 1
			
 
				+            page_size = payload.page_size if payload.page_size and payload.page_size > 0 else 10
			
 
				             
			
 
				-            results = milvus_service.client.search(
			
 
				-                collection_name=kb_id,
			
 
				-                data=[query_vector],
			
 
				-                anns_field="vector", 
			
 
				-                search_params=search_params,
			
 
				-                limit=payload.top_k,
			
 
				-                filter=expr if expr else "",
			
 
				-                output_fields=["*"] 
			
 
				-            )
			
 
				+            # 如果 payload 中有 top_k 且未传 page_size (或者 page_size 是默认值)，可以使用 top_k 覆盖 page_size
			
 
				+            # 但这里为了清晰，优先使用 page_size
			
 
				+            
			
 
				+            offset = (page - 1) * page_size
			
 
				+            limit = page_size
			
 
				+            
			
 
				+            # Milvus 对 limit + offset 有限制 (通常 16384)，这里做个简单的保护
			
 
				+            if offset + limit > 16384:
			
 
				+                # 如果超出深度分页限制，可能需要提示或截断
			
 
				+                # 这里暂时不做处理，让 Milvus 报错或自行截断
			
 
				+                pass
			
 
				+
			
 
				+            # 获取集合总数用于分页显示 (total)
			
 
				+            collection_count = 0
			
 
				+            if collection_detail and isinstance(collection_detail, dict):
			
 
				+                collection_count = collection_detail.get("entity_count") or 0
			
 
				+            
			
 
				+            if not collection_count:
			
 
				+                try:
			
 
				+                    stats = milvus_service.client.get_collection_stats(collection_name=kb_id)
			
 
				+                    collection_count = int(stats.get("row_count")) if isinstance(stats, dict) and stats.get("row_count") else 0
			
 
				+                except Exception:
			
 
				+                    collection_count = 0
			
 
				+
			
 
				+            # 如果是按照 top_k 逻辑 (不传 page/page_size)，保留旧逻辑 (top_k 即 limit, offset=0)
			
 
				+            # 但现在 Schema 默认 page=1, page_size=10，所以总是走分页逻辑
			
 
				+            
			
 
				+            try:
			
 
				+                # 尝试使用混合检索 (Hybrid Search)
			
 
				+                # 只有当用户没有显式指定 metric_type 或者指定为 hybrid 时，且集合支持（通常通过异常回退处理）时使用
			
 
				+                # 但考虑到 metric_type 可能是 L2/COSINE，我们这里先尝试 hybrid，如果失败回退到普通
			
 
				+                
			
 
				+                # 为了不破坏现有逻辑，我们可以根据某种标志来决定是否使用 hybrid
			
 
				+                # 或者默认尝试 hybrid，如果 collection 不支持 sparse 则会报错回退
			
 
				+                
			
 
				+                # 这里我们直接调用 milvus_service.hybrid_search
			
 
				+                # 注意：hybrid_search 返回的格式与 client.search 不同，需要适配
			
 
				+                
			
 
				+                use_hybrid = False
			
 
				+                # 只有当 metric_type 为 None 或者特定值时才尝试混合检索，避免与用户明确指定的 metric 冲突
			
 
				+                # 或者我们可以认为只要不指定，就优先尝试混合
			
 
				+                # 已经在上面判断过 use_hybrid = True 了
			
 
				+                
			
 
				+                if use_hybrid:
			
 
				+                    logger.info(f"Attempting hybrid search for KB={kb_id}")
			
 
				+                    try:
			
 
				+                        # Hybrid search (LangChain Milvus) 暂时不支持直接传 offset
			
 
				+                        # 所以我们需要获取 top_k = offset + limit，然后手动切片
			
 
				+                        target_k = offset + limit
			
 
				+                        
			
 
				+                        hybrid_results = milvus_service.hybrid_search(
			
 
				+                            collection_name=kb_id,
			
 
				+                            query_text=payload.query,
			
 
				+                            top_k=target_k
			
 
				+                        )
			
 
				+                        
			
 
				+                        # 手动切片实现分页
			
 
				+                        start = offset
			
 
				+                        end = offset + limit
			
 
				+                        # 确保不越界
			
 
				+                        if start >= len(hybrid_results):
			
 
				+                            sliced_results = []
			
 
				+                        else:
			
 
				+                            sliced_results = hybrid_results[start:end]
			
 
				+                        
			
 
				+                        formatted_results = []
			
 
				+                        for item in sliced_results:
			
 
				+                            formatted_results.append(KBSearchResultItem(
			
 
				+                                id=str(item.get('id')),
			
 
				+                                kb_name=kb_id,
			
 
				+                                doc_name=item.get('metadata', {}).get('file_name') or item.get('metadata', {}).get('source') or "未知文档",
			
 
				+                                content=item.get('text_content') or "",
			
 
				+                                meta_info=str(item.get('metadata', {})),
			
 
				+                                score=item.get('similarity', 0) * 100 # 假设是 0-1
			
 
				+                            ))
			
 
				+
			
 
				+                        return KBSearchResponse(results=formatted_results, total=collection_count)
			
 
				+
			
 
				+                    except Exception as hybrid_err:
			
 
				+                        logger.warning(f"Hybrid search failed, falling back to vector search: {hybrid_err}")
			
 
				+                        # Fallback to standard vector search below
			
 
				+                        pass
			
 
				+
			
 
				+                results = milvus_service.client.search(
			
 
				+                    collection_name=kb_id,
			
 
				+                    data=[query_vector],
			
 
				+                    anns_field=anns_field,
			
 
				+                    search_params=search_params,
			
 
				+                    limit=limit,
			
 
				+                    offset=offset, # 添加 offset 支持分页
			
 
				+                    filter=expr if expr else "",
			
 
				+                    output_fields=["*"] 
			
 
				+                )
			
 
				+            except Exception as milvus_err:
			
 
				+                # 捕获 Milvus 异常，常见原因包括 metric mismatch
			
 
				+                logger.error(f"Milvus search failed for collection={kb_id}, metric_requested={metric_type}, anns_field={anns_field}: {milvus_err}")
			
 
				+                
			
 
				+                # Retry Logic: 如果是因为 metric 不匹配，解析错误信息中的 expected metric 并重试
			
 
				+                error_msg = str(milvus_err)
			
 
				+                if "metric type not match" in error_msg:
			
 
				+                    import re
			
 
				+                    # 匹配 expected=COSINE 或 expected='COSINE' 等格式
			
 
				+                    # 支持 COSINE, L2, IP, BM25 等
			
 
				+                    match = re.search(r"expected\s*=\s*['\"]?([A-Za-z0-9_]+)['\"]?", error_msg)
			
 
				+                    if match:
			
 
				+                        correct_metric = match.group(1).upper()
			
 
				+                        logger.warning(f"Detected metric mismatch. Retrying with correct metric: {correct_metric}")
			
 
				+                        
			
 
				+                        # 更新 metric_type 并重试搜索
			
 
				+                        search_params["metric_type"] = correct_metric
			
 
				+                        # 同时也需要更新后续计算分数所用的 metric_type 变量，以便正确计算相似度
			
 
				+                        metric_type = correct_metric
			
 
				+                        
			
 
				+                        # 特殊处理: BM25 可能需要 sparse vector 或其他参数，但 Milvus search 接口应该是一致的
			
 
				+                        # 如果是 BM25，可能 anns_field 也要调整（通常 BM25 用 sparse vector）
			
 
				+                        # 但这里假设 anns_field 是正确的，只是 metric 不对
			
 
				+                        
			
 
				+                        results = milvus_service.client.search(
			
 
				+                            collection_name=kb_id,
			
 
				+                            data=[query_vector],
			
 
				+                            anns_field=anns_field,
			
 
				+                            search_params=search_params,
			
 
				+                            limit=limit,
			
 
				+                            offset=offset, # 同样加上 offset
			
 
				+                            filter=expr if expr else "",
			
 
				+                            output_fields=["*"] 
			
 
				+                        )
			
 
				+                    else:
			
 
				+                        raise
			
 
				+                else:
			
 
				+                    raise
			
 
				             
			
 
				             # 4. 格式化结果
			
 
				             formatted_results = []
			
@@ -73,27 +341,76 @@ class SearchEngineService:
 
				                     #     continue
			
 
				                         
			
 
				                     entity = hit.entity
			
 
				-                    
			
 
				+
			
 
				                     content = entity.get("text") or entity.get("content") or entity.get("page_content") or ""
			
 
				                     if not content:
			
 
				-                        debug_data = {k:v for k,v in entity.items() if k != "vector"}
			
 
				+                        debug_data = {k: v for k, v in entity.items() if k != anns_field}
			
 
				                         content = json.dumps(debug_data, ensure_ascii=False)[:200] + "..."
			
 
				                         
			
 
				                     doc_name = entity.get("file_name") or entity.get("title") or entity.get("source") or "未知文档"
			
 
				                     
			
 
				                     meta_info = []
			
 
				                     for k, v in entity.items():
			
 
				-                        if k not in ["vector", "text", "content", "page_content", "id", "pk"]:
			
 
				+                        if k not in [anns_field, "text", "content", "page_content", "id", "pk"]:
			
 
				                             meta_info.append(f"{k}: {v}")
			
 
				                     meta_str = "; ".join(meta_info[:3])
			
 
				                     
			
 
				+                    # 根据 collection 的 metric 动态计算相似度分数
			
 
				+                    # 如果用户请求了特定的 metric，尝试适配；否则使用实际 metric
			
 
				+                    display_metric = requested_metric if requested_metric else metric_type
			
 
				+                    
			
 
				+                    similarity_pct = None
			
 
				+                    try:
			
 
				+                        raw_score = float(hit.score)
			
 
				+                    except Exception:
			
 
				+                        raw_score = None
			
 
				+
			
 
				+                    if raw_score is not None:
			
 
				+                        # 核心计算逻辑：先根据 metric_type 理解 raw_score，再根据 display_metric 转换
			
 
				+                        # 目前简化处理：直接根据 display_metric 解释 raw_score，忽略不兼容的情况
			
 
				+                        # 更好的做法是：
			
 
				+                        # 1. 识别 raw_score 的物理意义（距离还是相似度），基于 metric_type
			
 
				+                        # 2. 转换为 display_metric 要求的格式
			
 
				+                        
			
 
				+                        # Case 1: 实际是 L2 (距离)，用户想看 L2
			
 
				+                        if "L2" in metric_type or "EUCLIDEAN" in metric_type:
			
 
				+                            distance = raw_score
			
 
				+                            if display_metric and ("COSINE" in display_metric):
			
 
				+                                # L2 距离转 Cosine 相似度 (仅适用于归一化向量)
			
 
				+                                # dist^2 = 2(1-cos) => cos = 1 - dist^2/2
			
 
				+                                # 但这里简单起见，如果类型不匹配，还是按 L2 算百分比，避免数值错误
			
 
				+                                similarity_pct = round((1.0 / (1.0 + distance)) * 100.0, 2)
			
 
				+                            else:
			
 
				+                                similarity_pct = round((1.0 / (1.0 + distance)) * 100.0, 2)
			
 
				+                                
			
 
				+                        # Case 2: 实际是 Cosine (相似度 [-1, 1])
			
 
				+                        elif "COSINE" in metric_type:
			
 
				+                            cosine_score = raw_score
			
 
				+                            # 无论用户想看什么，Cosine Score 本身就是相似度，直接归一化到 0-100 最直观
			
 
				+                            similarity_pct = round(max(min((cosine_score + 1.0) / 2.0, 1.0), 0.0) * 100.0, 2)
			
 
				+                            
			
 
				+                        # Case 3: IP (内积)
			
 
				+                        elif "IP" in metric_type or "INNER" in metric_type:
			
 
				+                             similarity_pct = round(raw_score * 100.0, 2)
			
 
				+                        
			
 
				+                        # Fallback
			
 
				+                        else:
			
 
				+                            # 兼容 BM25 或其他未知 metric
			
 
				+                            if "BM25" in metric_type:
			
 
				+                                # BM25 分数通常是正数，没有固定上限，直接显示原值
			
 
				+                                similarity_pct = round(raw_score, 2)
			
 
				+                            else:
			
 
				+                                similarity_pct = round(raw_score * 100.0, 2)
			
 
				+                    else:
			
 
				+                        similarity_pct = 0.0
			
 
				+
			
 
				                     formatted_results.append(KBSearchResultItem(
			
 
				                         id=str(hit.id),
			
 
				-                        kb_name=kb_id, 
			
 
				+                        kb_name=kb_id,
			
 
				                         doc_name=doc_name,
			
 
				                         content=content,
			
 
				                         meta_info=meta_str,
			
 
				-                        score=round(hit.score * 100, 2)
			
 
				+                        score=similarity_pct
			
 
				                     ))
			
 
				             
			
 
				             return KBSearchResponse(results=formatted_results, total=len(formatted_results))
			
--- a/src/app/services/snippet_service.py
+++ b/src/app/services/snippet_service.py
@@ -132,14 +132,21 @@ class SnippetService:
 
				         # 使用统一算法生成向量
			
 
				         fake_vector = text_to_vector_algo(payload.content, dim=768)
			
 
				         
			
 
				-        data = [{
			
 
				+        # 基础数据
			
 
				+        item = {
			
 
				             "vector": fake_vector,
			
 
				             "text": payload.content,
			
 
				             "source": payload.doc_name,
			
 
				             "doc_id": "manual_add",
			
 
				             "file_name": payload.doc_name, 
			
 
				             "title": payload.doc_name
			
 
				-        }]
			
 
				+        }
			
 
				+        
			
 
				+        # 合并自定义字段
			
 
				+        if hasattr(payload, 'custom_fields') and payload.custom_fields:
			
 
				+            item.update(payload.custom_fields)
			
 
				+            
			
 
				+        data = [item]
			
 
				         
			
 
				         res = milvus_service.client.insert(
			
 
				             collection_name=payload.collection_name,
			
@@ -169,14 +176,20 @@ class SnippetService:
 
				         # 使用统一算法生成向量
			
 
				         fake_vector = text_to_vector_algo(payload.content, dim=768)
			
 
				         
			
 
				-        data = [{
			
 
				+        item = {
			
 
				             "vector": fake_vector,
			
 
				             "text": payload.content,
			
 
				             "source": payload.doc_name or "已更新",
			
 
				             "doc_id": "updated",
			
 
				             "file_name": payload.doc_name,
			
 
				             "title": payload.doc_name
			
 
				-        }]
			
 
				+        }
			
 
				+        
			
 
				+        # 合并自定义字段
			
 
				+        if hasattr(payload, 'custom_fields') and payload.custom_fields:
			
 
				+            item.update(payload.custom_fields)
			
 
				+            
			
 
				+        data = [item]
			
 
				         
			
 
				         milvus_service.client.insert(collection_name=kb, data=data)
			
 
				         milvus_service.client.flush(kb)
			
--- a/src/views/knowledge_base_view.py
+++ b/src/views/knowledge_base_view.py
@@ -102,3 +102,41 @@ async def delete_knowledge_base(
 
				 
			
 
				     await knowledge_base_service.delete(db, id)
			
 
				     return ResponseSchema(code=0, message="删除成功")
			
 
				+
			
 
				+@router.get("/{id}/metadata", response_model=ResponseSchema)
			
 
				+async def get_knowledge_base_metadata(
			
 
				+    id: str = Path(..., description="知识库ID"),
			
 
				+    db: AsyncSession = Depends(get_db),
			
 
				+    credentials: HTTPAuthorizationCredentials = Depends(security)
			
 
				+):
			
 
				+    """获取知识库的元数据字段定义和自定义Schema"""
			
 
				+    payload_token = verify_token(credentials.credentials)
			
 
				+    if not payload_token:
			
 
				+        return ResponseSchema(code=401, message="无效的访问令牌")
			
 
				+
			
 
				+    try:
			
 
				+        data = await knowledge_base_service.get_metadata_and_schema(db, id)
			
 
				+        return ResponseSchema(code=0, message="获取成功", data=data)
			
 
				+    except ValueError as e:
			
 
				+        return ResponseSchema(code=400, message=str(e))
			
 
				+    except Exception as e:
			
 
				+        return ResponseSchema(code=500, message=f"获取失败: {str(e)}")
			
 
				+
			
 
				+@router.post("/{id}/sync", response_model=ResponseSchema)
			
 
				+async def sync_knowledge_base(
			
 
				+    id: str = Path(..., description="知识库ID"),
			
 
				+    db: AsyncSession = Depends(get_db),
			
 
				+    credentials: HTTPAuthorizationCredentials = Depends(security)
			
 
				+):
			
 
				+    """同步创建Milvus集合"""
			
 
				+    payload_token = verify_token(credentials.credentials)
			
 
				+    if not payload_token:
			
 
				+        return ResponseSchema(code=401, message="无效的访问令牌")
			
 
				+
			
 
				+    try:
			
 
				+        await knowledge_base_service.sync_to_milvus(db, id)
			
 
				+        return ResponseSchema(code=0, message="同步成功")
			
 
				+    except ValueError as e:
			
 
				+        return ResponseSchema(code=400, message=str(e))
			
 
				+    except Exception as e:
			
 
				+        return ResponseSchema(code=500, message=f"同步失败: {str(e)}")
			
--- a/src/views/snippet_view.py
+++ b/src/views/snippet_view.py
@@ -3,7 +3,7 @@
 
				 """
			
 
				 from fastapi import APIRouter, Depends, Query, Path, Body
			
 
				 from fastapi.responses import StreamingResponse
			
 
				-from typing import Optional
			
 
				+from typing import Optional, Dict, Any
			
 
				 from datetime import datetime
			
 
				 import urllib.parse
			
 
				 
			
@@ -22,11 +22,13 @@ class SnippetCreate(BaseModel):
 
				     doc_name: str = "手动添加"
			
 
				     content: str
			
 
				     meta_info: Optional[str] = None
			
 
				+    custom_fields: Optional[Dict[str, Any]] = None
			
 
				 
			
 
				 class SnippetUpdate(BaseModel):
			
 
				     collection_name: str
			
 
				     doc_name: Optional[str] = None
			
 
				     content: str
			
 
				+    custom_fields: Optional[Dict[str, Any]] = None
			
 
				 
			
 
				 @router.get("", response_model=PaginatedResponseSchema)
			
 
				 async def get_snippets(
			
--- a/src/views/system_view.py
+++ b/src/views/system_view.py
@@ -789,7 +789,8 @@ async def update_role_menus(
 
				         
			
 
				         # 调用 service 层
			
 
				         system_service = SystemService()
			
 
				-        success, data, message = await system_service.update_role_menus(role_id, menu_ids)
			
 
				+        updater_id = payload.get("sub")
			
 
				+        success, data, message = await system_service.update_role_menus(role_id, menu_ids, updater_id)
			
 
				         
			
 
				         if success:
			
 
				             return ApiResponse(