CRBC-MaaS-Platform-Project
/
LQAgentPlatform


			
							1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798991001011021031041051061071081091101111121131141151161171181191201211221231241251261271281291301311321331341351361371381391401411421431441451461471481491501511521531541551561571581591601611621631641651661671681691701711721731741751761771781791801811821831841851861871881891901911921931941951961971981992002012022032042052062072082092102112122132142152162172182192202212222232242252262272282292302312322332342352362372382392402412422432442452462472482492502512522532542552562572582592602612622632642652662672682692702712722732742752762772782792802812822832842852862872882892902912922932942952962972982993003013023033043053063073083093103113123133143153163173183193203213223233243253263273283293303313323333343353363373383393403413423433443453463473483493503513523533543553563573583593603613623633643653663673683693703713723733743753763773783793803813823833843853863873883893903913923933943953963973983994004014024034044054064074084094104114124134144154164174184194204214224234244254264274284294304314324334344354364374384394404414424434444454464474484494504514524534544554564574584594604614624634644654664674684694704714724734744754764774784794804814824834844854864874884894904914924934944954964974984995005015025035045055065075085095105115125135145155165175185195205215225235245255265275285295305315325335345355365375385395405415425435445455465475485495505515525535545555565575585595605615625635645655665675685695705715725735745755765775785795805815825835845855865875885895905915925935945955965975985996006016026036046056066076086096106116126136146156166176186196206216226236246256266276286296306316326336346356366376386396406416426436446456466476486496506516526536546556566576586596606616626636646656666676686696706716726736746756766776786796806816826836846856866876886896906916926936946956966976986997007017027037047057067077087097107117127137147157167177187197207217227237247257267277287297307317327337347357367377387397407417427437447457467477487497507517527537547557567577587597607617627637647657667677687697707717727737747757767777787797807817827837847857867877887897907917927937947957967977987998008018028038048058068078088098108118128138148158168178188198208218228238248258268278288298308318328338348358368378388398408418428438448458468478488498508518528538548558568578588598608618628638648658668678688698708718728738748758768778788798808818828838848858868878888898908918928938948958968978988999009019029039049059069079089099109119129139149159169179189199209219229239249259269279289299309319329339349359369379389399409419429439449459469479489499509519529539549559569579589599609619629639649659669679689699709719729739749759769779789799809819829839849859869879889899909919929939949959969979989991000100110021003100410051006100710081009101010111012101310141015101610171018101910201021102210231024102510261027102810291030103110321033103410351036103710381039104010411042104310441045104610471048104910501051105210531054105510561057105810591060106110621063106410651066106710681069107010711072107310741075107610771078107910801081108210831084108510861087108810891090109110921093109410951096109710981099
							#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
AI模型处理器

用于管理生成、与嵌入模型的创建和配置

支持的模型类型：
- doubao: 豆包模型
- qwen: 通义千问模型
- deepseek: DeepSeek模型
- lq_qwen3_8b: 本地Qwen3-8B模型
- lq_qwen3_8b_lq_lora: 本地Qwen3-8B-lq-lora模型
- lq_qwen3_4b: 本地Qwen3-4B模型
- qwen_local_14b: 本地Qwen3-14B模型
- shutian_qwen3_embed: 蜀天Qwen3-Embedding-8B嵌入模型（默认）
- siliconflow_embed: 硅基流动Qwen3-Embedding-8B嵌入模型
- lq_bge_reranker_v2_m3: 本地BGE-reranker-v2-m3重排序模型
- qwen3_5_35b_a3b: DashScope Qwen3.5-35B-A3B模型（默认兜底模型）
- qwen3_5_27b: DashScope Qwen3.5-27B模型
- qwen3_5_122b_a10b: DashScope Qwen3.5-122B-A10B模型
- shutian_qwen3_5_122b: 蜀天Qwen3.5-122B-A10B模型（183.220.37.46:25423）
- shutian_qwen3_8b: 蜀天Qwen3-8B模型（183.220.37.46:25424）
- shutian_qwen3_5_35b: 蜀天Qwen3.5-35B模型（183.220.37.46:25427）
- shutian_qwen3_6_27b: 蜀天Qwen3.6-27B模型（183.220.37.46:25424）
- shutian_qwen3_embed: 蜀天Qwen3-Embedding-8B模型（183.220.37.46:25425）
- shutian_qwen3_reranker: 蜀天Qwen3-Reranker-8B模型（183.220.37.46:25426）
"""

# 禁用 transformers 的深度学习框架检测，避免启动时耗时扫描
import os
os.environ["TRANSFORMERS_VERBOSITY"] = "error"
os.environ["HF_HUB_DISABLE_TELEMETRY"] = "1"

import requests
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from foundation.infrastructure.config.config import config_handler
from foundation.observability.logger.loggering import review_logger as logger


class ModelConnectionError(Exception):
    """模型连接错误"""
    pass


class ModelConfigError(Exception):
    """模型配置错误"""
    pass


class ModelAPIError(Exception):
    """模型API调用错误"""
    pass


class ModelHandler:
    """
    AI模型处理器类，用于管理多种AI模型的创建和配置
    """

    # 模型连接超时时间配置（秒）
    CONNECTION_TIMEOUT = 30
    REQUEST_TIMEOUT = 180
    REQUEST_TIMEOUT_THINKING = 360
    MAX_RETRIES = 2

    # 模型类型 → 工厂方法 注册表
    MODEL_FACTORY_MAP = {
        "doubao": "_get_doubao_model",
        "qwen": "_get_qwen_model",
        "deepseek": "_get_deepseek_model",
        "lq_qwen3_8b": "_get_lq_qwen3_8b_model",
        "lq_qwen3_8b_lq_lora": "_get_lq_qwen3_8b_lora_model",
        "lq_qwen3_4b": "_get_lq_qwen3_4b_model",
        "qwen_local_14b": "_get_qwen_local_14b_model",
        "qwen3_5_35b_a3b": "_get_qwen3_5_35b_a3b_model",
        "qwen3_5_27b": "_get_qwen3_5_27b_model",
        "qwen3_5_122b_a10b": "_get_qwen3_5_122b_a10b_model",
        "shutian_qwen3_5_122b": "_get_shutian_qwen3_5_122b_model",
        "shutian_qwen3_8b": "_get_shutian_qwen3_8b_model",
        "shutian_qwen3_5_35b": "_get_shutian_qwen3_5_35b_model",
        "shutian_qwen3_6_27b": "_get_shutian_qwen3_6_27b_model",
    }

    DEFAULT_FALLBACK_MODEL = "qwen3_5_35b_a3b"

    def __init__(self):
        """
        初始化模型处理器

        加载配置处理器，用于后续读取各种模型的配置信息
        """
        self.config = config_handler
        self._model_cache = {}  # 模型实例缓存
        self._request_timeout_override = None

    def _create_model_by_type(self, model_type: str):
        """根据模型类型名称创建模型实例（通过注册表分发）"""
        method_name = self.MODEL_FACTORY_MAP.get(model_type)
        if method_name:
            return getattr(self, method_name)()
        logger.warning(f"未知的模型类型 '{model_type}'，使用默认 {self.DEFAULT_FALLBACK_MODEL} 模型")
        return self._get_qwen3_5_35b_a3b_model()

    @property
    def request_timeout(self):
        """当前请求超时时间，有 override 时优先返回 override"""
        return self._request_timeout_override or self.REQUEST_TIMEOUT

    def _check_connection(self, base_url: str, api_key: str = None, timeout: int = 5) -> bool:
        """
        检查模型服务连接是否可用

        支持两种检查方式：
        1. GET /models - 标准 OpenAI 兼容接口
        2. POST /chat/completions - 直接测试 chat 接口（部分服务只支持此接口）

        Args:
            base_url: 模型服务地址
            api_key: API密钥（可选）
            timeout: 超时时间（秒）

        Returns:
            bool: 连接是否可用
        """
        headers = {}
        if api_key and api_key != "dummy":
            headers["Authorization"] = f"Bearer {api_key}"

        # 方法1: 尝试 /models 端点
        try:
            health_url = f"{base_url.rstrip('/')}/models"
            response = requests.get(
                health_url,
                headers=headers,
                timeout=timeout
            )
            if 200 <= response.status_code < 300:
                logger.debug(f"连接检查通过 (/models): {base_url}")
                return True
        except requests.exceptions.Timeout:
            logger.debug(f"连接检查超时 (/models): {base_url}")
        except Exception as e:
            logger.debug(f"连接检查失败 (/models): {base_url}, {e}")

        # 方法2: 尝试 /chat/completions 端点（发送一个简单请求）
        try:
            chat_url = f"{base_url.rstrip('/')}/chat/completions"
            test_payload = {
                "model": "test",
                "messages": [{"role": "user", "content": "test"}],
                "max_tokens": 1
            }
            response = requests.post(
                chat_url,
                headers={**headers, "Content-Type": "application/json"},
                json=test_payload,
                timeout=timeout
            )
            # 即使返回 400/401/404 也说明服务是通的
            # 只有连接错误/超时才是真的连不上
            if response.status_code != 503:  # 503 表示服务不可用
                logger.debug(f"连接检查通过 (/chat/completions): {base_url}, 状态码: {response.status_code}")
                return True
        except requests.exceptions.Timeout:
            logger.warning(f"连接检查超时: {base_url}")
        except requests.exceptions.ConnectionError as e:
            logger.warning(f"连接检查错误: {base_url}, {e}")
        except Exception as e:
            logger.warning(f"连接检查异常: {base_url}, {e}")

        return False

    def _handle_model_error(self, model_name: str, error: Exception, fallback_model=None):
        """
        统一处理模型错误

        Args:
            model_name: 模型名称
            error: 异常对象
            fallback_model: 降级模型实例（可选）

        Returns:
            降级模型实例，如果不可用则返回None
        """
        error_type = type(error).__name__
        error_msg = str(error)

        logger.error(f"模型初始化失败 [{model_name}]: {error_type} - {error_msg}")

        # 如果提供了降级模型，记录日志并返回
        if fallback_model:
            logger.warning(f"使用降级模型: {fallback_model.__class__.__name__}")
            return fallback_model

        # 如果没有降级模型，返回None让调用方处理
        return None

    def get_models(self):
        """
        获取AI模型实例

        Returns:
            ChatOpenAI: 配置好的AI模型实例

        Note:
            优先从 model_setting.yaml 读取默认模型配置，如果不存在则回退到 config.ini 的 MODEL_TYPE
            支持的模型类型：doubao, qwen, deepseek, lq_qwen3_8b, lq_qwen3_8b_lora, lq_qwen3_4b, qwen_local_14b
        """
        # 优先从 model_setting.yaml 读取默认模型配置
        try:
            from foundation.ai.models.model_config_loader import get_model_for_function
            model_type = get_model_for_function("default")
            if model_type:
                logger.debug(f"从 model_setting.yaml 读取默认模型: {model_type}")
            else:
                model_type = self.DEFAULT_FALLBACK_MODEL
        except Exception as e:
            logger.debug(f"从 model_setting.yaml 读取默认模型失败: {e}，回退到默认模型")
            model_type = self.DEFAULT_FALLBACK_MODEL
        logger.info(f"正在初始化AI模型，模型类型: {model_type}")

        # 检查缓存
        cache_key = f"chat_{model_type}"
        if cache_key in self._model_cache:
            logger.info(f"使用缓存的模型: {model_type}")
            return self._model_cache[cache_key]

        model = None

        try:
            model = self._create_model_by_type(model_type)

            if model:
                self._model_cache[cache_key] = model
                logger.info(f"AI模型初始化完成: {model_type}")
                return model
            else:
                raise ModelAPIError(f"模型初始化返回None: {model_type}")

        except Exception as e:
            logger.error(f"获取模型失败 [{model_type}]: {e}")

            # 使用 qwen3_5_35b_a3b 作为兜底降级方案
            if model_type != "qwen3_5_35b_a3b":
                logger.info("尝试使用 qwen3_5_35b_a3b 模型作为降级方案")
                try:
                    fallback_model = self._get_qwen3_5_35b_a3b_model()
                    if fallback_model:
                        self._model_cache[cache_key] = fallback_model
                        logger.warning("已切换到 qwen3_5_35b_a3b 降级模型")
                        return fallback_model
                except Exception as fallback_error:
                    logger.error(f"降级模型也失败: {fallback_error}")

            # 如果所有模型都失败，抛出异常
            raise ModelConnectionError(f"无法初始化任何模型服务: {e}")

    def get_model_by_name(self, model_type: str = None, enable_thinking: bool = False):
        """
        根据模型名称动态获取指定的AI模型实例

        Args:
            model_type: 模型类型名称,如果为None则使用配置文件中的默认模型
                       支持的模型类型：doubao, qwen, deepseek, gemini,
                                     lq_qwen3_8b, lq_qwen3_8b_lq_lora,
                                     lq_qwen3_4b, qwen_local_14b
            enable_thinking: 是否启用推理模式，影响 HTTP 超时时间

        Returns:
            ChatOpenAI: 配置好的AI模型实例

        Note:
            该方法支持动态切换模型,不受配置文件中的默认MODEL_TYPE限制
            如果model_type为None,则使用配置文件中的默认模型
            如果model_type无效,则使用gemini作为降级模型
        """
        # 如果未指定模型类型,使用配置文件中的默认模型
        if model_type is None:
            model_type = self.DEFAULT_FALLBACK_MODEL

        logger.info(f"动态获取AI模型，模型类型: {model_type}, thinking: {enable_thinking}")

        # 检查缓存（thinking 模式使用独立缓存）
        cache_key = f"chat_{model_type}" if not enable_thinking else f"chat_{model_type}_thinking"
        if cache_key in self._model_cache:
            logger.info(f"使用缓存的模型: {model_type}")
            return self._model_cache[cache_key]

        # 设置超时 override，工厂方法通过 self.request_timeout 读取
        self._request_timeout_override = (
            self.REQUEST_TIMEOUT_THINKING if enable_thinking else None
        )

        model = None

        try:
            model = self._create_model_by_type(model_type)

            if model:
                self._model_cache[cache_key] = model
                logger.info(f"AI模型动态初始化完成: {model_type}")
                return model
            else:
                raise ModelAPIError(f"模型初始化返回None: {model_type}")

        except Exception as e:
            logger.error(f"动态获取模型失败 [{model_type}]: {e}")

            # 使用 qwen3_5_35b_a3b 作为兜底降级方案
            if model_type != "qwen3_5_35b_a3b":
                logger.info("尝试使用 qwen3_5_35b_a3b 模型作为降级方案")
                try:
                    fallback_model = self._get_qwen3_5_35b_a3b_model()
                    if fallback_model:
                        # 注意：不要把降级模型存入原模型的缓存，避免后续调用都使用错误的模型
                        fallback_cache_key = "chat_qwen3_5_35b_a3b"
                        self._model_cache[fallback_cache_key] = fallback_model
                        logger.warning(f"已切换到 qwen3_5_35b_a3b 降级模型（不会缓存为 {model_type}）")
                        return fallback_model
                except Exception as fallback_error:
                    logger.error(f"降级模型也失败: {fallback_error}")

            # 如果所有模型都失败，抛出异常
            raise ModelConnectionError(f"无法初始化任何模型服务: {e}")

        finally:
            self._request_timeout_override = None

    def get_model_by_function(self, function_name: str):
        """
        根据功能名称获取对应的AI模型实例

        从 config/model_setting.yaml 加载功能对应的模型配置

        Args:
            function_name: 功能名称（定义在 model_setting.yaml 中），如:
                - doc_classification_secondary: 文档二级分类
                - completeness_review_generate: 完整性审查生成
                - sensitive_check: 敏感信息检查
                - grammar_check: 语法检查

        Returns:
            ChatOpenAI: 配置好的AI模型实例

        Example:
            model = model_handler.get_model_by_function("doc_classification_secondary")
        """
        try:
            from foundation.ai.models.model_config_loader import get_model_for_function
            model_type = get_model_for_function(function_name)
            logger.info(f"根据功能 '{function_name}' 获取模型: {model_type}")
            return self.get_model_by_name(model_type)
        except Exception as e:
            logger.warning(f"根据功能获取模型失败 [{function_name}]: {e}，尝试使用默认模型")
            try:
                default_model = get_model_for_function("default")
                return self.get_model_by_name(default_model)
            except Exception:
                return self.get_model_by_name(self.DEFAULT_FALLBACK_MODEL)

    def get_embedding_model(self):
        """
        获取Embedding模型实例

        Returns:
            OpenAIEmbeddings: 配置好的Embedding模型实例

        Note:
            从 model_setting.yaml 读取embedding模型配置
            支持的模型类型：shutian_qwen3_embed, siliconflow_embed
            默认返回蜀天 shutian_qwen3_embed 模型
        """
        embedding_model_type = "shutian_qwen3_embed"
        try:
            from .model_config_loader import get_model_for_function
            model_name = get_model_for_function("embedding")
            if model_name:
                embedding_model_type = model_name
                logger.debug(f"从 model_setting.yaml 读取embedding模型: {embedding_model_type}")
        except Exception as e:
            logger.debug(f"从 model_setting.yaml 读取embedding配置失败: {e}")

        logger.info(f"正在初始化Embedding模型，模型类型: {embedding_model_type}")

        # 检查缓存
        cache_key = f"embed_{embedding_model_type}"
        if cache_key in self._model_cache:
            logger.info(f"使用缓存的Embedding模型: {embedding_model_type}")
            return self._model_cache[cache_key]

        model = None

        try:
            if embedding_model_type == "siliconflow_embed":
                model = self._get_siliconflow_embedding_model()
            elif embedding_model_type == "shutian_qwen3_embed":
                model = self._get_shutian_qwen3_embed()
            else:
                # 默认返回蜀天Embedding模型
                logger.warning(f"未知的Embedding模型类型 '{embedding_model_type}'，使用默认蜀天Embedding")
                model = self._get_shutian_qwen3_embed()

            if model:
                self._model_cache[cache_key] = model
                logger.info(f"Embedding模型初始化完成: {embedding_model_type}")
                return model
            else:
                raise ModelAPIError(f"Embedding模型初始化返回None: {embedding_model_type}")

        except (ModelConnectionError, Exception) as e:
            logger.error(f"获取Embedding模型失败 [{embedding_model_type}]: {e}")
            raise ModelConnectionError(f"无法初始化Embedding模型服务: {e}")

    def _get_doubao_model(self):
        """
        获取豆包模型

        Returns:
            ChatOpenAI: 配置好的豆包模型实例
        """
        try:
            doubao_url = self.config.get("doubao", "DOUBAO_SERVER_URL")
            doubao_model_id = self.config.get("doubao", "DOUBAO_MODEL_ID")
            doubao_api_key = self.config.get("doubao", "DOUBAO_API_KEY")

            # 验证配置完整性
            if not all([doubao_url, doubao_model_id, doubao_api_key]):
                missing = []
                if not doubao_url:
                    missing.append("DOUBAO_SERVER_URL")
                if not doubao_model_id:
                    missing.append("DOUBAO_MODEL_ID")
                if not doubao_api_key:
                    missing.append("DOUBAO_API_KEY")
                raise ModelConfigError(f"豆包模型配置不完整，缺少: {', '.join(missing)}")

            # 检查连接
            if not self._check_connection(doubao_url, doubao_api_key):
                logger.warning(f"豆包模型服务连接失败: {doubao_url}")
                raise ModelConnectionError(f"无法连接到豆包模型服务: {doubao_url}")

            llm = ChatOpenAI(
                base_url=doubao_url,
                model=doubao_model_id,
                api_key=doubao_api_key,
                temperature=0.7,
                timeout=self.request_timeout,
                extra_body={
                    "enable_thinking": False,
                })

            logger.info(f"豆包模型初始化成功: {doubao_model_id}")
            return llm

        except ModelConfigError:
            raise
        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"豆包模型初始化异常: {e}")
            return self._handle_model_error("doubao", error)

    def _get_qwen_model(self):
        """
        获取通义千问模型

        Returns:
            ChatOpenAI: 配置好的通义千问模型实例
        """
        try:
            qwen_url = self.config.get("qwen", "QWEN_SERVER_URL")
            qwen_model_id = self.config.get("qwen", "QWEN_MODEL_ID")
            qwen_api_key = self.config.get("qwen", "QWEN_API_KEY")

            # 验证配置完整性
            if not all([qwen_url, qwen_model_id, qwen_api_key]):
                missing = []
                if not qwen_url:
                    missing.append("QWEN_SERVER_URL")
                if not qwen_model_id:
                    missing.append("QWEN_MODEL_ID")
                if not qwen_api_key:
                    missing.append("QWEN_API_KEY")
                raise ModelConfigError(f"通义千问模型配置不完整，缺少: {', '.join(missing)}")

            # 检查连接
            if not self._check_connection(qwen_url, qwen_api_key):
                logger.warning(f"通义千问模型服务连接失败: {qwen_url}")
                raise ModelConnectionError(f"无法连接到通义千问模型服务: {qwen_url}")

            llm = ChatOpenAI(
                base_url=qwen_url,
                model=qwen_model_id,
                api_key=qwen_api_key,
                temperature=0.7,
                timeout=self.request_timeout,
                extra_body={
                    "enable_thinking": False,
                })

            logger.info(f"通义千问模型初始化成功: {qwen_model_id}")
            return llm

        except ModelConfigError:
            raise
        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"通义千问模型初始化异常: {e}")
            return self._handle_model_error("qwen", error)

    def _get_deepseek_model(self):
        """
        获取DeepSeek模型

        Returns:
            ChatOpenAI: 配置好的DeepSeek模型实例
        """
        try:
            deepseek_url = self.config.get("deepseek", "DEEPSEEK_SERVER_URL")
            deepseek_model_id = self.config.get("deepseek", "DEEPSEEK_MODEL_ID")
            deepseek_api_key = self.config.get("deepseek", "DEEPSEEK_API_KEY")

            # 验证配置完整性
            if not all([deepseek_url, deepseek_model_id, deepseek_api_key]):
                missing = []
                if not deepseek_url:
                    missing.append("DEEPSEEK_SERVER_URL")
                if not deepseek_model_id:
                    missing.append("DEEPSEEK_MODEL_ID")
                if not deepseek_api_key:
                    missing.append("DEEPSEEK_API_KEY")
                raise ModelConfigError(f"DeepSeek模型配置不完整，缺少: {', '.join(missing)}")

            # 检查连接
            if not self._check_connection(deepseek_url, deepseek_api_key):
                logger.warning(f"DeepSeek模型服务连接失败: {deepseek_url}")
                raise ModelConnectionError(f"无法连接到DeepSeek模型服务: {deepseek_url}")

            llm = ChatOpenAI(
                base_url=deepseek_url,
                model=deepseek_model_id,
                api_key=deepseek_api_key,
                temperature=0.7,
                timeout=self.request_timeout,
                extra_body={
                    "enable_thinking": False,
                })

            logger.info(f"DeepSeek模型初始化成功: {deepseek_model_id}")
            return llm

        except ModelConfigError:
            raise
        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"DeepSeek模型初始化异常: {e}")
            return self._handle_model_error("deepseek", error)

    def _get_lq_qwen3_8b_model(self):
        """
        获取本地Qwen3-8B-Instruct模型

        Returns:
            ChatOpenAI: 配置好的本地Qwen3-8B模型实例
        """
        try:
            server_url = self.config.get("lq_qwen3_8b", "QWEN_LOCAL_1_5B_SERVER_URL", "http://192.168.91.253:9002/v1")
            model_id = self.config.get("lq_qwen3_8b", "QWEN_LOCAL_1_5B_MODEL_ID", "Qwen3-8B")
            api_key = self.config.get("lq_qwen3_8b", "QWEN_LOCAL_1_5B_API_KEY", "dummy")

            if not all([server_url, model_id]):
                raise ModelConfigError("本地Qwen3-8B模型配置不完整")

            if not self._check_connection(server_url, api_key, timeout=3):
                logger.warning(f"本地Qwen3-8B模型服务连接失败: {server_url}")
                raise ModelConnectionError(f"无法连接到本地Qwen3-8B模型服务: {server_url}")

            llm = ChatOpenAI(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
            )

            logger.info(f"本地Qwen3-8B模型初始化成功: {model_id}")
            return llm

        except ModelConfigError:
            raise
        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"本地Qwen3-8B模型初始化异常: {e}")
            return self._handle_model_error("lq_qwen3_8b", error)

    def _get_lq_qwen3_8b_lora_model(self):
        """
        获取本地Qwen3-8B-lq-lora模型

        Returns:
            ChatOpenAI: 配置好的本地Qwen3-8B-lq-lora模型实例
        """
        try:
            server_url = self.config.get("lq_qwen3_8B_lora", "LQ_QWEN3_8B_LQ_LORA_SERVER_URL")
            model_id = self.config.get("lq_qwen3_8B_lora", "LQ_QWEN3_8B_LQ_LORA_MODEL_ID")
            api_key = self.config.get("lq_qwen3_8B_lora", "LQ_QWEN3_8B_LQ_LORA_API_KEY", "dummy")

            # 验证配置完整性
            if not all([server_url, model_id]):
                missing = []
                if not server_url:
                    missing.append("LQ_QWEN3_8B_LQ_LORA_SERVER_URL")
                if not model_id:
                    missing.append("LQ_QWEN3_8B_LQ_LORA_MODEL_ID")
                raise ModelConfigError(f"本地Qwen3-8B-lq-lora模型配置不完整，缺少: {', '.join(missing)}")

            # 检查本地服务连接
            if not self._check_connection(server_url, api_key, timeout=3):
                logger.warning(f"本地Qwen3-8B-lq-lora模型服务连接失败: {server_url}")
                raise ModelConnectionError(f"无法连接到本地Qwen3-8B-lq-lora模型服务: {server_url}")

            llm = ChatOpenAI(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
            )

            logger.info(f"本地Qwen3-8B-lq-lora模型初始化成功: {model_id}")
            return llm

        except ModelConfigError:
            raise
        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"本地Qwen3-8B-lq-lora模型初始化异常: {e}")
            return self._handle_model_error("lq_qwen3_8b_lora", error)

    def _get_lq_qwen3_4b_model(self):
        """
        获取本地Qwen3-4B-Instruct模型

        Returns:
            ChatOpenAI: 配置好的本地Qwen3-4B模型实例
        """
        try:
            server_url = self.config.get("lq_qwen3_4b", "QWEN_LOCAL_1_5B_SERVER_URL", "http://192.168.91.253:9001/v1")
            model_id = self.config.get("lq_qwen3_4b", "QWEN_LOCAL_1_5B_MODEL_ID", "Qwen3-4B")
            api_key = self.config.get("lq_qwen3_4b", "QWEN_LOCAL_1_5B_API_KEY", "dummy")

            if not all([server_url, model_id]):
                raise ModelConfigError("本地Qwen3-4B模型配置不完整")

            if not self._check_connection(server_url, api_key, timeout=3):
                logger.warning(f"本地Qwen3-4B模型服务连接失败: {server_url}")
                raise ModelConnectionError(f"无法连接到本地Qwen3-4B模型服务: {server_url}")

            llm = ChatOpenAI(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
            )

            logger.info(f"本地Qwen3-4B模型初始化成功: {model_id}")
            return llm

        except ModelConfigError:
            raise
        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"本地Qwen3-4B模型初始化异常: {e}")
            return self._handle_model_error("lq_qwen3_4b", error)

    def _get_qwen_local_14b_model(self):
        """
        获取本地Qwen3-14B-Instruct模型

        Returns:
            ChatOpenAI: 配置好的本地Qwen3-14B模型实例
        """
        try:
            server_url = self.config.get("qwen_local_14b", "QWEN_LOCAL_14B_SERVER_URL", "http://192.168.91.253:9003/v1")
            model_id = self.config.get("qwen_local_14b", "QWEN_LOCAL_14B_MODEL_ID", "Qwen3-14B")
            api_key = self.config.get("qwen_local_14b", "QWEN_LOCAL_14B_API_KEY", "dummy")

            if not all([server_url, model_id]):
                raise ModelConfigError("本地Qwen3-14B模型配置不完整")

            if not self._check_connection(server_url, api_key, timeout=3):
                logger.warning(f"本地Qwen3-14B模型服务连接失败: {server_url}")
                raise ModelConnectionError(f"无法连接到本地Qwen3-14B模型服务: {server_url}")

            llm = ChatOpenAI(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
            )

            logger.info(f"本地Qwen3-14B模型初始化成功: {model_id}")
            return llm

        except ModelConfigError:
            raise
        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"本地Qwen3-14B模型初始化异常: {e}")
            return self._handle_model_error("qwen_local_14b", error)

    def _get_qwen3_5_35b_a3b_model(self):
        """
        获取 DashScope Qwen3.5-35B-A3B 模型

        Returns:
            ChatOpenAI: 配置好的 DashScope Qwen3.5-35B-A3B 模型实例
        """
        try:
            url = self.config.get("qwen3_5_35b_a3b", "DASHSCOPE_SERVER_URL")
            model_id = self.config.get("qwen3_5_35b_a3b", "DASHSCOPE_MODEL_ID")
            api_key = self.config.get("qwen3_5_35b_a3b", "DASHSCOPE_API_KEY")

            # 验证配置完整性
            if not all([url, model_id, api_key]):
                missing = []
                if not url:
                    missing.append("DASHSCOPE_SERVER_URL")
                if not model_id:
                    missing.append("DASHSCOPE_MODEL_ID")
                if not api_key:
                    missing.append("DASHSCOPE_API_KEY")
                raise ModelConfigError(f"DashScope Qwen3.5-35B 模型配置不完整，缺少: {', '.join(missing)}")

            llm = ChatOpenAI(
                base_url=url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
                extra_body={
                    "chat_template_kwargs": {"enable_thinking": False}
                }
            )

            logger.info(f"DashScope Qwen3.5-35B 模型初始化成功: {model_id} (思考模式: 关闭)")
            return llm
        except ModelConfigError:
            raise
        except Exception as e:
            return self._handle_model_error("qwen3_5_35b_a3b", ModelAPIError(str(e)))

    def _get_qwen3_5_27b_model(self):
        """
        获取 DashScope Qwen3.5-27B 模型

        Returns:
            ChatOpenAI: 配置好的 DashScope Qwen3.5-27B 模型实例
        """
        try:
            url = self.config.get("qwen3_5_27b", "DASHSCOPE_SERVER_URL")
            model_id = self.config.get("qwen3_5_27b", "DASHSCOPE_MODEL_ID")
            api_key = self.config.get("qwen3_5_27b", "DASHSCOPE_API_KEY")

            # 验证配置完整性
            if not all([url, model_id, api_key]):
                missing = []
                if not url:
                    missing.append("DASHSCOPE_SERVER_URL")
                if not model_id:
                    missing.append("DASHSCOPE_MODEL_ID")
                if not api_key:
                    missing.append("DASHSCOPE_API_KEY")
                raise ModelConfigError(f"DashScope Qwen3.5-27B 模型配置不完整，缺少: {', '.join(missing)}")

            llm = ChatOpenAI(
                base_url=url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
                extra_body={
                    "chat_template_kwargs": {"enable_thinking": False}
                }
            )

            logger.info(f"DashScope Qwen3.5-27B 模型初始化成功: {model_id} (思考模式: 关闭)")
            return llm
        except ModelConfigError:
            raise
        except Exception as e:
            return self._handle_model_error("qwen3_5_27b", ModelAPIError(str(e)))

    def _get_qwen3_5_122b_a10b_model(self):
        """
        获取 DashScope Qwen3.5-122B-A10B 模型

        Returns:
            ChatOpenAI: 配置好的 DashScope Qwen3.5-122B-A10B 模型实例
        """
        try:
            url = self.config.get("qwen3_5_122b_a10b", "DASHSCOPE_SERVER_URL")
            model_id = self.config.get("qwen3_5_122b_a10b", "DASHSCOPE_MODEL_ID")
            api_key = self.config.get("qwen3_5_122b_a10b", "DASHSCOPE_API_KEY")

            # 验证配置完整性
            if not all([url, model_id, api_key]):
                missing = []
                if not url:
                    missing.append("DASHSCOPE_SERVER_URL")
                if not model_id:
                    missing.append("DASHSCOPE_MODEL_ID")
                if not api_key:
                    missing.append("DASHSCOPE_API_KEY")
                raise ModelConfigError(f"DashScope Qwen3.5-122B 模型配置不完整，缺少: {', '.join(missing)}")

            llm = ChatOpenAI(
                base_url=url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
                extra_body={
                    "chat_template_kwargs": {"enable_thinking": False}
                }
            )

            logger.info(f"DashScope Qwen3.5-122B 模型初始化成功: {model_id} (思考模式: 关闭)")
            return llm
        except ModelConfigError:
            raise
        except Exception as e:
            return self._handle_model_error("qwen3_5_122b_a10b", ModelAPIError(str(e)))

    def _get_siliconflow_embedding_model(self):
        """
        获取硅基流动Qwen3-Embedding-8B嵌入模型

        Returns:
            OpenAIEmbeddings: 配置好的硅基流动Qwen3-Embedding-8B嵌入模型实例
        """
        try:
            server_url = self.config.get("siliconflow_embed", "SLCF_EMBED_SERVER_URL")
            api_key = self.config.get("siliconflow_embed", "SLCF_EMBED_API_KEY")
            model_id = self.config.get("siliconflow_embed", "SLCF_EMBED_MODEL_ID", "Qwen/Qwen3-Embedding-8B")
            dimensions = self.config.get("siliconflow_embed", "SLCF_EMBED_DIMENSIONS", "4096")

            # 验证配置完整性
            if not all([server_url, api_key, model_id]):
                missing = []
                if not server_url:
                    missing.append("SLCF_EMBED_SERVER_URL")
                if not api_key:
                    missing.append("SLCF_EMBED_API_KEY")
                if not model_id:
                    missing.append("SLCF_EMBED_MODEL_ID")
                raise ModelConfigError(f"硅基流动Embedding模型配置不完整，缺少: {', '.join(missing)}")

            # 检查连接
            if not self._check_connection(server_url, api_key):
                logger.warning(f"硅基流动Embedding模型服务连接失败: {server_url}")
                raise ModelConnectionError(f"无法连接到硅基流动Embedding模型服务: {server_url}")

            # 使用 langchain_openai 的 OpenAIEmbeddings
            embeddings = OpenAIEmbeddings(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                timeout=self.request_timeout,
                tiktoken_enabled=False,
                check_embedding_ctx_length=False,
                max_retries=0,  # 禁用SDK内置重试，由EmbeddingClient统一管理
            )

            logger.info(f"硅基流动Embedding模型初始化成功: {model_id} (dimensions: {dimensions})")
            return embeddings

        except ModelConfigError:
            raise
        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"硅基流动Embedding模型初始化异常: {e}")
            return self._handle_model_error("siliconflow_embed", error)

    def _get_shutian_qwen3_5_122b_model(self):
        """
        获取蜀天Qwen3.5-122B-A10B模型

        Returns:
            ChatOpenAI: 配置好的蜀天Qwen3.5-122B模型实例
        """
        try:
            server_url = self.config.get("shutian", "SHUTIAN_122B_SERVER_URL", "http://183.220.37.46:25423/v1")
            model_id = self.config.get("shutian", "SHUTIAN_122B_MODEL_ID", "/model/Qwen3.5-122B-A10B")
            api_key = self.config.get("shutian", "SHUTIAN_122B_API_KEY", "lq123456")

            # 检查服务连接
            if not self._check_connection(server_url, api_key, timeout=3):
                logger.warning(f"蜀天Qwen3.5-122B模型服务连接失败: {server_url}")
                raise ModelConnectionError(f"无法连接到蜀天Qwen3.5-122B模型服务: {server_url}")

            llm = ChatOpenAI(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
            )

            logger.info(f"蜀天Qwen3.5-122B模型初始化成功: {model_id}")
            return llm

        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"蜀天Qwen3.5-122B模型初始化异常: {e}")
            return self._handle_model_error("shutian_qwen3_5_122b", error)

    def _get_shutian_qwen3_8b_model(self):
        """
        获取蜀天Qwen3-8B模型

        Returns:
            ChatOpenAI: 配置好的蜀天Qwen3-8B模型实例
        """
        try:
            server_url = self.config.get("shutian", "SHUTIAN_8B_SERVER_URL", "http://183.220.37.46:25424/v1")
            model_id = self.config.get("shutian", "SHUTIAN_8B_MODEL_ID", "/model/Qwen3-8B")
            api_key = self.config.get("shutian", "SHUTIAN_8B_API_KEY", "lq123456")

            # 检查服务连接
            if not self._check_connection(server_url, api_key, timeout=3):
                logger.warning(f"蜀天Qwen3-8B模型服务连接失败: {server_url}")
                raise ModelConnectionError(f"无法连接到蜀天Qwen3-8B模型服务: {server_url}")

            llm = ChatOpenAI(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
            )

            logger.info(f"蜀天Qwen3-8B模型初始化成功: {model_id}")
            return llm

        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"蜀天Qwen3-8B模型初始化异常: {e}")
            return self._handle_model_error("shutian_qwen3_8b", error)

    def _get_shutian_qwen3_6_27b_model(self):
        """
        获取蜀天Qwen3.6-27B模型

        Returns:
            ChatOpenAI: 配置好的蜀天Qwen3.6-27B模型实例
        """
        try:
            server_url = self.config.get("shutian", "SHUTIAN_27B_SERVER_URL", "http://183.220.37.46:25424/v1")
            model_id = self.config.get("shutian", "SHUTIAN_27B_MODEL_ID", "/model/Qwen3.6-27B")
            api_key = self.config.get("shutian", "SHUTIAN_27B_API_KEY", "sk_prod_SELVoIV1d3gku28koH_ONg8L_B2cQis__71f55615")

            # 检查服务连接
            if not self._check_connection(server_url, api_key, timeout=3):
                logger.warning(f"蜀天Qwen3.6-27B模型服务连接失败: {server_url}")
                raise ModelConnectionError(f"无法连接到蜀天Qwen3.6-27B模型服务: {server_url}")

            llm = ChatOpenAI(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
            )

            logger.info(f"蜀天Qwen3.6-27B模型初始化成功: {model_id}")
            return llm

        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"蜀天Qwen3.6-27B模型初始化异常: {e}")
            return self._handle_model_error("shutian_qwen3_6_27b", error)

    def _get_shutian_qwen3_5_35b_model(self):
        """
        获取蜀天Qwen3.5-35B模型

        Returns:
            ChatOpenAI: 配置好的蜀天Qwen3.5-35B模型实例
        """
        try:
            server_url = self.config.get("shutian", "SHUTIAN_35B_SERVER_URL", "http://183.220.37.46:25427/v1")
            model_id = self.config.get("shutian", "SHUTIAN_35B_MODEL_ID", "/model/Qwen3.5-35B")
            api_key = self.config.get("shutian", "SHUTIAN_35B_API_KEY", "lq123456")

            logger.info(f"正在初始化蜀天Qwen3.5-35B模型，服务器地址: {server_url}")

            # 检查服务连接（可通过配置禁用）
            skip_check = self.config.get("shutian", "SKIP_CONNECTION_CHECK", "false").lower() == "true"
            if not skip_check:
                connection_ok = self._check_connection(server_url, api_key, timeout=5)
                if not connection_ok:
                    # 连接检查失败时记录警告，但不阻止初始化（实际调用时如果失败会报错）
                    logger.warning(f"蜀天Qwen3.5-35B模型服务连接检查失败: {server_url}，但仍尝试初始化")
                else:
                    logger.info(f"蜀天Qwen3.5-35B模型服务连接检查通过: {server_url}")
            else:
                logger.info(f"跳过蜀天Qwen3.5-35B模型连接检查（SKIP_CONNECTION_CHECK=true）")

            llm = ChatOpenAI(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                temperature=0.7,
                timeout=self.request_timeout,
            )

            # 记录模型实例的详细信息用于调试
            logger.info(f"蜀天Qwen3.5-35B模型初始化成功: model_id={model_id}, base_url={llm.base_url if hasattr(llm, 'base_url') else server_url}")
            return llm

        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"蜀天Qwen3.5-35B模型初始化异常: {e}")
            return self._handle_model_error("shutian_qwen3_5_35b", error)

    def _get_shutian_qwen3_embed(self):
        """
        获取蜀天Qwen3-Embedding-8B嵌入模型

        Returns:
            OpenAIEmbeddings: 配置好的蜀天Embedding模型实例
        """
        try:
            server_url = self.config.get("shutian", "SHUTIAN_EMBED_SERVER_URL", "http://183.220.37.46:25425/v1")
            model_id = self.config.get("shutian", "SHUTIAN_EMBED_MODEL_ID", "/model/Qwen3-Embedding-8B")
            api_key = self.config.get("shutian", "SHUTIAN_EMBED_API_KEY", "lq123456")

            # 检查服务连接
            if not self._check_connection(server_url, api_key, timeout=3):
                logger.warning(f"蜀天Qwen3-Embedding模型服务连接失败: {server_url}")
                raise ModelConnectionError(f"无法连接到蜀天Qwen3-Embedding模型服务: {server_url}")

            embeddings = OpenAIEmbeddings(
                base_url=server_url,
                model=model_id,
                api_key=api_key,
                timeout=self.request_timeout,
                tiktoken_enabled=False,
                check_embedding_ctx_length=False,
                max_retries=0,  # 禁用SDK内置重试，由EmbeddingClient统一管理
            )

            logger.info(f"蜀天Qwen3-Embedding-8B模型初始化成功: {model_id}")
            return embeddings

        except ModelConnectionError:
            raise
        except Exception as e:
            error = ModelAPIError(f"蜀天Qwen3-Embedding模型初始化异常: {e}")
            return self._handle_model_error("shutian_qwen3_embed", error)


# 创建全局实例
model_handler = ModelHandler()

def get_models():
    """
    获取模型的全局函数

    Returns:
        tuple: (llm, chat, embed) - LLM模型、聊天模型和嵌入模型实例
               注意：当前llm和chat使用相同模型实例，embed暂时返回None

    Note:
        这是一个便捷函数，直接使用全局model_handler实例获取模型
    """
    try:
        llm = model_handler.get_models()
        # 暂时返回相同的模型作为chat和embed
        return llm, llm, None
    except Exception as e:
        logger.error(f"获取模型失败: {e}")
        raise ModelConnectionError(f"无法获取模型服务: {e}")