| 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182 |
- """
- Celery任务定义
- 只负责任务调度,具体业务逻辑由WorkflowManager处理
- """
- from celery import current_task
- from .celery_app import app
- from core.base.workflow_manager import WorkflowManager
- from foundation.logger.loggering import server_logger as logger
- from foundation.utils.time_statistics import track_execution_time
- @app.task(bind=True)
- def submit_task_processing_task(self, file_info: dict):
- """
- 提交任务处理到Celery队列
- 这个任务只负责调用WorkflowManager,不包含业务逻辑
- """
- import traceback
- # 添加调试信息
- logger.info("=== Celery任务接收调试 ===")
- logger.info(f"任务ID: {self.request.id}")
- logger.info(f"文件ID: {file_info.get('file_id')}")
- logger.info(f"回调任务ID: {file_info.get('callback_task_id')}")
- logger.info("=== 任务接收调用栈 ===")
- for line in traceback.format_stack():
- logger.debug(f" {line.strip()}")
- logger.info("=== 调用栈结束 ===")
- try:
- # 更新任务状态 - 开始处理
- self.update_state(
- state='PROGRESS',
- meta={
- 'current': 0,
- 'total': 100,
- 'status': '开始处理文档',
- 'file_id': file_info.get('file_id')
- }
- )
- logger.info(f"开始执行业务逻辑,文件ID: {file_info.get('file_id')}")
- # 创建独立的WorkflowManager实例执行业务逻辑
- workflow_manager = WorkflowManager(
- max_concurrent_docs=1, # Celery worker中单任务执行
- max_concurrent_reviews=5
- )
- # 同步执行(Celery worker本身就是独立的进程)
- result = workflow_manager.submit_task_processing_sync(file_info)
- # 更新任务状态 - 完成
- self.update_state(
- state='PROGRESS',
- meta={
- 'current': 100,
- 'total': 100,
- 'status': '处理完成',
- 'file_id': file_info.get('file_id')
- }
- )
- return {
- 'status': 'success',
- 'file_id': file_info.get('file_id'),
- 'callback_task_id': file_info.get('callback_task_id'),
- 'result': result
- }
- except Exception as e:
- # 记录错误并重试
- logger.error(f"任务处理失败: {str(e)}")
- logger.exception("详细错误信息:")
- # 自动重试,延迟60秒,最多重试2次
- self.retry(countdown=60, max_retries=2, exc=e)
- raise
|