tasks.py 5.4 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162
  1. """
  2. Celery任务定义
  3. 只负责任务调度,具体业务逻辑由WorkflowManager处理
  4. """
  5. from celery import current_task
  6. from .celery_app import app
  7. from core.base.workflow_manager import WorkflowManager
  8. from foundation.observability.logger.loggering import review_logger, write_logger
  9. from foundation.observability.monitoring.time_statistics import track_execution_time
  10. @app.task(bind=True)
  11. def submit_task_processing_task(self, file_info: dict, _system_trace_id: str = None):
  12. """
  13. 提交任务处理到Celery队列
  14. 这个任务只负责调用WorkflowManager,不包含业务逻辑
  15. """
  16. import traceback
  17. logger = review_logger # 使用审查模块专用logger
  18. # 恢复trace_id上下文
  19. if _system_trace_id:
  20. from foundation.infrastructure.tracing import TraceContext
  21. TraceContext.set_trace_id(_system_trace_id)
  22. logger.info(f"Celery任务恢复")
  23. # 添加调试信息
  24. logger.info("=== Celery任务接收调试 ===")
  25. logger.info(f"队列ID: {self.request.id}")
  26. logger.info(f"文件ID: {file_info.get('file_id')}")
  27. logger.info(f"回调任务ID: {file_info.get('callback_task_id')}")
  28. logger.info("=== 任务接收调用栈 ===")
  29. for line in traceback.format_stack():
  30. logger.debug(f" {line.strip()}")
  31. logger.info("=== 调用栈结束 ===")
  32. try:
  33. # 更新任务状态 - 开始处理
  34. self.update_state(
  35. state='current',
  36. meta={
  37. 'current': 0,
  38. 'total': 100,
  39. 'status': '开始处理文档',
  40. 'file_id': file_info.get('file_id')
  41. }
  42. )
  43. logger.info(f"开始执行业务逻辑,文件ID: {file_info.get('file_id')}")
  44. # 创建独立的WorkflowManager实例执行业务逻辑
  45. workflow_manager = WorkflowManager(
  46. max_concurrent_docs=1, # Celery worker中单任务执行
  47. max_concurrent_reviews=5
  48. )
  49. # 同步执行(Celery worker本身就是独立的进程)
  50. result = workflow_manager.submit_construction_review_task_processing_sync(file_info)
  51. # 更新任务状态 - 完成
  52. self.update_state(
  53. state='current',
  54. meta={
  55. 'current': 100,
  56. 'total': 100,
  57. 'status': '处理完成',
  58. 'file_id': file_info.get('file_id')
  59. }
  60. )
  61. return {
  62. 'status': 'success',
  63. 'file_id': file_info.get('file_id'),
  64. 'callback_task_id': file_info.get('callback_task_id'),
  65. 'result': result
  66. }
  67. except Exception as e:
  68. # 记录错误并重试
  69. logger.error(f"任务处理失败: {str(e)}")
  70. logger.exception("详细错误信息:")
  71. # 自动重试,延迟60秒,最多重试2次
  72. self.retry(countdown=60, max_retries=2, exc=e)
  73. raise
  74. # ==================== 施工方案编写任务 ====================
  75. @app.task(bind=True)
  76. def submit_outline_generation_task(self, task_info: dict, _system_trace_id: str = None):
  77. """
  78. 提交大纲生成任务到 Celery 队列
  79. 这个任务只负责调用 WorkflowManager,不包含业务逻辑
  80. """
  81. import traceback
  82. logger = write_logger # 使用编写模块专用logger
  83. # 恢复 trace_id 上下文
  84. if _system_trace_id:
  85. from foundation.infrastructure.tracing import TraceContext
  86. TraceContext.set_trace_id(_system_trace_id)
  87. logger.info(f"大纲生成 Celery 任务恢复 trace_id: {_system_trace_id}")
  88. logger.info("=== 大纲生成 Celery 任务接收 ===")
  89. logger.info(f"队列ID: {self.request.id}")
  90. logger.info(f"用户ID: {task_info.get('user_id')}")
  91. logger.info(f"项目: {task_info.get('project_info', {}).get('project_name', 'unknown')}")
  92. try:
  93. # 更新任务状态 - 开始处理
  94. self.update_state(
  95. state='current',
  96. meta={
  97. 'current': 0,
  98. 'total': 100,
  99. 'status': '开始生成大纲',
  100. 'callback_task_id': task_info.get('callback_task_id'),
  101. 'project_name': task_info.get('project_info', {}).get('project_name', '')
  102. }
  103. )
  104. logger.info(f"开始执行大纲生成业务逻辑")
  105. # 创建独立的 WorkflowManager 实例执行业务逻辑
  106. workflow_manager = WorkflowManager(
  107. max_concurrent_docs=1, # Celery worker 中单任务执行
  108. max_concurrent_reviews=5
  109. )
  110. # 同步执行
  111. result = workflow_manager.submit_outline_generation_sync(task_info)
  112. # 更新任务状态 - 完成
  113. self.update_state(
  114. state='current',
  115. meta={
  116. 'current': 100,
  117. 'total': 100,
  118. 'status': '大纲生成完成',
  119. 'callback_task_id': result.get('callback_task_id'),
  120. 'overall_task_status': result.get('overall_task_status')
  121. }
  122. )
  123. return {
  124. 'status': 'success',
  125. 'callback_task_id': result.get('callback_task_id'),
  126. 'overall_task_status': result.get('overall_task_status'),
  127. 'result': result
  128. }
  129. except Exception as e:
  130. logger.error(f"大纲生成任务失败: {str(e)}")
  131. logger.exception("详细错误信息:")
  132. # 自动重试,延迟60秒,最多重试2次
  133. self.retry(countdown=60, max_retries=2, exc=e)
  134. raise