[知识进化] 工作流瓶颈自动检测 — 统计分析节点耗时/失败率 #62

Closed
opened 2026-05-10 15:32:18 +08:00 by admin · 0 comments
Owner

目标

自动分析工作流执行数据,发现经常卡住的节点,给出优化建议。

检测指标

  • 节点平均耗时(P50/P95/P99)
  • 节点失败率
  • 节点重试率
  • 节点间等待时间
  • 资源消耗(LLM token 用量、工具调用次数)

瓶颈判定规则

  • 某节点 P95 耗时 > 所有节点平均 P95 的 3 倍 → 瓶颈节点
  • 某节点失败率 > 20% → 问题节点
  • 某节点工具调用次数 > 10 → 效率低下

输出

  • 瓶颈节点列表(按严重程度排序)
  • 优化建议(拆分子任务 / 更换模型 / 增加超时 / 添加重试)

新增文件

  • backend/app/services/bottleneck_detector.py
  • Celery 定时:每天凌晨分析昨日数据
  • 前端:工作流详情页新增瓶颈分析 tab
## 目标 自动分析工作流执行数据,发现经常卡住的节点,给出优化建议。 ## 检测指标 - 节点平均耗时(P50/P95/P99) - 节点失败率 - 节点重试率 - 节点间等待时间 - 资源消耗(LLM token 用量、工具调用次数) ## 瓶颈判定规则 - 某节点 P95 耗时 > 所有节点平均 P95 的 3 倍 → 瓶颈节点 - 某节点失败率 > 20% → 问题节点 - 某节点工具调用次数 > 10 → 效率低下 ## 输出 - 瓶颈节点列表(按严重程度排序) - 优化建议(拆分子任务 / 更换模型 / 增加超时 / 添加重试) ## 新增文件 - backend/app/services/bottleneck_detector.py - Celery 定时:每天凌晨分析昨日数据 - 前端:工作流详情页新增瓶颈分析 tab
admin closed this issue 2026-05-10 17:58:11 +08:00
Sign in to join this conversation.
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: admin/aiagent#62