[DevOps] Prometheus + Grafana 指标监控 #15

Closed
opened 2026-05-05 01:01:31 +08:00 by admin · 0 comments
Owner

背景

系统缺少业务和基础设施指标采集与可视化。

需求

  1. FastAPI 集成 prometheus_fastapi_instrumentator 暴露 /metrics
  2. Celery 集成 prometheus 指标导出
  3. Grafana Dashboard:API 延迟分布、QPS、错误率、Celery 队列长度
  4. 告警规则:延迟 > 2s、错误率 > 5%

涉及模块

  • backend/app/main.py — 挂载 metrics 端点
  • backend/docker-compose.prod.yml — 增加 prometheus/grafana 服务

优先级

中 — 运维可视化

## 背景 系统缺少业务和基础设施指标采集与可视化。 ## 需求 1. FastAPI 集成 prometheus_fastapi_instrumentator 暴露 `/metrics` 2. Celery 集成 prometheus 指标导出 3. Grafana Dashboard:API 延迟分布、QPS、错误率、Celery 队列长度 4. 告警规则:延迟 > 2s、错误率 > 5% ## 涉及模块 - backend/app/main.py — 挂载 metrics 端点 - backend/docker-compose.prod.yml — 增加 prometheus/grafana 服务 ## 优先级 中 — 运维可视化
admin self-assigned this 2026-05-05 01:01:31 +08:00
admin closed this issue 2026-05-10 14:42:29 +08:00
Sign in to join this conversation.
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: admin/aiagent#15