Flow Docs

❯

❯

6 observability otel

6-observability-otel

Jun 23, 20261 min read

Issue: Osservabilità unificata con OpenTelemetry

Summary

Standardizzare tracing/metrics/logs con OpenTelemetry su tutti i servizi (HTTP + WebSocket) e aggiungere /ready separato da /health.

Motivation / Risk

Correlation-id non basta per tracciare end-to-end; mancano SLO e alert condivisi.
Readiness indistinta può causare deploy con dipendenze non pronte.

Plan

Integrare SDK OTel Node e Python nei servizi; propagare trace-id dal gateway.
Esportare trace/metrics su Prometheus/Grafana o APM scelto.
Aggiungere endpoint /ready che verifica dipendenze critiche (DB/Redis).
Definire SLO (p95 latency, error rate) per gateway, auth, realtime.
Dashboard e alert base.

Acceptance Criteria

Ogni richiesta HTTP/WS ha trace-id visibile in dashboard.
/health e /ready separati; readiness usata nei deployment.
Dashboard con p95 e error rate per almeno gateway e user-service.

Notes / Dependencies

Richiede deploy di collector/Prometheus; coordinare con Platform.
Aggiungere sampling configurabile per ambienti.

Graph View

Issue: Osservabilità unificata con OpenTelemetry
Summary
Motivation / Risk
Plan
Acceptance Criteria
Notes / Dependencies

Backlinks

architecture-issues

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community