Saltar al contenido principal

Política de Performance y Capacidad

Este documento define los umbrales mínimos de desempeño y el criterio de escalamiento por servicio.

1. Supuestos base de carga

EscenarioValor
Usuarios concurrentes pico2,000
RPS pico total350
Distribución pico35% búsqueda, 25% auth, 20% agenda, 10% catálogos, 10% otros
Ventana pico08:00-11:00 y 18:00-21:00

2. Objetivos técnicos por servicio

Serviciop95 objetivoError rate objetivoSaturación objetivo
auth-service< 300ms< 1%CPU < 70%
search-service< 300ms< 1%CPU < 70%, cache hit > 80%
appointments-service< 400ms< 1%lock contention < 5%
availability-service< 300ms< 1%DB slow queries < 2%
notification-service< 2000ms< 2%dlq_depth = 0 sostenido
catalog-service< 250ms lecturas< 1%cache invalidation < 500ms

3. Criterios de escalado

RecursoTrigger scale-outTrigger scale-inCooldown
ECS servicio APICPU > 65% o p95 fuera de SLO 5 minCPU < 35% por 15 min5 min
Worker notificacionesqueue_depth > 100 por 3 minqueue_depth < 20 por 10 min5 min
Redisevictions > 0 o memory > 75%memory < 55% por 30 min15 min
RDS read replicasCPU reader > 70% por 10 minCPU reader < 40% por 30 min15 min

4. Presupuesto de performance por endpoint

EndpointPresupuesto totalAPI layerDB/cacheIntegraciones
POST /auth/login300 ms80 ms170 ms50 ms
GET /search/doctors300 ms60 ms220 ms20 ms
POST /appointments400 ms90 ms260 ms50 ms
POST /notifications/send2000 ms100 ms100 ms1800 ms

5. Pruebas de capacidad obligatorias

  • Smoke perf por PR crítico: 5 min, carga media.
  • Load test semanal en staging: 30 min, carga objetivo.
  • Stress test mensual: hasta 2x pico esperado.
  • Soak test mensual: 4 h con carga estable.

6. Criterios de aceptación de performance

  • p95 y error rate dentro de objetivo por servicio.
  • No degradación mayor a 10% contra baseline anterior.
  • Alertas y dashboards actualizados con nuevos umbrales.
  • Plan de tuning y owner definidos si no se cumple objetivo.