Entender que el monitoreo no es una única actividad, sino un conjunto de capas complementarias, cada una enfocada en observar un aspecto distinto del ecosistema tecnológico. Una operación madura debe integrar varios tipos de monitoreo para lograr una visión completa.
Supervisa la salud física y lógica de los componentes base que sustentan todos los sistemas: servidores, almacenamiento, hipervisores, sistemas operativos.
Elemento observado | Ejemplos de métricas |
---|---|
Servidores físicos | Temperatura, uso de CPU, fallos de disco |
Máquinas virtuales | Consumo de RAM, carga de CPU, swap |
Sistemas operativos | Procesos, espacio en disco, uso de red |
Almacenamiento (SAN/NAS) | Latencia, IOPS, capacidad disponible |
Energía/clima (opcional) | UPS, sensores de temperatura, humedad |
Objetivo: detectar fallos en la base tecnológica antes de que impacten servicios.
Vigila el estado, disponibilidad y desempeño de la comunicación entre componentes: switches, routers, enlaces WAN, VPNs, firewalls.
Elemento observado | Ejemplos de métricas |
---|---|
Switches/routers | Ping, latencia, pérdida de paquetes |
Interfaces de red | Ancho de banda, errores CRC, congestión |
Enlaces externos | Disponibilidad de ISPs, VPNs, MPLS |
DNS/DHCP/NAT | Tiempo de resolución, errores de asignación |
Objetivo: anticipar caídas de red, cuellos de botella o fallos de conectividad.
Evalúa la disponibilidad y estado lógico/funcional de servicios que dan valor directo a usuarios o sistemas (ej: base de datos, correo, autenticación, web).
Servicio típico | Indicadores clave |
---|---|
Base de datos (DB) | Tiempo de conexión, queries fallidas |
Correo (SMTP/IMAP) | Envíos exitosos, puertos abiertos |
Autenticación (LDAP/AD) | Tiempo de respuesta, rechazos |
Servicios web (HTTP) | Códigos 200/500, tiempo de carga |
Objetivo: saber si el servicio responde y funciona como se espera, no solo si el servidor está encendido.
Observa el comportamiento interno de una aplicación en ejecución: uso de recursos, errores lógicos, métricas personalizadas, estado de dependencias.
Aplicación observada | Ejemplos de monitoreo |
---|---|
App web interna | Errores 500, tiempos de respuesta por ruta |
Microservicios | Estado de health checks, consumo de APIs |
ERP/SaaS | Integraciones fallidas, cargas lentas |
Objetivo: entender la salud real desde dentro del software, más allá de que esté “encendido”.
Simula acciones reales de un usuario (login, búsqueda, descarga) y mide si el sistema responde como se espera, desde el punto de vista externo.
Simulación típica | Qué valida |
---|---|
Login en portal | Tiempo de carga, autenticación exitosa |
Consulta de un servicio | Resultados correctos, sin errores 500 |
Transacción completa | Flujo de múltiples pasos sin fallos |
Objetivo: validar que la experiencia final del usuario sea funcional, rápida y sin errores, incluso si todos los componentes internos parecen estar bien.
Tipo de monitoreo | ¿Qué mide? | ¿Desde dónde se observa? | Nivel de impacto detectado |
---|---|---|---|
Infraestructura | Recursos base físicos/lógicos | Desde el sistema operativo | Fallos base |
Red | Tráfico y conectividad | Desde interfaces y enlaces | Problemas de comunicación |
Servicios | Disponibilidad de servicios | A nivel lógico del sistema | Interrupciones funcionales |
Aplicaciones | Funcionamiento interno | Dentro del software | Fallos de código o dependencias |
Sintético (usuario) | Experiencia real simulada | Desde el exterior | Problemas percibidos por el usuario |
Un solo tipo de monitoreo no basta.
Por ejemplo: un servidor puede estar encendido (infraestructura), tener red activa (red), responder a pings (servicio), pero su aplicación puede estar fallando internamente (aplicación), o el usuario no puede acceder porque tarda demasiado (sintético).
El operador comprende que cada tipo de monitoreo resuelve un problema distinto, y que una operación completa debe integrarlos todos para garantizar visibilidad total.
¿Puedo describir al menos 3 tipos de monitoreo?
¿Entiendo qué se busca medir en cada uno?
¿Puedo explicar por qué no basta con monitorear solo la infraestructura?
¿Puedo dar un ejemplo en el que cada tipo sea útil?