2.1 Conceptos Monitoreo

Término Definición operativa
Monitoreo Observación continua y estructurada del estado de sistemas, recursos y servicios.
Supervisión Observación puntual y manual, sin alertas automáticas.
Alerta Notificación generada cuando una condición lógica definida (trigger) se cumple.
Trigger Regla lógica que detecta condiciones anómalas a partir de los datos.
Evento Resultado del disparo de un trigger; representa un problema activo.
Item Métrica que Zabbix recolecta de un host (CPU, RAM, servicio, etc.).
Host Dispositivo, servidor o recurso que se monitorea.
Grupo de hosts (Hostgroup) Conjunto lógico de hosts que comparten categoría (ej. "Producción", "Bases de datos").
Template Paquete de ítems, triggers, gráficas y configuraciones reutilizables.
Agente (Agent) Programa que se instala en el host para recolectar datos.
Agentless Método de monitoreo sin instalar agente, usando protocolos como SNMP, SSH o HTTP.
Polling Técnica donde Zabbix consulta periódicamente al host (modo activo).
Push Técnica donde el host envía datos hacia Zabbix (modo pasivo o vía zabbix_sender).
Zabbix Server Componente central que procesa ítems, triggers, eventos y acciones.
Proxy Nodo intermedio que recolecta datos y los reenvía al Zabbix Server.
Frontend Interfaz gráfica web para consultar datos, problemas, configuraciones y mapas.
Media Type Mecanismo de salida de alertas (correo, Telegram, Webhook, etc.).
Acción (Action) Conjunto de pasos que se ejecutan automáticamente ante un evento (enviar notificación, ejecutar script, etc.). Un evento puede o no tenerlos.
Usuario Cuenta dentro del frontend con permisos definidos.
Grupo de Usuarios Permite organizar usuarios y asignarles accesos a hosts y acciones.
Severidad Nivel de criticidad de un problema (Information, Warning, Average, High, Disaster).
Ítem de bajo nivel Métrica creada dinámicamente (ej. descubrimiento de discos o interfaces).
Discovery Rule Regla que permite detectar automáticamente servicios o recursos del sistema.
Macro Variable reutilizable en plantillas o triggers (ej. {$THRESHOLD_CPU}).
History Registro completo de todos los valores recolectados.
Trends Promedios de valores por hora/día para análisis histórico.
Problem Estado actual de un evento disparado que aún no ha sido resuelto.
Recovery Evento que cierra o resuelve un problema previamente activo.
Dashboard Vista gráfica con paneles de información operativa (KPIs, alertas, consumo, etc.).
Acknowledgement Acción manual del operador que indica que está atendiendo una alerta.
Escalamiento Proceso de pasar un problema a otro nivel de atención si no se resuelve en cierto tiempo.