Estamos buscando un/a Especialista en Observabilidad, Monitorización y Operación de Infraestructuras IT, con experiencia en entornos híbridos (on-premise y cloud), para liderar el diseño, evolución y optimización de nuestras plataformas de observabilidad.
Trabajarás en un entorno altamente técnico, orientado a la mejora continua de la disponibilidad, rendimiento y resiliencia de sistemas críticos, integrando métricas, logs y trazas para una visión end-to-end del ecosistema IT.
Funciones:
- Diseño e implementación de arquitecturas de observabilidad escalables en entornos híbridos.
- Monitorización de sistemas, aplicaciones y servicios críticos.
- Gestión de métricas con Prometheus y visualización avanzada con Grafana (KPIs, SLIs, SLOs).
- Análisis de logs con Elastic Stack (ELK: Elasticsearch, Logstash, Kibana).
- Monitorización corporativa con SCOM y cloud con Azure Monitor.
- Definición y optimización de estrategias de alerting (Alertmanager, correlación de eventos, reducción de ruido).
- Centralización de observabilidad en entornos complejos multitecnología.
- Automatización mediante scripting (Python, PowerShell).
- Infraestructura como Código con Terraform.
- Integración con pipelines CI/CD y control de versiones en GitHub.
- Monitorización en entornos cloud (Azure, AWS, GCP) y contenedores (Docker, Kubernetes).
- Análisis de rendimiento, capacity planning y troubleshooting avanzado.
- Diseño de dashboards operativos y ejecutivos orientados a negocio.
