Talent.com
Esta oferta de trabajo no está disponible en tu país.
SRE Expert (Site Reliability Engineering Expert) - IT

SRE Expert (Site Reliability Engineering Expert) - IT

Mercado LibreBuenos Aires, Argentina
Hace 29 días
Descripción del trabajo

En Mercado Libre estamos democratizando el comercio y los servicios financieros para transformar la vida de las personas de América Latina. ¡Sumate a este propósito!

Imagínate emprendiendo proyectos desafiantes, dinámicos e innovadores y siendo responsable de :

Liderar iniciativas estructurales para mejorar la resiliencia, uptime y escalabilidad, participar en war rooms y postmortems, y guiar procesos de mejora continua.

Diseñar arquitecturas seguras, resilientes y adaptadas al negocio, así como planes de evolución técnica por dominio.

Modelar y priorizar el uptime en función de la criticidad del servicio, evaluando la madurez técnica y estableciendo objetivos estratégicos.

Impulsar prácticas avanzadas de observabilidad e instrumentación personalizada (New Relic, OpenTelemetry, etc.), incluyendo estrategias de trazabilidad y alertamiento eficaz.

Identificar cuellos de botella técnicos mediante profiling y troubleshooting profundo, aplicando criterios de ingeniería de confiabilidad.

Mentorear equipos y líderes técnicos (TLs), promoviendo una cultura sólida de SRE y gobernando patrones de diseño resiliente y mejores prácticas transversales.

Requisitos :

Contar con al menos 5 años de experiencia en desarrollo, con sólidos conocimientos en sistemas distribuidos, microservicios, APIs escalables y arquitecturas cloud.

Demostrar expertise en gestión de uptime, alta disponibilidad y escalabilidad, con un enfoque tanto preventivo como reactivo frente a incidentes, incluyendo respuesta a incidentes y prácticas SRE y experiencia liderando mesas técnicas, iniciativas cross-team o prácticas de chaos engineering.

Liderar procesos de mejora continua y gestión operativa, con habilidades para el análisis de fallas, elaboración de resúmenes ejecutivos, definición de objetivos técnicos y gestión de KPIs.

Manejar herramientas avanzadas de observabilidad y troubleshooting como Datadog, New Relic y Kibana, además de experiencia con event sourcing e ingeniería de confiabilidad.

Diseñar y evolucionar sistemas de observabilidad avanzados, aplicando estrategias de instrumentación personalizada, trazabilidad end-to-end, correlación de métricas técnicas y de negocio, y umbrales efectivos de alertamiento para diagnóstico preciso.

Tecnología es la esencia de nuestro producto. Nuestros equipos de desarrollo, arquitectura, base de datos, user experience, seguridad informática y data & analytics co-crean y son responsables de la plataforma líder de e-commerce de América Latina y de uno de los sitios de mayor tráfico del mundo. En una industria que se reinventa día a día, nuestros equipos son reconocidos por su visión y liderazgo. Desde aplicaciones móviles a machine learning, nuestra innovación tiene un claro foco : simplificarle la vida a quien utiliza nuestros productos.

Te proponemos :

Ser parte de una compañía con espíritu emprendedor en la que nos encanta pensar en grande y a largo plazo.

Ser protagonista de tu desarrollo en un ambiente de oportunidades, aprendizaje, crecimiento, expansión y proyectos desafiantes.

Compartir y aprender en equipo junto a grandes profesionales y especialistas.

Un excelente clima de trabajo, con todo lo necesario para que vivas una gran experiencia. : )

Crear una alerta de empleo para esta búsqueda

Site Reliability Sre • Buenos Aires, Argentina