En Mercado Libre estamos democratizando el comercio y los servicios financieros para transformar la vida de las personas de América Latina. ¡Sumate a este propósito!
Imagínate emprendiendo proyectos desafiantes, dinámicos e innovadores y siendo responsable de :
Liderar iniciativas estructurales para mejorar la resiliencia, uptime y escalabilidad, participar en war rooms y postmortems, y guiar procesos de mejora continua.
Diseñar arquitecturas seguras, resilientes y adaptadas al negocio, así como planes de evolución técnica por dominio.
Modelar y priorizar el uptime en función de la criticidad del servicio, evaluando la madurez técnica y estableciendo objetivos estratégicos.
Impulsar prácticas avanzadas de observabilidad e instrumentación personalizada (New Relic, OpenTelemetry, etc.), incluyendo estrategias de trazabilidad y alertamiento eficaz.
Identificar cuellos de botella técnicos mediante profiling y troubleshooting profundo, aplicando criterios de ingeniería de confiabilidad.
Mentorear equipos y líderes técnicos (TLs), promoviendo una cultura sólida de SRE y gobernando patrones de diseño resiliente y mejores prácticas transversales.
Requisitos :
Contar con al menos 5 años de experiencia en desarrollo, con sólidos conocimientos en sistemas distribuidos, microservicios, APIs escalables y arquitecturas cloud.
Demostrar expertise en gestión de uptime, alta disponibilidad y escalabilidad, con un enfoque tanto preventivo como reactivo frente a incidentes, incluyendo respuesta a incidentes y prácticas SRE y experiencia liderando mesas técnicas, iniciativas cross-team o prácticas de chaos engineering.
Liderar procesos de mejora continua y gestión operativa, con habilidades para el análisis de fallas, elaboración de resúmenes ejecutivos, definición de objetivos técnicos y gestión de KPIs.
Manejar herramientas avanzadas de observabilidad y troubleshooting como Datadog, New Relic y Kibana, además de experiencia con event sourcing e ingeniería de confiabilidad.
Diseñar y evolucionar sistemas de observabilidad avanzados, aplicando estrategias de instrumentación personalizada, trazabilidad end-to-end, correlación de métricas técnicas y de negocio, y umbrales efectivos de alertamiento para diagnóstico preciso.
Tecnología es la esencia de nuestro producto. Nuestros equipos de desarrollo, arquitectura, base de datos, user experience, seguridad informática y data & analytics co-crean y son responsables de la plataforma líder de e-commerce de América Latina y de uno de los sitios de mayor tráfico del mundo. En una industria que se reinventa día a día, nuestros equipos son reconocidos por su visión y liderazgo. Desde aplicaciones móviles a machine learning, nuestra innovación tiene un claro foco : simplificarle la vida a quien utiliza nuestros productos.
Te proponemos :
Ser parte de una compañía con espíritu emprendedor en la que nos encanta pensar en grande y a largo plazo.
Ser protagonista de tu desarrollo en un ambiente de oportunidades, aprendizaje, crecimiento, expansión y proyectos desafiantes.
Compartir y aprender en equipo junto a grandes profesionales y especialistas.
Un excelente clima de trabajo, con todo lo necesario para que vivas una gran experiencia. : )
Site Reliability Sre • Buenos Aires, Argentina