Nombre de candidats
:000+
Let AI Supercharge Your Job Hunt!
JobCopilot scans 500,000+ company career sites daily to find jobs for you
Site Reliability Engineer - F/H/N
Au sein de votre équipe #OneTeam
Rejoindre l'équipe Digital Tools, responsable de la chaîne de déploiement, de l'observabilité et des opérations des plateformes OVHcloud (sites e-commerce et espace client).
Jouer un rôle central dans la mise en production et la fiabilité des services exposés à des millions d'utilisateurs.
Vos principales responsabilités
Concevoir et maintenir les pipelines de déploiement (CI/CD) pour assurer des livraisons fiables et rapides.
Piloter le provisioning et la gestion de l'infrastructure (bare metal, VM, containers) via l'Infrastructure as Code (IaC).
Orchestrer les workloads sur Kubernetes en garantissant la scalabilité et la résilience des services.
Assurer l'amélioration continue de l'observabilité (métriques, logs, alerting, dashboards, post-mortems).
Automatiser les opérations récurrentes pour réduire la charge opérationnelle et renforcer la stabilité.
Contribuer à la définition des standards d'architecture et des bonnes pratiques de déploiement.
Participer aux astreintes et à la gestion des incidents de production pour apporter une réponse structurée.
Votre futur impact
Dans 6 mois
Vous aurez pris en main l'écosystème Kubernetes et les pipelines CI/CD existants de l'équipe Digital Tools.
Vous aurez contribué à l'automatisation d'au moins un processus opérationnel majeur pour réduire les interventions manuelles.
Vous serez pleinement intégré au cycle des astreintes et capable de diagnostiquer les incidents sur les plateformes e-commerce.
Et dans 1 an
Vous deviendrez le référent technique sur l'évolution des outils d'observabilité et de monitoring (Prometheus, Grafana).
Vous aurez piloté la mise en œuvre de nouveaux standards d'Infrastructure as Code impactant l'ensemble de la chaîne de livraison.
Vous proposerez des optimisations architecturales innovantes pour améliorer la résilience globale des services face à de fortes montées en charge.
Compétences requises :
Vous justifiez d'une expérience de 5 ans minimum dans un rôle d'ingénieur infrastructure, SRE ou DevOps.
Vous maîtrisez les outils d'IaC et de gestion de configuration comme Ansible, Puppet ou Terraform.
Vous possédez une expertise avancée en Kubernetes, Docker et les architectures Cloud Native (Helm, Mesh).
Vous concevez et exploitez des pipelines CI/CD complexes (GitLab CI, GitHub Actions, ArgoCD).
Vous gérez couramment les outils d'observabilité tels que Prometheus, Grafana ou Sentry.
Vous développez des scripts d'automatisation en Go, Python ou Bash.
Vous parlez et écrivez un anglais technique fluide pour collaborer dans un contexte international.
C'est un +
Auto-Apply to Site Reliability Engineer Jobs with your AI JobCopilot
Copyright © 2026 Grabjobs Pte.Ltd. All Rights Reserved.