Número de Aplicantes
:000+
Let AI Supercharge Your Job Hunt!
JobCopilot scans 500,000+ company career sites daily to find jobs for you
A Elevus é um grupo empresarial que oferece soluções inovadoras no mercado dos Recursos Humanos. Desde 2001, fornecemos serviços de excelência, tanto em Portugal como no mercado internacional, ajudando empresas a alcançar os seus objetivos com soluções personalizadas.
Estamos à procura de um Site Reliability Engineer (SRE) para integrar uma equipa dinâmica e multidisciplinar. Se tens paixão por garantir sistemas escaláveis, fiáveis e seguros, esta oportunidade é para ti!
Sobre a Oportunidade:
Como SRE, serás responsável por aplicar princípios de engenharia de software para resolver desafios operacionais, garantindo a fiabilidade, desempenho e escalabilidade de sistemas em produção. Irás colaborar diretamente com equipas de desenvolvimento com foco na adoção de práticas de fiabilidade, sempre alinhado com os objetivos de negócio e a experiência do cliente.
Responsabilidades:
Liderar e apoiar equipas no cumprimento de princípios e práticas de fiabilidade;
Definir e manter SLOs (Service Level Objectives) e SLAs (Service Level Agreements);
Desenhar e implementar infraestruturas escaláveis e resilientes, com foco em segurança e boas práticas cloud-native;
Trabalhar em estreita colaboração com equipas de desenvolvimento para garantir sistemas observáveis, tolerantes a falhas e de elevada performance;
Implementar soluções de monitorização, alertas, logging e tracing;
Coordenar a resposta a incidentes, assegurando resolução rápida e eficaz, com análise de causa raiz (RCA);
Automatizar tarefas operacionais, com foco na deteção e recuperação rápida de falhas;
Promover uma cultura de melhoria contínua e partilha de conhecimento;
Comunicar com stakeholders sobre a fiabilidade e performance dos sistemas;
Participar em regimes de on-call para suporte a sistemas em produção.
O que Procuramos:
Licenciatura em Engenharia Informática, Ciência da Computação ou áreas similares;
Mínimo de 5 anos de experiência em desenvolvimento de software e/ou operações;
Domínio de, pelo menos, uma linguagem de programação (Python, Java, C#, etc.);
Excelentes capacidades de troubleshooting e resolução de problemas;
Fluência em inglês e forte capacidade de comunicação;
Pensamento orientado a processos e capacidade de negociação em contextos técnicos.
Competências Técnicas Valorizadas:
Definição e monitorização de SLOs, SLIs e SLAs;
Experiência com Kubernetes, EKS, e tecnologias de containerização (certificações CKA/CKAD/CKS são uma mais-valia);
Conhecimentos de ferramentas de IaC (Terraform, CloudFormation, Puppet, etc.);
Experiência em scripting com Python, Go ou Bash;
Familiaridade com serviços AWS (EC2, RDS, ELB, Lambda, etc.);
Monitorização com Grafana, ELK, Prometheus ou similares;
Capacidade de desenhar sistemas distribuídos, resilientes e tolerantes a falhas.
O que Oferecemos:
Ambiente de trabalho colaborativo, dinâmico e tecnológico;
Participação em projetos inovadores com impacto local e internacional;
Oportunidades de crescimento e aprendizagem contínua;
Remuneração ajustada à experiência e performance individual.
Auto-Apply to Site Reliability Engineer Jobs with your AI JobCopilot
Copyright © 2026 Grabjobs Pte.Ltd. All Rights Reserved.