A Caju é uma empresa brasileira de tecnologia, que busca dar mais sabor à vida profissional, transformando a relação entre empresas e colaboradores por meio de soluções mais inovadoras e seguras como o Cartão Multi Benefícios, Solução em Despesas Corporativas, Premiações e Caju Ciclos.
Aqui na Caju, aprendemos sempre, e nos tornamos cada vez melhores em um ambiente colaborativo e divertido!
São muito bem-vindas candidaturas de pessoas negras/pretas, mulheres, indígenas, LGBTQIA+, ou outros grupos minorizados.
Inscreva-se e conheça mais sobre nosso time 🧡
- Construir e manter modelagens de dados robustas utilizando DBT, aplicando boas práticas de desenvolvimento como testes, documentação e versionamento de modelos.
- Desenvolver tabelas fato, dimensão e data marts orientados às necessidades das áreas de negócio, seguindo padrões de modelagem dimensional (Star Schema/Snowflake Schema).
- Atuar como elo entre as equipes de negócio e a engenharia de dados, realizando levantamento de requisitos, interpretando regras de negócio e traduzindo demandas analíticas em soluções de dados confiáveis e escaláveis.
- Documentar os modelos desenvolvidos, incluindo definições de métricas, regras de negócio aplicadas, glossário de dados e lineage, garantindo rastreabilidade e entendimento por toda a organização.
- Implementar e manter pipelines de orquestração no Databricks e Airflow, assegurando a confiabilidade e o monitoramento dos fluxos de dados.
- Desenvolver soluções em Python e SQL para transformação, tratamento e agregação de dados no ambiente Databricks.
- Implementar testes de qualidade de dados nos modelos DBT e camadas analíticas, garantindo consistência, completude e acurácia das informações entregues às áreas de negócio.
- Estruturar monitorias e alertas sobre os pipelines e modelos de dados, atuando proativamente na identificação e resolução de inconsistências.
- Conduzir projetos complexos de modelagem de ponta a ponta, desde o entendimento da dor do negócio até a entrega das camadas analíticas em produção.
- Aplicar estratégias de particionamento, clustering e materialização adequadas para garantir performance e eficiência de custo no processamento dos dados.
- Colaborar com squads de produto e negócio para garantir que as soluções de dados suportem decisões estratégicas e operacionais da empresa.
- Utilizar GitHub para versionamento de código, revisão de pull requests e manutenção de boas práticas de engenharia no time.
Modelagem e Arquitetura de Dados
- Domínio em modelagem de dados analíticos: Star Schema, Snowflake e OBT (One Big Table)
- Conhecimento sólido em arquiteturas de camadas como Medallion Architecture (Bronze, Silver, Gold).
- Capacidade de definir e aplicar contratos de dados entre camadas, garantindo consistência e previsibilidade para os consumidores.
Performance e Otimização
- Experiência com estratégias de materialização no DBT (tables, views, incremental models e snapshots), sabendo escolher a abordagem mais adequada para cada camada e volume de dados.
- Conhecimento em particionamento de dados por colunas de data ou outras chaves de alta cardinalidade, reduzindo o volume lido nas queries e otimizando custo e desempenho no Databricks.
- Familiaridade com técnicas de clustering e Z-Ordering no Databricks/Delta Lake para otimização de leitura em tabelas de grande volume.
- Capacidade de identificar e corrigir gargalos de performance em queries SQL, como evitar full table scans, uso eficiente de joins, agregações e window functions.
- Capacidade de estimar e gerenciar o impacto de modelos complexos no custo de processamento em cloud, propondo soluções que equilibrem performance e eficiência operacional.
Ferramentas e Tecnologias
- Domínio de DBT (dbt Core ou dbt Cloud), incluindo criação de modelos, testes, macros e documentação.
- Experiência com Databricks e Delta Lake, incluindo funcionalidades como Time Travel, VACUUM e OPTIMIZE.
- Habilidades avançadas em SQL para construção de queries complexas e modelagem analítica.
- Conhecimento em Python para automação, transformação de dados e desenvolvimento de scripts de suporte às pipelines.
- Experiência com orquestração de pipelines utilizando Apache Airflow e Databricks.
- Experiência com versionamento de código utilizando GitHub, incluindo fluxos de revisão e colaboração em equipe.
Habilidades Comportamentais
- Pensamento crítico e autonomia para conduzir projetos complexos com múltiplos stakeholders.
- Capacidade de comunicação clara com áreas de negócio não-técnicas, traduzindo necessidades analíticas em soluções de dados.
- Forte senso de dono sobre a qualidade e confiabilidade dos dados entregues.
Diferenciais
- Experiência com Unity Catalog ou outras ferramentas de governança e catalogação de dados.
- Conhecimento em ferramentas de observabilidade de dados, como Elementary ou Monte Carlo.
- Familiaridade com ferramentas de BI como Metabase, Explo, GoodData, Luzmo ou Power BI, entendendo o consumo dos modelos pelas áreas analíticas.
- Conhecimento em Terraform ou IaC para provisionamento de ambientes de dados em nuvem.
- Vivência em ambientes de fintech e benefícios.
💳 Cartão Caju, com mais liberdade para usar seus benefícios (Refeição, Alimentação, Mobilidade, Saúde, Home Office, Cultura e Educação);
🏥 Plano de Saúde sem coparticipação (Unimed, Sulamerica ou Alice);
🧘🏿♀️ Zenklub, com consultas onlines com terapeutas e coaches para cuidar da sua saúde mental;
🏋🏿♀️ Wellhub;
🗣️ Aqui também estimulamos o aprendizado de idiomas, com a parceria da Rosetta Stone;
💆🏽 Dia de recarregar - day off;
🧑🏿⚕️ Conexa Saúde - consulta médica online;
👶🏿 Auxílio Creche;
📚 Parceria com Alura;
👨🏿💻 Trabalho Remoto, para você trabalhar de onde quiser dentro do Brasil;
💻 Oferecemos equipamento de trabalho;
🚀 Muitas possibilidades de crescimento - temos muito a crescer e esperamos fortemente que você nos ajude com isso!
A Caju é uma empresa brasileira e aceita pessoas de todas as regiões do país.
Trabalhamos em um modelo 100% remoto(quem tiver interesse de conhecer ou trabalhar no escritório, localizado em São Paulo, estaremos de portas abertas)
Se interessou? #VemSerCaju 🧡