Site Reliability Engineer – SRE

  • Tempo integral
  • Qualquer lugar

iHunters

Estamos em busca de um Site Reliability Engineer experiente, que traga um amplo conjunto de habilidades técnicas e conquistas, com uma mentalidade focada em desenvolvimento e automação para resolver problemas. Procuramos alguém motivado a enfrentar alguns dos maiores desafios tecnológicos e causar um impacto significativo em milhares, senão milhões, de usuários. Nossa equipe de SRE é composta por engenheiros experientes que colaboram de forma eficaz e trabalham em aplicações de larga escala, fornecendo conteúdo em tempo real para milhares de usuários conectados, dentro de um ambiente de negócios em rápido crescimento.

Como Site Reliability Engineer, você será responsável por:

  • Trabalhar junto a uma equipe de engenheiros para habilitar e aprimorar os fluxos operacionais diários de aplicações e serviços críticos em um ambiente 24x7x365, localizado em nuvem e data centers físicos.
  • Aprimorar continuamente a observabilidade das aplicações para garantir a disponibilidade e confiabilidade da infraestrutura e dos sistemas.
  • Utilizar uma ampla variedade de tecnologias open source para criar serviços e pipelines escaláveis, seguros e de alto desempenho em nível global.

Requisitos:

  • Experiência sólida na construção de ambientes de produção escaláveis.
  • Experiência ou conhecimento em sistemas de controle de versão, versionamento, branching e merging, gerenciamento de configuração e builds, repositórios de artefatos, ferramentas de automação de builds, testes e deploys.
  • Experiência extensa com Integração Contínua (CI) e Entrega Contínua (CD), utilizando ferramentas como Jenkins, GitLab CI, já que você será responsável pela manutenção e suporte de pipelines automatizados.
  • Habilidades avançadas em scripting com BASH, PowerShell, Python, Go, Ruby, entre outras.
  • Experiência com containers Docker e orquestração de containers, preferencialmente Kubernetes.
  • Experiência com ferramentas de Infrastructure as Code (IaC), como Ansible, Chef, Terraform, entre outras.
  • Capacidade de atuar como parte de uma equipe distribuída.
  • Experiência com sistemas de monitoramento e métricas, como Prometheus, Logstash, Grafana.
  • Conhecimento em Java ou .NET para programação.
  • Inglês Avançado/Fluente

Diferenciais:

  • Familiaridade com tecnologias de banco de dados como MSSQL/PostgreSQL.
  • Experiência prática com tecnologias de mensageria, como RabbitMQ e Apache Kafka, incluindo configuração e troubleshooting.