Sou do time de Talent Attraction e procuro profissionais localizados no Brasil para a posição de Senior Data Developer (Python, AWS),que atuarão em um projeto do ramo financeiro.
Estamos em busca de uma pessoa para atuar como Engenheiro(a) de Dados, integrando nosso time e contribuindo na construção de soluções escaláveis e inteligentes para grandes volumes de dados.
Se você é apaixonado por dados, tem experiência sólida com Python, AWS e modelagem de dados, gosta de resolver problemas complexos e colaborar com equipes multidisciplinares, essa vaga é para você!
Responsabilidades:
- Realizar o entendimento de requisitos técnicos, refinamento de atividades e estimativa de prazos para os entregáveis.
- Atuar no desenvolvimento e evolução de aplicações de ingestão de dados no ambiente AWS.
- Construir testes automatizados para garantia da qualidade dos entregáveis.
- Aplicar boas práticas de desenvolvimento de software: design, convenção de nomes, cobertura de testes, requisitos atendidos e otimização.
- Atuar em gestão de incidentes.
- Participar de cerimônias ágeis como: daily, planning, demos e retros.
Você precisa ter prática com:
- Experiência e boas práticas com versionamento de código (Git, GitHub)
- Experiência em SQL para construção, manipulação e otimização de queries.
- Experiência em Python para ETL/ELT utilizando bibliotecas como NumPy e Pandas.
- Experiência em PySpark para ETL/ELT.
- Conhecimento desejável em Particionamento, Lazy Evaluation, Caching e UDFs utilizando PySpark.
- Experiência com ferramentas de CI/CD.
- Experiência com bancos de dados relacionais e não-relacionais.
- Conhecimento em modelagem de dados dimensional.
- Conhecimento em governança e qualidade de dados.
- Conhecimento e boas práticas com testes unitários utilizando os frameworks Unittest e Pytest em Python.
- Conhecimento em Infraestrutura como Código (IaC) utilizando Terraform.
- Experiência com AWS e os recursos:
Necessário:
- Gerenciamento de acessos: IAM.
- Armazenamento: S3.
- Computação e processamento: Glue.
Desejável:
- Armazenamento: RDS e DynamoDB.
- Governança de dados: Lake Formation.
- Computação e processamento: Lambda e EC2.
- Orquestração e agendamento: Step Function e EventBridge.