Skip to content

Habilidades Técnicas

Linguagens de Programação

Python

Nível: Avançado

Linguagem principal para engenharia de dados, utilizada diariamente em construção de pipelines, ETL, automações e análise de dados.

Bibliotecas e frameworks:

  • Pandas - Manipulação e análise de dados
  • Numpy - Computação numérica
  • DuckDB - Analytics in-process SQL OLAP
  • Great Expectations - Validação e qualidade de dados
  • Streamlit - Aplicações de dados interativas
  • Requests - Integração com APIs
  • SQLAlchemy - ORM para bancos de dados

SQL

Nível: Avançado

Expertise em múltiplos dialetos SQL para modelagem, transformação e análise de dados.

Bancos de dados:

  • PostgreSQL (principal)
  • MySQL / MariaDB
  • Microsoft SQL Server
  • DuckDB
  • Google BigQuery
  • Amazon Redshift

Competências:

  • Modelagem dimensional (star schema, snowflake)
  • Otimização de queries e índices
  • CTEs (Common Table Expressions)
  • Window functions
  • Procedures e triggers

Ferramentas de Dados Modernas

dbt (Data Build Tool)

Nível: Avançado

Ferramenta principal para transformação de dados, utilizada em todos os projetos recentes.

Competências:

  • Modelagem de dados com Jinja e SQL
  • Testes automatizados (unique, not_null, relationships)
  • Documentação automática
  • Versionamento de modelos
  • Macros customizadas
  • Configuração de CI/CD para dbt

Experiência: Implementação de dbt em 3 empresas diferentes (Oby Capital, Bravium, Falconi)


Great Expectations

Validação e qualidade de dados com testes automatizados e documentação de expectativas.


Cloud Computing

Google Cloud Platform (GCP)

Nível: Avançado

Plataforma cloud principal, utilizada em projetos de produção.

Serviços dominados:

  • BigQuery - Data warehouse serverless
  • Cloud Storage - Armazenamento de objetos
  • Cloud Functions - Serverless computing
  • Cloud Build - CI/CD
  • IAM & Security - Gerenciamento de acesso
  • Cloud Run - Containers serverless

Amazon Web Services (AWS)

Nível: Intermediário

Experiência com principais serviços de dados da AWS.

Serviços utilizados:

  • S3 - Armazenamento de objetos
  • RDS - Bancos de dados relacionais gerenciados
  • Redshift - Data warehouse
  • Athena - Queries SQL em S3
  • CloudWatch - Monitoramento e logs
  • ECS - Container orchestration

Railway

Plataforma PaaS para deploy de aplicações e bancos de dados com foco em developer experience.


Versionamento e DevOps

Git

Nível: Avançado

Controle de versão essencial para todos os projetos de dados.

Plataformas:

  • GitHub (principal) - CI/CD com Actions
  • GitLab - CI/CD pipelines
  • Azure Repos - DevOps integrado

Práticas:

  • Branching strategies (Git Flow, GitHub Flow)
  • Code review e pull requests
  • Conventional commits
  • Git hooks para automação

CI/CD

Implementação de pipelines de integração e deploy contínuo para projetos de dados:

  • GitHub Actions
  • Azure DevOps Pipelines
  • Cloud Build (GCP)

Business Intelligence e Visualização

Looker (Google Data Studio)

Criação e manutenção de dashboards interativos conectados ao BigQuery.


Power BI

Desenvolvimento de relatórios e dashboards corporativos.

Competências:

  • Power Query (M language)
  • DAX para métricas calculadas
  • Modelagem de dados
  • Row-level security

Streamlit

Desenvolvimento de aplicações de dados interativas com Python.


Ferramentas de Produtividade

  • Excel Avançado - Fórmulas complexas, tabelas dinâmicas, Power Query
  • Google Sheets - Automação com Apps Script
  • Microsoft Word - Documentação técnica
  • SharePoint - Colaboração e gestão documental
  • Azure DevOps - Gestão de projetos e work items

Metodologias e Práticas

DataOps

  • Automação de pipelines de dados
  • Versionamento de código e dados
  • Testes automatizados
  • Monitoramento e observabilidade
  • Documentação como código

Engenharia de Software

  • Clean Code
  • SOLID principles
  • Design patterns
  • Code review
  • Testes unitários

Metodologias Ágeis

  • Scrum
  • Kanban
  • Sprints e cerimônias ágeis

Stack Técnico por Categoria

Categoria Tecnologias
Linguagens Python, SQL, Jinja
Bancos de Dados PostgreSQL, MySQL, BigQuery, Redshift, DuckDB
Cloud GCP (BigQuery, Cloud Functions, Cloud Storage), AWS (S3, RDS, Athena)
Data Tools dbt, Great Expectations, Pandas, Numpy
Orquestração GitHub Actions, Cloud Build, Azure DevOps
BI & Viz Looker, Power BI, Streamlit, Power Query
DevOps Git, GitHub, GitLab, Docker
Produtividade Excel, Sheets, Word, SharePoint

Soft Skills

  • Comunicação técnica - Tradução de requisitos de negócio para soluções técnicas
  • Trabalho em equipe - Colaboração com times multidisciplinares
  • Autonomia - Capacidade de aprender novas tecnologias rapidamente
  • Mentoria - Ensino de tecnologias para analistas e desenvolvedores
  • Resolução de problemas - Abordagem analítica e estruturada
  • Documentação - Criação de documentação técnica clara e completa