Data Scientist & Data Analyst · Campinas, SP
Cientista e Analista de Dados com background em alta performance esportiva, construindo soluções em Python de EDA e Machine Learning até dashboards interativos deployados em produção
Dados & Análise
Python SQL Pandas NumPy Scikit-learn XGBoost LightGBM
Visualização & Produto
Streamlit Plotly Power BI Looker Studio
Engenharia
Git Medallion Architecture Jupyter Linux Claude Code
Modelo XGBoost treinado com cross-validation temporal para prever as vendas das próximas 6 semanas de 1.115 farmácias na Alemanha, seguindo metodologia CRISP-DS completa (10 etapas). Seleção de features via Boruta, encoding cíclico de variáveis temporais e tradução do erro em cenários financeiros: intervalo pessimista–otimista de R$1,69M sobre R$284M previstos para a rede. MAPE final ~13% vs estimativas manuais por gerente sem base estatística.
🔗 [Bot no Telegram →] (https://t.me/rossmann_gg_bot) (envie o número da loja e receba a previsão)
Dashboard Streamlit com 6 páginas interativas analisando o mercado global de video games para orientar alocação de capital em novos títulos. Arquitetura Medallion (Bronze → Silver → Gold), análise geopolítica de sinergia desenvolvedor × publisher, e modelo de rentabilidade por gênero com threshold de score alvo.
🔗 App ao vivo → (pode levar ~30s para inicializar)
Análise de 149.116 transações de uma rede de 3 cafeterias. Descoberta central: crescimento de +103,8% foi 100% volumétrico — ticket médio flat em R$4,69 durante 6 meses. Cada +R$0,50 por transação representa +R$75k/ano sem novos clientes.
Benchmarking comparativo de 18 algoritmos (Classificação · Regressão · Clusterização) variando hiperparâmetros de controle de overfitting/underfitting. Random Forest: F1 = 0.9591. XGBoost: R² = 0.3678, RMSE = 17.54.
- Eng. de Computação · UNICSUL (UNIVERSIDADE CRUZEIRO DO SUL)
- MBA em Data Science e Analytics · USP (UNIVERSIDADE DE SÃO PAULO)
- Mestrado em Biodinâmica do Movimento Humano · UNICAMP (UNIVERSIDADE ESTADUAL DE CAMPINAS)