Analista de Dados | Desenvolvedor Python | Business Intelligence
Profissional dedicado a transformar dados em insights acionáveis através de análise, visualização e automação. Experiência em desenvolvimento de soluções de BI, processamento de dados em larga escala e geração de relatórios estratégicos.
Sou um Analista de Dados com foco em Python, SQL e ferramentas de Business Intelligence. Trabalho na transformação de dados brutos em informações estratégicas que impulsionam decisões empresariais. Minha trajetória inclui desenvolvimento de dashboards, automação de processos de ETL e análise exploratória de dados.
Pronomes: ele/dele
Localização: Brasil
- Análise de Dados: Pandas, NumPy, SciPy
- Visualização: Matplotlib, Seaborn, Plotly, Plotly Dash
- Machine Learning: scikit-learn, LightGBM, TensorFlow, Keras, imbalanced-learn (SMOTE)
- Explicabilidade & Fraude: SHAP, detecção de anomalia (Isolation Forest), PR-AUC e limiar por custo para dados desbalanceados
- Estatística & Testes A/B: teste de hipóteses, teste Z/t, intervalos de confiança, poder, bootstrap, inferência bayesiana
- Séries Temporais: Prophet, statsmodels (SARIMA/ARIMA)
- Clustering & Segmentação: K-Means, RFM, Elbow Method, Silhouette Score
- Web Scraping: Requests, BeautifulSoup (coleta com respeito a robots.txt e rate limiting)
- Interfaces Gráficas: PyQt5
- Ambientes: Jupyter Notebook, Google Colab
- Versionamento: Git, GitHub
| Projeto | Descrição | Tecnologias |
|---|---|---|
| 🏠 Mercado Imobiliário — Palmas/TO | Pipeline ponta a ponta com dataset coletado por scraping próprio: regressão de preços (R² 0,81), yield de aluguel por bairro e segmentação K-Means | Web Scraping scikit-learn Regressão K-Means |
| 🛡️ Detecção de Fraude — IEEE-CIS | Classificação em dados desbalanceados (3,5% de fraude): LightGBM (PR-AUC 0,586, ROC-AUC 0,924), detecção de anomalia e limiar por custo de negócio (-61% de custo), com explicabilidade SHAP | LightGBM SHAP Dados Desbalanceados Detecção de Anomalia |
| 🧪 Teste A/B — Conversão | Análise estatística completa de teste A/B: teste Z, IC, tamanho de efeito, poder, bootstrap e bayes, com dashboard interativo | SciPy statsmodels Teste A/B Plotly Dash |
| 👥 Segmentação de Clientes | Segmentação RFM + K-Means de clientes de e-commerce, com dashboard interativo dos segmentos | scikit-learn K-Means Pandas Plotly Dash |
| 📈 Forecasting de Demanda | Previsão de vendas com Prophet e SARIMA sobre dados reais de varejo (1.115 lojas), com comparação de métricas | Prophet SARIMA statsmodels Plotly |
| 🛒 Análise de Faturamento | EDA completa do e-commerce Olist com SQL, Pandas e dashboard interativo com filtros por estado | SQL Pandas Plotly Dash SQLite |
| 🌿 PlantVillage | Classificação de doenças em folhas de plantas com Deep Learning e Transfer Learning (VGG16) | TensorFlow Keras SMOTE |
| 📘 Hands-on Machine Learning | Implementações dos capítulos do livro de Aurélien Géron (regressão, classificação, clustering, PCA) | scikit-learn Pandas Matplotlib |
💡 Projetos de fundamentos em Python (OOP, validadores, regex) ficam na aba Repositories — aqui na vitrine priorizo os projetos de dados e ML.
Estou continuamente aprimorando minhas habilidades em:
- MLOps e deploy de modelos em produção
- Advanced SQL e otimização de queries
- Arquitetura de data warehouses
- Cloud computing (AWS, GCP, Azure)
Email Profissional: augusto.ivan83@outlook.com
LinkedIn: Augusto Matos
Último atualizado: 2026