Aqui estão alguns dos projetos de Ciência de Dados que realizei durante o programa de treinamento da TripleTen. Esses projetos abrangeram uma variedade de áreas, incluindo Pré-processamento de Dados, Análise e Visualização de Dados, Análise Estatística, Aprendizado de Máquina, Processamento de Linguagem Natural, Análise de Séries Temporais, Visão Computacional e muito mais.
| Projeto | Descrição | Bibliotecas |
|---|---|---|
| Análise de Pontuação de Crédito | Utilizar diversas métricas para determinar a probabilidade de um cliente deixar de pagar um empréstimo | pandas, nltk |
| Análise de Preço de Veículos | Estudar anúncios de veículos para determinar quais fatores influenciam o preço do veículo | pandas, matplotlib, numpy |
| Análise de Planos de Telefonia | Selecionar o plano com maior receita potencial para diferentes mercados-alvo e realizar testes de hipóteses | pandas, matplotlib, scipy, numpy, nltk |
| Análise de Jogos | Identificar padrões que determinam o sucesso de um jogo, criar um perfil de usuário para cada mercado-alvo e realizar testes de hipóteses | pandas, matplotlib, scipy, numpy, nltk |
| Análise de Empresas de Táxi | Identificar as principais empresas de táxi, bairros com maior número de desistências e realizar testes de hipóteses | pandas, matplotlib, scipy, numpy, nltk |
| Modelo de ML para Planos de Telecom | Estudando o comportamento do cliente e construindo um modelo de machine learning que recomenda planos de telefonia | pandas, sklearn |
| Modelo de Clientes Bancários | Criar um modelo de classificação para prever a rotatividade de clientes a partir de um conjunto de dados desequilibrado | pandas, sklearn |
| Modelo de Poços de Petróleo | Analisar dados de várias regiões de reservatórios de petróleo e poços de petróleo para calcular a lucratividade e o risco de perda no desenvolvimento de um novo poço em cada região | pandas, numpy, matplotlib, seaborn |
| Modelo de Extração de Ouro | Construir um modelo de machine learning que prevê a quantidade de ouro recuperada no processo de extração, visando otimizar a produção | pandas, matplotlib, numpy, sklearn |
| Máscara de Dados para Empresa de Seguros | Desenvolver um algoritmo de transformação de dados para mascarar dados, garantindo que não afete a qualidade de um modelo de machine learning | pandas, numpy, sklearn |
| Modelo de Preço de Carros | Construir um modelo usando dados históricos de carros para um recurso de aplicativo que pode determinar o valor de mercado do carro de um usuário | pandas, numpy, sklearn, time, catboost, lightgbm |
| Modelo de Pedidos de Táxi | Usar dados históricos de pedidos de táxi em aeroportos para criar um modelo que preveja a quantidade de pedidos de táxi para qualquer período de tempo | pandas, numpy, matplotlib, sklearn, catboost, lightgbm, statsmodels |
| Análise de Sentimento de Filmes | Treinar um modelo que classifica avaliações como positivas ou negativas | pandas, numpy, math, re, nltk, matplotlib, seaborn, tqdm |
| Modelo de Rede de Supermercados | Treinar e avaliar um modelo para detectar automaticamente a idade de um cliente no caixa de um supermercado | pandas, numpy, matplotlib, seaborn, tensorflow |
| Modelo de Churn de Clientes de Telecom | Treinar um modelo para prever se um cliente vai deixar o serviço de telecomunicações | pandas, numpy, sklearn, catboost, lightgbm |