Представленные проекты были выполнены в ходе обучения в Яндекс.Практикуме по профессии "Специалист по Data Science".. Большинство проектов основано на реальных кейсах и решают различных типы задач, характерные для сферы Data Science.
| Название проекта | Описание | Используемые библиотеки |
|---|---|---|
| Музыка больших городов | Сравнение предпочтений пользователей из Москвы и Санкт-Петербурга стриминговый сервис-компании в зависимости от времени (утро и вечер) и дня недели (понедельник, среда, пятница) | Pandas |
| Надежность заемщиков | Исследование влияния семейного положения и количество детей клиента на факт возврата кредита в срок на основе статистики о платёжеспособности клиентов | Pandas |
| Цена питерской недвижимости | Определение рыночной стоимости объектов недвижимости и типичные параметры квартир, используя данные сервиса объявлений об аренде и продаже недвижимости | Pandas, NumPy, Matplotlib |
| Прибыльный тариф | Анализ поведения клиентов и поиск оптимального тарифа на основе данных клиентов оператора сотовой связи | Pandas |
| Закономерности мира компьютерных игр | Определение потенциально популярного игрового продукта для интернет-магазина | Pandas, NumPy, SciPy, Matplotlib, Plotly |
| Рекомендованный тариф | Построение системы машинного обучения для анализа поведения клиентов оператора сотовой связи и выбора наиболее подходящего для них тарифа | Pandas, Scikit-learn, Matplotlib |
| Отток клиентов банка | Прогнозирование ухода клиента из банка в ближайшее время на основе исторических данных о поведении клиентов и расторжении договоров с банком | Pandas, NumPy, Scikit-learn, Plotly |
| Локация для нефтедобычи | Построение модели машинного обучения для определения региона, где нефтедобыча принесёт наибольшую прибыль на основе данных геологоразведки | Pandas, NumPy, Scikit-learn, Plotly |
| Оптимизация технологии золотообогащения | Построение модели машинного обучения для определения концентрацию золота при проведении процесса очистки для оптимизации технологического процесса золотодобывающей компании | Pandas, NumPy, SciPy, Statsmodels, Scikit-learn, Plotly |
| Защита персональных данных клиентов | Разработка механизма анонимизации персональных данных клиентов страховой компании | Pandas, NumPy, Statsmodels, Scikit-learn |
| Стоимость автомобиля | Разработка системы рекомендации стоимости автомобиля на основе его описания для сервиса по продаже автомобилей с пробегом | Pandas, NumPy, Category Encoders, Scikit-learn, Optuna, LightGBM |
| Прогнозирование заказов такси | Разработка системы предсказания объема заказов такси на следующий час для такси-сервиса | Pandas, NumPy, Statsmodels, Scikit-learn, Optuna, LightGBM, Matplotlib |
| Токсичные комментарии | Определение токсичности комментариев для интернет-магазина | Pandas, NumPy, NLTK, Scikit-learn, Optuna, LightGBM |
| Определение возраста покупателей | Определение возраста покупателей в прикассовой зоне по фотографии для системы компьютерного зрения магазина | Pandas, Keras, Matplotlib |
| Оптимизация процесса выплавки стали | Построение модели предсказания температуры выплавки стали на различных технологических стадиях для оптимизации производственных расходов металлургического комбината | Pandas, Scikit-learn, Optuna, LightGBM, Plotly |
Получен диплом о профессиональной переподготовке.