Práctica de Limpieza de Datos - Dataset Titanic

Este repositorio contiene un ejercicio de limpieza y preprocesamiento de datos utilizando el famoso dataset del Titanic de Kaggle. El objetivo es preparar los datos para un posterior análisis o modelado estadístico.

English version here

Contenido del Repositorio

Cleaning_TITANIC_2024.ipynb: Jupyter Notebook con todo el proceso de limpieza de datos.
Titanic/: Carpeta que contiene los datasets originales (train.csv, test.csv y gender_submission.csv).

Descripción del Proceso

En el notebook se realizan las siguientes tareas:

Estadística Descriptiva: Exploración inicial de los datos.
Eliminación de Columnas: Remoción de variables que no aportan valor al modelo inicial (como el nombre).
Imputación de Valores Faltantes: Uso de SimpleImputer para variables categóricas.
Tratamiento de Variables Numéricas: Imputación de la media para la columna 'Age' y conversión a tipo entero.
Codificación de Variables Categóricas: Aplicación de One-Hot Encoding a las variables 'Sex' y 'Embarked'.
Exportación de Datos: Generación de archivos CSV con los datos ya limpios.

Instrucciones de Uso

Para ejecutar el código localmente:

Clona este repositorio.
Asegúrate de tener instaladas las librerías necesarias (pandas, numpy, scikit-learn).
Nota Importante: En el notebook, deberás actualizar las rutas de carga y guardado de los archivos CSV para que coincidan con tu entorno local o de Google Colab.

Tecnologías Utilizadas

Python
Pandas
Numpy
Scikit-learn (SimpleImputer, OneHotEncoder)
Jupyter Notebook / Google Colab

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
Titanic		Titanic
Cleaning_TITANIC_2024.ipynb		Cleaning_TITANIC_2024.ipynb
README.en.md		README.en.md
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Práctica de Limpieza de Datos - Dataset Titanic

Contenido del Repositorio

Descripción del Proceso

Instrucciones de Uso

Tecnologías Utilizadas

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Práctica de Limpieza de Datos - Dataset Titanic

Contenido del Repositorio

Descripción del Proceso

Instrucciones de Uso

Tecnologías Utilizadas

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages