Skip to content

lgomezt/Intro_Python

Repository files navigation

Proyectos de Analítica en Python🐍

Este repositorio contiene el material de las clases del programa Proyectos de Analítica en Python el cual contiene dos modulos: Introducción al análisis de datos en Python y Machine Learning para Business Intelligence.

Requisitos computacionales🕹

Para ejecutar los códigos de la clase, la opción más sencilla es instalar Anaconda en su computador. Esta es una plataforma que le incluirá todos los softwares necesarios en su camino por la ciencia de datos. Por un lado, Anaconda instalará la última versión estable de Python, también a través de su gestor de paquetes Conda, le incluirá las principales bibliotecas y además le instalará algunos IDEs que serán su interfaz gráfica para programar. Lo mejor de todo es que esta solución es grátis. A continuación, le explicaremos paso a paso lo que debe hacer.

  • Instalar Anaconda
  1. Visita el sitio web de Anaconda y descarga la versión adecuada de Anaconda para tu sistema operativo.
  2. Ejecuta el instalador de Anaconda y sigue las instrucciones en pantalla. Asegúrate de agregar Anaconda al PATH y aceptar la opción predeterminada para instalar Python.
  3. Después de la instalación, abre Anaconda Navigator para confirmar que la instalación fue exitosa.
  • Actualizar Anaconda
  1. Abre Anaconda Navigator y selecciona el entorno que deseas actualizar.
  2. Haz clic en "Actualizar" en la sección de "Acciones" de la pestaña "Inicio" para actualizar todos los paquetes en el entorno seleccionado.
  • Instalar Jupyter Notebook
  1. Abre Anaconda Navigator y selecciona el entorno que deseas utilizar para Jupyter Notebook.
  2. Haz clic en "Instalar" en la sección de "Acciones" de la pestaña "Inicio".
  3. Busca "Jupyter Notebook" en la barra de búsqueda y haz clic en "Instalar" junto a él.
  4. Espera a que la instalación termine.

Este último paso no es necesario, pero es altamente recomendable. Visual Studio Code es un IDE que le permitirá correr los cuadernos de la clase de una forma más amigable.

  • Instalar Visual Studio Code
  1. Visita el sitio web de Visual Studio Code y descarga la versión adecuada para tu sistema operativo.
  2. Ejecuta el instalador de Visual Studio Code y sigue las instrucciones en pantalla.
  3. Después de la instalación, abre Visual Studio Code para confirmar que la instalación fue exitosa.
  4. Configurar Visual Studio Code para utilizar Anaconda
  5. Abre Visual Studio Code y haz clic en "Archivo" -> "Preferencias" -> "Configuración".
  6. Busca "python.condaPath" y establece el valor en la ubicación de la instalación de Anaconda. Por ejemplo, "C:\ProgramData\Anaconda3\condabin\conda.exe".
  7. Busca "python.pythonPath" y establece el valor en la ubicación de la instalación de Python en tu entorno Anaconda. Por ejemplo, "C:\ProgramData\Anaconda3\envs\myenv\python.exe".

Introducción al Análisis de Datos en Python📈

Este primer modulo está compuesto por doce sesiones más un Trabajo Final, en las que se busca familiarizar al estudiante con el uso de Python para el análisis de datos y herramientas asociadas. Se estudiarán los principales paquetes como los son NumPy, pandas, matplotlib, seaborn, entre muchos otros.

Clase Tópicos Material
Clase 1
  • ¿Qué es y por qué Python?
  • Jupyter Notebook
  • Tipos de variables y Casting
  • Operaciones
Clase 2
  • Listas, Tuplas, Conjuntos y Diccionarios
  • Indexación y mutabilidad
  • Métodos básicos de cada estructura
Clase 3
  • Control Flow (if/elif/else)
  • Loops for y while
  • break, continue y comprensiones de listas
Clase 4
  • Funciones
  • Argumentos por defecto y *args/**kwargs
  • Funciones lambda
  • Diseño de algoritmos
Clase 5
  • Taller práctico de fundamentos
Clase 6
  • Costo computacional y notación Big-O
  • Pensamiento algorítmico
Clase 7 (Festivo)
  • Recursividad y casos base
  • Material asincrónico
Clase 8
  • Data Science con IA Generativa
  • Flujo de trabajo asistido por LLMs
Clase 9
  • Introducción a Pandas
  • Series y DataFrame
  • Indexación con .loc y .iloc
  • Estadísticas descriptivas
Clase 10
  • Unión de bases (merge, concat)
  • groupby y agregaciones
  • apply y transformaciones
Clase 11
  • Instalación y configuración de OpenClaw
Clase 12
  • Introducción al Webscraping
  • HTML, XPath e inspección de páginas
  • Webscraping dinámico con Selenium
Trabajo Final
  • Proyecto integrador del módulo

Material de versiones anteriores del curso (visualización con Matplotlib/Plotly, Webscraping, Análisis Espacial, NLP, etc.) está archivado en Deprecated/.

Machine Learning para Business Intelligence🤖

Este segundo módulo introduce los fundamentos de Machine Learning con énfasis en aplicaciones de Business Intelligence: desde modelos lineales y regularización, hasta árboles, boosting, análisis no supervisado y modelos de lenguaje (LLMs).

Clase Tópicos Material
Clase 1
  • ¿Qué es Machine Learning? ¿Qué es Inteligencia Artificial?
  • Ramas del ML: supervisado, no supervisado, refuerzo
  • Tipos de problemas que veremos
  • Contexto histórico y dilemas éticos
Clase 2
  • Estadísticas descriptivas
  • Construcción de variables
  • Manejo de valores faltantes
  • Visualizaciones exploratorias
Clase 3
  • K-Vecinos más cercanos (KNN)
  • Introducción a Scikit-Learn
  • Modelos lineales (regresión y logística)
  • Validación cruzada
Clase 4
  • Fine tuning de hiperparámetros
  • Trade-off sesgo–varianza
  • Grid search
  • Métricas de evaluación
Clase 5
  • Regularización
  • Ridge, Lasso y Elastic Net
Clase 6
  • Modelos de clasificación
  • Árboles de decisión
  • Importancia de variables
  • Taller de regularización
Clase 7
  • Bosques aleatorios y Boosting (Gradient Boosting)
  • Introducción al análisis no supervisado
  • PCA
Clase 8
  • K-Means
  • Coeficiente de Silhouette
  • Continuación de PCA
Clase 9
  • LLMs y ChatGPT
  • Prompt Engineering
  • Construcción de un OrderBot

Agradecimientos🫂

El material acá consignado ha sido el esfuerzo colaborativo de varias generaciones de Quantileros. En esta sección se le quiere hacer una mención especial a Julian Chitiva y a Juan Sebastian Moreno por la estructuración de gran parte del material del curso.

Nota: Este repositorio no reemplaza el curso pues carece de sesiones de clase sincronicas, el contenido audiovisual asincronico, el trabajo en equipo y las retroalimentaciones del equipo docente. No obstante, el material acá consignado es una buena introducción para todo aquel que desee aprender Python.

Releases

No releases published

Packages

 
 
 

Contributors