Módulo 1: Python Core & Visualización
Un único archivo .ipynb (Jupyter Notebook) con celdas de Markdown explicando tus hallazgos.
Usa nyc-train-trip o train.csv disponible en el repositorio. ¡Son datos reales!
Se evalúa: Reducción de Memoria (>50%), Limpieza de Código y Storytelling Visual.
Optimización de Memoria y Procesamiento Vectorizado
df.info() miente. Usa memory_usage='deep' para ver el peso real de los strings. Compara el antes y el después.passenger_count a int8 usando pd.to_numeric(..., downcast='integer').store_and_fwd_flag a tipo category. Verifica la reducción masiva de RAM.to_datetime especificando el format..dt.hour. ¡Cero bucles for!apply + if/else por el ultra-rápido np.where para crear la columna trip_type.velocidad_kph al vuelo dentro de una cadena..parquet.Storytelling y Automatización de Reportes
fig, ax = plt.subplots() para control total.alpha=0.05 y puntos pequeños.sns.jointplot(kind="hex") para ver densidad en lugar de puntos.FacetGrid para comparar histogramas por categoría.sns.despine(). Menos es más.dpi=300 para que se vea nítido en PDF.El objetivo final: Un script que genere el reporte sin que tú muevas un dedo.
pdf.image() para insertar los gráficos.