Parte 4 Ejercicio práctico
Modelo de predicción de demanda o riesgo
Ahora es tu turno de aplicar todo lo aprendido. En esta sección final, te guiaremos paso a paso en la construcción de un modelo predictivo real que podrás implementar inmediatamente en tu contexto laboral. Ya sea que elijas predecir demanda futura o clasificar riesgo, el proceso fundamental es el mismo. Prepárate para transformar tus datos históricos en una herramienta predictiva poderosa.
Paso 1: Preparar datos en Excel
La calidad de tu modelo predictivo depende directamente de la calidad de tus datos. Un modelo entrenado con datos sucios o desorganizados producirá resultados poco confiables, sin importar cuán sofisticado sea el algoritmo. Dedica tiempo suficiente a esta fase; te ahorrará frustración posterior.
Organización estructural
Crea tablas claras y consistentes donde:
Cada fila representa una observación única (un cliente, un día de ventas, una transacción)
Cada columna representa una variable específica
La primera fila contiene encabezados descriptivos y únicos
No hay celdas combinadas ni formatos complejos
Los tipos de datos son consistente en cada columna (fechas como fechas, números como números)
Limpieza de datos crítica
Aplica estas operaciones de limpieza esenciales:
Eliminar duplicados: Usa «Datos ³ Quitar duplicados» en Excel para identificar registros repetidos
Corregir errores tipográficos: Estandariza nombres de categorías («Cliente», «cliente», «CLIENTE» ³ «Cliente»)
Tratar valores faltantes: Decide si eliminar filas incompletas o rellenar con promedios/medianas
Identificar outliers: Valores extremos que podrían distorsionar el modelo
Unificar formatos de fecha: Fundamental para análisis temporales
Variables esenciales para predicción
Para un modelo de demanda, asegúrate de incluir:
Variable temporal: Fecha, mes, trimestre, año
Variable objetivo: Unidades vendidas, ingresos, demanda
Variables explicativas: Precio, promociones activas, estacionalidad, competencia, factores externos (clima, festividades)
Para riesgo, necesitas variables históricas del comportamiento más la etiqueta conocida (cliente incumplió: Sí/No).
Consejo pro: Crea una pestaña separada con tus datos originales sin modificar. Trabaja siempre en una copia, preservando la fuente original por si necesitas volver atrás.
Paso 2: Usar complemento ML para construir el modelo
Con tus datos perfectamente preparados, es momento de construir el modelo predictivo. Utilizaremos DataRobot como ejemplo, aunque el proceso es similar con otros complementos de AutoML.
Cargar datos en el complemento
Abre DataRobot desde la pestaña de complementos en Excel. Selecciona tu rango de datos preparados (incluyendo encabezados). El complemento validará automáticamente la estructura y te alertará sobre posibles problemas. Si todo está correcto, los datos se cargarán en la plataforma para análisis.
Definir el objetivo del modelo
Especifica qué columna contiene la variable que deseas predecir (tu «target»). Para predicción de demanda, selecciona la columna de ventas o unidades. Para clasificación de riesgo, selecciona la columna que indica si hubo incumplimiento. DataRobot identificará automáticamente si es un problema de regresión (valores continuos) o clasificación (categorías).
Configurar opciones del modelo
Aunque DataRobot automatiza la mayoría de decisiones, puedes personalizar:
División de datos: Típicamente 80% entrenamiento, 20% validación Métrica de optimización: Precisión, RMSE, F1-score según tu prioridad Variables a incluir/excluir: Deselecciona columnas irrelevantes como IDs Tiempo de entrenamiento: Más tiempo = más modelos probados = mejor resultado potencial
Ejecutar entrenamiento automático
Haz clic en «Iniciar» y observa cómo DataRobot prueba docenas de algoritmos diferentes: regresión lineal, árboles de decisión, gradient boosting, redes neuronales, y más. La plataforma muestra un leaderboard en tiempo real rankeando modelos por precisión. Este proceso puede tomar desde minutos hasta horas según el tamaño de tus datos y la configuración elegida.
Selección del modelo ganador
Una vez completado, DataRobot recomienda el modelo con mejor desempeño. Revisa sus características: tipo de algoritmo utilizado, variables más importantes identificadas, y métricas de rendimiento. La plataforma proporciona visualizaciones intuitivas que explican cómo el modelo toma decisiones, crucial para generar confianza en los resultados.
Sin código, sin matemáticas complejas: Todo este proceso que antes requería programación en Python y conocimientos avanzados de estadística ahora sucede mediante una interfaz visual guiada. Tu rol es entender el contexto de negocio y tomar decisiones estratégicas, mientras el complemento maneja la complejidad técnica.