1.5. Ejemplos de prompts multimodales
La calidad del prompt define la calidad del resultado. Aquí van algunos ejemplos:
Para DALL·E (texto → imagen):
“Una ilustración en estilo acuarela de un paisaje montañoso, con un lago en primer plano, luz al amanecer y tonos pastel, formato apaisado.”
Para Sora (texto → video):
“Un clip de 10 segundos mostrando un dron sobrevolando un bosque nevado, cámara en travelling, niebla suave y colores fríos, estilo cinematográfico 4K.”
1.6. Limitaciones actuales
Aunque la IA multimodal es muy potente, aún presenta algunas limitaciones:
• Coherencia de escenas complejas: DALL·E y Sora pueden generar inconsistencias cuando hay demasiados elementos en un prompt.
• Movimientos realistas: Sora aún está limitada a clips cortos (entre 5 y 20 segundos).
• Propiedad intelectual: Es importante respetar derechos de autor y licencias al generar contenido.
• Ética y uso responsable: Evitar crear imágenes o videos engañosos o difamatorios.
1.7. Mini-ejercicio práctico
Objetivo: Entender cómo un prompt influye en los resultados.
Duración: 10 minutos.
1. Abre ChatGPT con DALL·E integrado.
2. Introduce el siguiente prompt:
“Un café latte en una taza blanca sobre una mesa de madera, fotografía macro, colores cálidos.”
3. Observa el resultado.
4. Ahora modifica el prompt añadiendo:
“… en estilo pintura impresionista.”
5. Compara ambos resultados y analiza las diferencias.Conclusión
La generación multimodal está transformando la creación de contenido. Gracias a DALL·E y Sora, cualquier persona puede producir imágenes y videos de calidad profesional, optimizando procesos creativos y acelerando el trabajo en marketing, educación y diseño.