La IA, el pincel del siglo XXI: generación de imágenes y plataformas gratuitas
Antes de la Inteligencia Artificial, crear una imagen requería un lienzo, un pigmento o una lente. Pero, ahora, solo se necesita una idea y una frase o prompt (instrucción). Esta es la era de la imaginación artificial, una revolución tecnológica que entregó a millones de personas el poder de crear mundos visuales con solo palabras.
Lo que comenzó como un experimento en laboratorios de investigación se convirtió, en agosto de 2025, en un fenómeno cultural y en una de las herramientas creativas más accesibles y disruptivas de la generación actual.
Este boom no es casual, ya que se debe a la democratización de la tecnología a través de plataformas gratuitas al alcance de un clic. Pero, ¿cómo funcionan y quiénes son los titanes detrás de esta nueva forma de arte?
Maestros del Arte Digital
Aunque existen decenas de modelos, tres nombres se fueron consolidando como los pilares del acceso gratuito a la generación de imágenes por IA.
1 Midjourney
Si la IA tuviera un alma de artista bohemio, se llamaría Midjourney porque esta herramienta no solo crea imágenes, sino que interpreta sueños con un estilo cinematográfico y una atención al detalle que roza lo obsesivo, según los usuarios.
¿Qué es y quién la creó? Midjourney es un laboratorio de investigación independiente liderado por David Holz1. Lanzó su beta abierta en julio de 2022, operando de una forma muy particular: a través de un servidor de Discord2.
Evolución a 2025: Desde su primera versión, que ya era impresionante, Midjourney ha tenido una de las evoluciones más meteóricas. Para agosto de 2025, sus versiones más recientes (V7 y V8) alcanzaron un hiperrealismo casi indistinguible de la fotografía profesional y una capacidad para generar estilos artísticos complejos que lo mantienen como el favorito de diseñadores e ilustradores. Ahora permite un control granular sobre la composición y la consistencia de personajes entre diferentes imágenes.
¿Cómo se usa? El usuario escribe el comando /imagine seguido de una descripción de texto (prompt) en su canal de Discord. La IA devuelve cuatro opciones visuales. A partir de ahí, el usuario puede generar variaciones o mejorar la resolución de la que más le guste. Su principal función es la creación de imágenes artísticas y estilizadas de altísima calidad.
2 Stable Diffusion: La Revolución del Código Abierto
Al ser de código abierto, no pertenece a una sola plataforma, sino que vive en miles de aplicaciones y sitios web gratuitos, permitiendo una personalización y una libertad inigualables.
¿Qué es y quién la creó? Es un modelo de IA de texto a imagen lanzado en agosto de 2022 por la empresa Stability AI, en colaboración con investigadores académicos3. Su principal característica es que su código es público, lo que desató una explosión de creatividad en la comunidad de desarrolladores4.
Evolución a 2025: Su evolución ha sido impulsada por la comunidad. Para 2025, existen miles de “modelos personalizados” entrenados por usuarios para generar estilos específicos: anime, arte medieval, modelos de arquitectura, etc. Las versiones oficiales como SDXL 2.0 han mejorado drásticamente la coherencia y la calidad, y ahora se integra con herramientas de edición que permiten “inpainting” (modificar una parte de la imagen) y “outpainting” (expandir la imagen más allá de sus bordes originales) con una facilidad asombrosa.
¿Cómo se usa? A través de diversas plataformas web gratuitas (como Mage.space o Playground AI) donde simplemente se escribe un prompt. Los usuarios avanzados pueden descargar el modelo y ejecutarlo en sus propios ordenadores, lo que les da control total sobre los parámetros de la creación.
3 DALL-E 3: El Genio Accesible
Creado por los mismos desarrolladores de ChatGPT, su principal fortaleza es la facilidad de acceso y su increíble capacidad para interpretar las frases tal y como se las pides.
¿Qué es y quién la creó? Fue desarrollado por el laboratorio OpenAI. La primera versión se presentó en enero de 2021, pero fue DALL-E 2 (abril de 2022) la que capturó la atención del mundo5.
Evolución a 2025: El gran salto fue DALL-E 3 (septiembre de 2023), que se integró directamente en herramientas masivas como Microsoft Copilot (anteriormente Bing Chat), haciéndolo gratuito y accesible para cientos de millones de personas6. Para 2025, DALL-E 3 ha perfeccionado su capacidad para generar texto legible dentro de las imágenes y una coherencia narrativa impecable, entendiendo prompts largos y complejos con una precisión asombrosa.
¿Cómo se usa? Es el más sencillo. Dirígete a ChatGPT y haz clic en Explorar GPT en la barra lateral, luego de iniciar sesión. Simplemente, pides en lenguaje natural que dibuje o cree una imagen. Por ejemplo: “Crea una imagen de un astronauta montando a caballo en Marte, en un estilo fotorrealista”. La IA se encarga del resto.
Google ‘Nano Banana’: La IA que Dibuja desde tu Bolsillo
Nano Banana es el nombre de una revolucionaria IA generadora de imágenes desarrollada por Google, diseñada específicamente para funcionar de manera ultrarrápida y eficiente en dispositivos móviles.
A diferencia de otros modelos que dependen de potentes servidores en la nube, Nano Banana utiliza el poder de Gemini Nano para ejecutar las creaciones directamente en el hardware del teléfono.
El nombre es una combinación ingeniosa que revela su propósito:
“Nano”: Proviene directamente de la tecnología Gemini Nano, indicando su naturaleza compacta y su capacidad para operar en dispositivos con recursos limitados.
“Banana”: Es un nombre juguetón, una práctica muy común en Google (como los nombres de postres para las versiones de Android). Podría interpretarse como un guiño a la facilidad y accesibilidad, algo tan simple como “pelar una banana”.
¿Cuál es su gran innovación? Es la inmediatez y la privacidad. Al no necesitar enviar tus ideas a un servidor externo, la creación de imágenes es casi instantánea y completamente privada, ya que todo el proceso ocurre dentro de tu dispositivo. Esto abre la puerta a la creación de stickers para chats en tiempo real, la modificación de fotos al instante o la generación de visuales para notas sin necesidad de conexión a internet.
La era de pensar una imagen y verla nacer en la palma de la mano comenzó, pero ahora que todas las personas se convierten en directores de la película de su propia imaginación, ¿cómo cambiará la realidad que se comparte?
¿Qué pasó con el canguro de apoyo emocional?
Texto: Infobae
El reciente caso del canguro sirvió como ejemplo de un fenómeno en crecimiento, es decir, la desinformación impulsada por imágenes generadas por IA. Esto confirma lo que los expertos advierten desde hace tiempo: ya no basta con “ver para creer”.
Según NBC News, aproximadamente el 80% de las afirmaciones de desinformación verificadas involucran medios visuales, y desde 2022 los videos han comenzado a dominar ese espacio. Alexios Mantzarlis, director de la Iniciativa de Seguridad, Confianza y Protección en Cornell Tech, explicó que estamos inmersos en una nueva ola tecnológica con gran capacidad de alterar la realidad percibida
“Atravesamos oleadas de avances tecnológicos que nos impactan por su capacidad de manipular y alterar la realidad, y estamos atravesando una ahora”, dijo Mantzarlis. “La pregunta es: ¿con qué rapidez podemos adaptarnos? Y, entonces, ¿qué medidas de seguridad podemos implementar para evitar sus efectos perjudiciales?”
Cayce Myers, una de las investigadoras citadas en el estudio, señaló que los errores visuales que antes permitían identificar contenido falso son cada vez menos frecuentes, lo que dificulta el reconocimiento inmediato del engaño.
Frente a este panorama, Mantzarlis propone un cambio de paradigma en cómo interpretamos lo que vemos. “El contenido por sí solo ya no será suficiente para evaluar la veracidad y la fiabilidad”, dijo. “Creo que es necesario tener el contexto completo: ¿Quién lo compartió contigo? ¿Cómo se compartió? ¿Cómo sabes que fueron ellos?”




























