Reseña de GPT Image 2: lo he probado durante 2 semanas en 5 casos de uso y los resultados me han parecido sorprendentes

Aunque las demostraciones de marketing siempre parecen perfectas, los resultados en el mundo real suelen ser una historia completamente diferente.

GPT Image 2, el nuevo modelo de imagen de OpenAI, promete una representación de texto casi perfecta y fotorrealismo. Pero, ¿puede realmente manejar los prompts desordenados y complicados que usamos todos los días? ¿Está a la altura de la promesa?

Para averiguarlo, pasé las últimas dos semanas llevando a GPT Image 2 a sus límites absolutos. Aquí está mi reseña honesta y sin filtros de GPT Image 2, probada en cinco escenarios distintos.

En resumen: ¿merece la pena GPT Image 2?

GPT Image 2 merece la pena absolutamente para creadores y profesionales del marketing que priorizan la precisión sobre el caos artístico.

Me parece un gran salto adelante en la representación de texto y los diseños realistas, pero definitivamente sacrifica parte del estilo artístico que se encuentra en los modelos más antiguos.

Si tu trabajo depende de recursos de marketing limpios o maquetas de IU precisas, es increíble; sin embargo, si buscas arte abstracto y salvaje, puede que los resultados te parezcan demasiado realistas.

Característica	Rendimiento de GPT Image 2
Mejor en	Renderizado de texto, maquetas de IU, rostros humanos fotorrealistas
Peor en	Arte abstracto muy estilizado, escenas de fantasía caóticas
Velocidad	~15 segundos por generación (nivel estándar)
Precio	Incluido en ChatGPT Plus (20 $/mes) o Pro (200 $/mes)
Para quién es	Profesionales del marketing, diseñadores y creadores que necesitan un control preciso

Puedes leer la descripción completa de GPT Image 2 para obtener información más detallada.

Cómo probé GPT Image 2

Puse a prueba GPT Image 2 en 5 escenarios de prueba estandarizados, cada uno con 3-5 variaciones de prompts que iban desde simples hasta deliberadamente conflictivos.

Cada imagen se generó desde cero: sin seleccionar los mejores resultados, sin escalado ni posprocesamiento. Califiqué cada prueba sobre 10 basándome en el seguimiento del prompt, la calidad técnica, la consistencia entre ejecuciones y la utilidad práctica para el trabajo creativo real. Déjame mostrarte exactamente lo que encontré.

Prueba 1: Rostros humanos y microexpresiones

Necesitaba imágenes con calidad de retrato de personas que mostraran emociones sutiles y específicas. No solo "feliz" o "triste". Esperaba que pudiera mostrarme microexpresiones como "una mujer de 40 años tratando de ocultar su agotamiento durante una reunión de trabajo" o "un adolescente fingiendo tener confianza pero visiblemente nervioso".

Para saber si GPT Image 2 puede generar una textura de piel creíble y matices emocionales, usé estos tres prompts y aquí están los resultados que obtuve.

Prompt	Resultado de la imagen
Un primer plano de un hombre de 40 años con sutiles patas de gallo, con una expresión ligeramente confusa pero divertida. Está en una cafetería con poca luz. Textura de piel natural, poros visibles, iluminación cinematográfica.
Primer plano de una mujer mayor riendo, con arrugas profundas alrededor de los ojos, la luz del sol incidiendo en el vello fino de su cara. Textura de piel de alta resolución, sin suavizado.
Una joven profesional en una sala de juntas, con aspecto decidido pero ligeramente cansada, con sutiles ojeras bajo los ojos y una ligera inclinación de la cabeza. Iluminación suave de oficina.

El resultado de los tres prompts me dejó realmente asombrado. Me impresionó cómo GPT Image 2 clavó la sutil diversión en los ojos mientras mantenía imperfecciones realistas de la piel como los poros y el vello fino.

A mi parecer, no parecía un maniquí de plástico en absoluto, e incluso el aspecto "cansado" que pedí en el tercer prompt me pareció auténtico en lugar de exagerado.

También me di cuenta de cómo la iluminación envolvía los rostros de forma natural, y el desenfoque del fondo me pareció que salía directamente del objetivo de una cámara real.

Puntuación: 9,5/10

Prueba 2: Renderizado de texto

Esta vez, quería ver si el modelo podía generar un letrero de tienda realista sin convertir las letras en jeroglíficos alienígenas. Así que usé prompts que incluían símbolos, números y palabras.

Prompt	Resultado de la imagen
Un letrero de neón en un callejón ciberpunk lluvioso que dice claramente 'Midnight Noodle Bar' en letras de color rosa brillante, con un letrero más pequeño debajo que dice 'Open 24/7'.
Un cartel de menú de restaurante de los años 50 que lista 'Burgers $5.00', 'Shakes $3.00' y 'Fries $2.00' en una fuente de escritura clásica.
El escaparate de una librería limpia y moderna con el nombre 'The Paper Architect' en una elegante tipografía serif en el cristal de la ventana.

Basándome en los resultados anteriores, pensé que GPT Image 2 efectivamente manejó la ortografía perfectamente, tal como promocionó OpenAI.

De hecho, escribió todo correctamente en cada una de las pruebas que realicé. Vi cómo el modelo renderizaba perfectamente 'Midnight Noodle Bar', los precios específicos en el menú del restaurante y el elegante 'The Paper Architect' sin un solo error tipográfico.

También me di cuenta de cómo el brillo del neón se reflejaba con precisión en los charcos. Y, en mi opinión, la tipografía serif en el escaparate de la librería parecía diseñada profesionalmente.

Aunque descubrí que las opciones de fuente a veces pueden parecer un poco rígidas, aun así pensé que merecía una puntuación alta en renderizado de texto.

Puntuación: 9/10

Prueba 3: Edición perfecta a nivel de píxel

Las modificaciones precisas suelen ser donde la mayoría de los modelos fallan. Así que quería ver si GPT Image 2 podía manejar este tipo de diseño iterativo sin arruinar toda la composición.

Para probar esto, realicé cuatro tareas de edición separadas que requerían que el modelo aislara y modificara detalles específicos manteniendo el resto del entorno idéntico.

Prompt: Cambia el cojín de seda azul del lado izquierdo del sofá por un cojín de terciopelo naranja quemado con un patrón geométrico, manteniendo todos los demás elementos, la iluminación y las sombras idénticos.
Imagen de entrada	Resultado de la imagen

Prompt: Añade una pequeña taza humeante de café solo a la mesita auxiliar de madera vacía, asegurándote de que el vapor parezca natural y que la iluminación coincida con la de la lámpara que está al lado.
Imagen de entrada	Resultado de la imagen

Prompt: Cambia el color de los ojos de la modelo de marrón a un penetrante verde esmeralda, manteniendo el brillo y los reflejos exactamente iguales.
Imagen de entrada	Resultado de la imagen

Prompt: Sustituye la moderna mesa de centro de cristal del centro de la habitación por una mesa rústica de madera de roble oscuro, manteniendo los mismos reflejos en el suelo y en la alfombra circundante.
Imagen de entrada	Resultado de la imagen

Me quedé de piedra con la consistencia. Y diría que su capacidad para aislar y modificar detalles específicos mientras mantiene la iluminación y el entorno intactos está a años luz.

Como puedes ver, GPT Image 2 cambió el cojín, añadió la taza de café e incluso reemplazó la mesa entera sin problemas, haciendo coincidir perfectamente las sombras y la iluminación existente.

El cambio de color de ojos fue particularmente impresionante porque no parecía una capa plana; mantuvo la profundidad natural del iris.

Apuesto a que si no te hubiera mostrado el proceso, definitivamente pensarías que obtuve estos resultados en Photoshop.

Puntuación: 9,5/10

Prueba 4: Realismo basado en el conocimiento del mundo

También probé si el modelo poseía un profundo "sentido común" desafiándolo con estilos arquitectónicos y ambientales específicos y no famosos.

En lugar de dejar que usara imágenes genéricas por defecto, lo empujé a renderizar texturas y lógica estructural específicas para ver si entendía cómo los materiales envejecen e interactúan con su entorno.

Prompt	Resultado de la imagen
Una vista de la calle de un complejo de apartamentos brutalista tradicional en Londres en un día gris y nublado. Texturas de hormigón, ventanas pequeñas y manchas de desgaste en las paredes.
Una toma a gran altitud de un paisaje volcánico en Islandia, con columnas de basalto negro, respiraderos geotérmicos humeantes y manchas de musgo verde neón.
Interior de una botica francesa del siglo XIX, con estanterías de madera oscura, frascos de vidrio etiquetados a mano y un mostrador de mármol con ligeras grietas y desgaste.
Una toma detallada de un cuenco Kintsugi japonés tradicional, donde las grietas rellenas de oro están ligeramente elevadas y captan la luz suave de un salón de té.
El compartimento del motor de un muscle car clásico de los años 60, mostrando la disposición específica de un motor V8 con piezas cromadas desgastadas y cableado de época.

No solo obtuve imágenes de edificios o escenarios de GPT Image 2, sino también la atmósfera tal como la había imaginado.

Por ejemplo, en el primer resultado, los patrones de desgaste en las paredes se veían exactamente como los daños por lluvia que he visto en Londres en la vida real, lo que me demostró que el modelo tiene una increíble comprensión del realismo basado en el conocimiento del mundo.

El cuenco Kintsugi y el compartimento del motor V8 fueron particularmente notables porque requerían conocimientos técnicos específicos. El modelo colocó correctamente las grietas rellenas de oro en la cerámica y dispuso con precisión los componentes del motor.

Me sorprendió absolutamente el hecho de que entiende la "física" de cómo envejecen los materiales en climas específicos, todo sin que yo tuviera que guiarlo explícitamente a través del prompt.

Puntuación: 9/10

Prueba 5: Seguimiento extremo de instrucciones

Llevar a GPT Image 2 a un escenario de "prompt de pesadilla" era la única manera de probar realmente su punto de ruptura. Así que le lancé cinco listas separadas de requisitos distintos y potencialmente conflictivos.

Como el seguimiento extremo de instrucciones es donde la mayoría de los modelos de IA suelen perderse, especifiqué ubicaciones exactas, iluminación localizada y texturas hiperespecíficas para múltiples objetos para ver qué detalles se omitirían.

Prompt	Resultado de la imagen
Una mesa de madera con una manzana roja a la izquierda, un vaso de leche medio lleno en el centro y un libro abierto a la derecha. Un único haz de luz incide solo en la manzana. El fondo es completamente negro. Las páginas del libro están amarillentas y la leche tiene una pequeña burbuja en la superficie.
Una plaza de una ciudad futurista donde llueve en la mitad izquierda de la imagen pero hace sol en la mitad derecha. Un hombre con un impermeable amarillo está bajo la lluvia y una mujer con un vestido rojo está al sol. La sombra del hombre debe proyectarse hacia el centro.
Un escritorio con un portátil, una taza de café y una suculenta. La pantalla del portátil muestra un editor de código con texto en verde. La taza de café es azul con un asa blanca. La suculenta está en una maceta de terracota. La taza debe colocarse exactamente a 2 pulgadas a la derecha de la suculenta.
Una encimera de cocina con tres frascos: uno lleno de canicas azules, uno con arena roja y otro vacío. El frasco de canicas azules debe estar en el medio. Un gato está sentado detrás de los frascos, pero solo sus orejas son visibles por encima de las tapas.
Un espacio de trabajo donde una persona está dibujando la imagen de un gato en una tableta, mientras un gato real se sienta a su lado mirando la tableta. La pantalla de la tableta debe mostrar el dibujo en proceso, y la persona debe llevar un anillo verde en el pulgar izquierdo.

En mi opinión, los resultados fueron evidentes para la capacidad de seguimiento de instrucciones de GPT Image 2.

Capturó casi todos los detalles con una precisión notable en los cinco prompts, desde la pequeña burbuja en la superficie de la leche y la iluminación localizada en la manzana, hasta las "orejas de gato" altamente específicas.

Incluso el "anillo verde en el pulgar izquierdo" del Prompt E se renderizó perfectamente, un detalle que la mayoría de los modelos simplemente ignorarían.

Este nivel excepcional de seguimiento del prompt es posiblemente la mayor fortaleza del modelo, y creo que hace de GPT Image 2 una herramienta indispensable para los usuarios que quieren que su visión exacta se traduzca en píxeles sin concesiones.

Puntuación: 10/10

Lo que dicen los usuarios reales

Las opiniones están muy divididas. Mientras que los profesionales adoran la precisión, los usuarios ocasionales echan de menos el caos artístico de los modelos más antiguos.

Mirando en Reddit y Twitter, el sentimiento es claro. Los usuarios en r/OpenAI están elogiando la capacidad del modelo para seguir instrucciones complejas. Un usuario señaló: "Finalmente entiende exactamente dónde quiero que se coloquen los objetos en el encuadre".

Pero otros sienten que ha perdido su alma. Una queja común es que GPT Image 2 prioriza tanto el realismo que le cuesta producir arte verdaderamente inspirador o abstracto.

Mi opinión personal

Creo que si GPT Image 2 es el mejor generador de imágenes de IA del mercado depende en gran medida de lo que intentes hacer.

En mi opinión, es un genio para el trabajo comercial, pero todavía no puede con la creatividad pura y caótica.

Si necesito una maqueta de producto, un retrato realista o una imagen con texto, recurriré a GPT Image 2 siempre. Me ahorra horas de trabajo en Photoshop.

Pero si quiero generar un paisaje de fantasía salvaje y abstracto, me encuentro echando de menos la naturaleza impredecible de los modelos más antiguos.

Puedes consultar la comparativa GPT Image 2 vs Nano Banana 2 para entender mejor las aplicaciones del mundo real de GPT Image 2.

En resumen, es la herramienta definitiva para los profesionales, pero podría aburrir a los artistas.

Cómo acceder a GPT Image 2 ahora mismo

Puedes usar GPT Image 2 a través del acceso oficial o de Pollo AI.

Actualmente, OpenAI está realizando pruebas A/B del modelo dentro de ChatGPT Plus, lo que significa que puedes tenerlo un día y perderlo al siguiente. El mencionado nivel ChatGPT Pro promete acceso completo, pero es un precio elevado para la mayoría de los usuarios.

Si quieres un acceso garantizado y fácil sin jugar al juego de las pruebas A/B, Pollo AI te ofrecerá una forma sencilla de usar GPT Image 2 y otros modelos de primer nivel.

Es una plataforma de generación integral que reúne los modelos de IA más potentes de la industria en un único espacio de trabajo optimizado.

Con GPT Image 2 ya disponible en Pollo AI, puedes integrar hoy mismo sus capacidades avanzadas en tu flujo de trabajo creativo.

La plataforma también te da la flexibilidad de cambiar entre otros modelos de primer nivel como Nano Banana 2 y Seedream 5.0. Eso significa que siempre puedes tener las mejores herramientas a tu alcance, independientemente de los requisitos del proyecto.

Además de servir como un centro de modelos, la plataforma cuenta con Pollo Agent, que está diseñado para transformar tus ideas en bruto en contenido listo para publicar.

Tendrás formas aún más sofisticadas de crear porque GPT Image 2 también se integrará en Pollo Agent.

Lo mejor de todo es que puedes tener acceso gratuito a GPT Image 2 en Pollo AI. Así podrás probar a fondo todo el potencial de GPT Image 2 sin ningún coste inicial.

En lugar de quedarte al margen, puedes dominar los mejores modelos de hoy ahora y estar perfectamente posicionado cuando el segundo GPT Image 2 se lance.

Veredicto final

GPT Image 2 es un gran paso adelante para la utilidad de la IA. Soluciona las partes más frustrantes de la generación de imágenes con IA: errores de ortografía y detalles de los prompts ignorados.

Aunque puede que no sea el modelo más "divertido" para jugar, es innegablemente el más útil para aplicaciones del mundo real.

Si eres un profesional del marketing, diseñador o creador de contenido, esta es la actualización que has estado esperando.

Preguntas frecuentes

¿Cuál es la diferencia entre GPT Image 2 y DALL-E 3?

GPT Image 2 se centra en gran medida en el fotorrealismo, la representación precisa de texto y el seguimiento exacto de los prompts, lo que lo hace mejor para uso comercial. Generalmente se considera que DALL-E 3 es más "creativo" y mejor en arte estilizado o abstracto.

¿Puede GPT Image 2 escribir palabras correctamente?

Sí, tiene capacidades de representación de texto casi perfectas, lo que le permite generar letreros, documentos y elementos de IU legibles con errores mínimos.

¿Es gratis usar GPT Image 2?

No, actualmente se está probando en niveles de pago como ChatGPT Plus y el mencionado ChatGPT Pro. Pero puedes usar GPT Image 2 a través de Pollo AI para obtener una prueba gratuita.

¿Puedo usar GPT Image 2 para el desarrollo comercial de API?

Actualmente, el modelo está disponible principalmente para pruebas manuales a través de ChatGPT y plataformas como Pollo AI. Aunque se espera un lanzamiento completo de la API, la mayoría de los desarrolladores lo están usando actualmente para prototipar recursos de alta fidelidad antes de que la integración a nivel empresarial esté ampliamente disponible.

¿Admite GPT Image 2 múltiples relaciones de aspecto?

Sí, es mucho más flexible que los modelos anteriores. Durante mis pruebas, descubrí que podía manejar todo, desde cuadrados estándar 1:1 hasta formatos cinematográficos 16:9 y verticales 9:16 sin estirar o distorsionar los sujetos, lo cual es una gran victoria para los creadores de redes sociales.

¿Ha mejorado la consistencia del sujeto en proyectos de varias tomas?

Significativamente, GPT Image 2 es mucho mejor para mantener las características de un personaje o el diseño de un producto en diferentes prompts. Noté que si describía un personaje en detalle una vez, el modelo podía replicarlo en diferentes poses con una consistencia de alrededor del 80-90 %.