ChatGPT Images 2.0: OpenAI führt Denkmodus und Websuche für Bildgenerierung ein
OpenAI hat ChatGPT Images 2.0 offiziell vorgestellt: Das neue GPT-Image-2-Modell kann vor der Generierung 'denken', das Internet durchsuchen und bis zu acht konsistente Bilder aus einem Prompt erstellen. API-Preise sind token-basiert und auflösungsabhängig.
ChatGPT Images 2.0: Technischer Deep-Dive in den neuen Bildgenerator
OpenAI hat ChatGPT Images 2.0 offiziell gelauncht und damit das zugrundeliegende GPT-Image-2-Modell für alle Nutzer freigegeben. Das zentrale neue Feature ist der sogenannte Denkmodus (Thinking Mode): Das Modell analysiert den Prompt zunächst in einem Chain-of-Thought-Prozess — ähnlich wie OpenAIs o-Serie bei Textaufgaben — und kann dabei sogar das Internet durchsuchen, um aktuelle Referenzen einzubeziehen.
Mit aktiviertem Denkmodus generiert ChatGPT Images 2.0 bis zu acht Bilder gleichzeitig aus einem einzigen Prompt, wobei Charaktere, Objekte und Stile über alle Bilder hinweg konsistent bleiben sollen. Technisch verbessert wurde zudem die Unterstützung von nicht-lateinischen Schriften sowie von kleinem Text, Ikonografien und UI-Elementen — klassische Schwachstellen bisheriger Diffusionsmodelle. Die unterstützten Seitenverhältnisse reichen von 3:1 bis 1:3, die API-Auflösung bis zu 2K.
Über die API ist das Modell als gpt-image-2 verfügbar. Die token-basierte Abrechnung: 8 USD per Million Bild-Input-Token, 30 USD per Million Bild-Output-Token. Ein 1024×1024-Bild in hoher Qualität kostet 0,211 USD — teurer als GPT-Image-1.5 (0,133 USD) bei Standardauflösung, aber günstiger bei großen Formaten (0,165 USD vs. 0,20 USD für 1024×1536). Der Denkmodus (Thinking) ist nur für Plus-, Pro- und Business-Abonnenten verfügbar.
Quelle: The Decoder