OpenAI stellt GPT-Image-2 vor: Realistischere Fotos, bessere Text-Darstellung
OpenAI hat GPT-Image-2 offiziell vorgestellt – das neue Bildmodell soll fotorealistische Qualität liefern, Text in Bildern zuverlässiger darstellen und den typischen KI-Look überwinden.
OpenAI GPT-Image-2: Technische Details
OpenAI hat sein neues Bildmodell GPT-Image-2 offiziell in einem Livestream vorgestellt. Das Modell kursierende bereits seit Wochen unter seinem Codenamen und wurde von ersten Testern in den USA ausprobiert – die Ergebnisse tauchten auf Plattformen wie X und Reddit auf und sorgten für Aufsehen.
Technisch soll GPT-Image-2 vor allem bei komplexen Bildern mit Text erheblich besser sein als der Vorgänger GPT-Image-1.5. Das Modell kann detaillierte Screenshots und Diagramme generieren, bei denen Text präzise und lesbar dargestellt wird – ein lange bekanntes Schwachpunkt bisheriger Bildmodelle. Zudem adressiert OpenAI den sogenannten „KI-Look" mit übermäßig glatten Gesichtern und steriler Beleuchtung, der bisherige Modelle unnatürlich wirken ließ.
Die Qualität soll nun an Googles Nano Banana Pro heranreichen, das bislang bei fotorealistischer Bildgenerierung führend war. Bislang haben nur Tester mit US-Accounts frühzeitigen Zugang erhalten; ein globaler Rollout ist zu erwarten.
Quelle: The Decoder