OpenAI posouvá generování obrázků v ChatGPT na praktičtější úroveň. Images 2.0 má lépe chápat zadání, zvládat text v obrázcích a nově míří i na pracovní využití.
ChatGPT Images 2.0 má být mnohem víc než jen hračka na generování obrázků. OpenAI u něj slibuje přesnější práci s promptem, lepší vykreslení textu a schopnost vytvářet výstupy, které se dají rovnou použít v designu, prezentacích nebo obsahu.
Images 2.0 míří na přesnost, ne jen na efekt
Největší změna je v tom, že nový model nemá obrázky jen „vyrábět“, ale má je i lépe pochopit. OpenAI tvrdí, že Images 2.0 zvládá složitější zadání, přesněji drží detaily a lépe pracuje s prvky, které dříve generativní modely často kazily – třeba s malým textem, ikonami, rozhraním nebo hustými kompozicemi.
Pro uživatele to znamená méně pokusů a oprav. Pokud potřebujete obrázek pro marketing, náhled do článku, storyboard nebo třeba jednoduchý koncept rozhraní, výsledek má být blíž použitelné podobě už na první pokus. To je důležité hlavně pro každého, kdo neřeší jen kreativní experiment, ale chce rychle dostat výstup do práce.
OpenAI zároveň zdůrazňuje, že Images 2.0 má lépe zvládat i různé vizuální styly. Mluví o větší konzistenci v realistických fotkách, manga stylu, pixel artu i dalších výrazných estetických směrech, přičemž se zlepšuje práce se světlem, texturou i kompozicí.
Nejvíc se projeví v praxi: formáty, jazyky a workflow
Novinka je zajímavá hlavně tím, že se neomezuje na „hezké obrázky“. Images 2.0 umí nově generovat výstupy v širokém rozsahu poměrů stran, od extra širokých bannerů až po úzké formáty pro mobil nebo sociální sítě. To snižuje potřebu dalšího ořezu a úprav v editoru.
Velký posun přichází i u jazyků. Model má podle OpenAI výrazně lépe vykreslovat nelatinkové písmo, zejména japonštinu, korejštinu, čínštinu, hindštinu a bengálštinu. V praxi to pomůže všude tam, kde text není jen doplněk, ale přímá součást vizuálu – třeba v plakátech, infografikách nebo komiksech.
Nejdál ale OpenAI jde v tom, že do generování obrázků přidává i prvek „myšlení“. Při použití s výkonnějšími modely má Images 2.0 zvládnout složitější zadání, pracovat s aktuálními informacemi a vytvořit až osm navazujících výstupů v jednom zadání. Pro tvůrce obsahu, designéry i týmy kolem produktů to může znamenat konec zdlouhavého skládání vizuálů po jednom.
Je ale fér dodat, že systém není bez limitů. OpenAI samo přiznává slabší místa hlavně u velmi přesného fyzického modelování, extrémně detailních diagramů nebo hustých struktur. Pro běžné použití je to však i tak další krok k tomu, aby generování obrázků bylo méně o loterii a víc o skutečném pracovním nástroji.
Podrobnosti přinesl také Petapixel.
