Érkezik a DALL-E 3: Az OpenAI útja a fejlettebb multimodális AI felé
A DALL-E 3 a ChatGPT-t létrehozó cég, az OpenAI képgeneráló megoldásának legújabb verziója. Ha mesterséges intelligenciáról van szó, az egyik legismertebb program ami az embernek az eszébe jut, az a ChatGPT. A ChatGPT-t létrehozó cég, az OpenAI azonban több terméken is dolgozik. Ezek közül az egyik a DALL-E nevű képgeneráló generatív AI megoldás, ami hamarosan megérkezik a legújabb, 3-mas verziójával.
Egy korábbi cikkünkben már összehasonlítottuk a DALL-E 2-es megoldását a Midjoruney és Stable Diffusion generatív AI képalkotókkal. Most lássuk mit is ígér a DALL-E 3-mas verziója:
- A DALL·E 3 beépül a ChatGPT-be, ami nagy előny például a Midjourney Discord-ban való használatához képest, hiszen sokkal egyszerűbb felhasználói élményt biztosít ha mindent egy helyen érnek el a userek.
- A ChatGPT segít a prompt engineering területén is, könnyebben fogalmazhatják meg a felhasználók a kéréseket. A chatbot segítségével könnyen tudjuk alakítani a képeinket anélkül hogy nulláról kezdenénk a promptolást.
- Képes lesz általunk előre megadott szöveget is megjeleníteni a képen (ez jelenleg nehezen, leginkább sehogy sem megy a jelenleg elérhető mesterséges intelligencia alapú megoldásoknál)
- Korábban sok kritika érte a képek minőségét a Midjourney vagy Stable Diffusion által létrehozott képekhez képest. A 3-mas verzió jelentős minőségi javulást ígér. Ezt kíváncsian várjuk!
Érdekes látni, ahogy előtérbe kerülnek a multimodal megoldások, jelen esetben az OpenAI megoldása képes lesz egyszerre szöveget és képet is generálni. Ez azt is eredményezi hogy a felhasználók egy felületen belül maradnak, nem kell kattintgatni a különböző programok között.
Ha szeretnél mélyebben elmerülni a Generative AI technológiákban és kipróbálnád magad a gyakorlatban is, jelentkezz hamarosan induló képzésünkre ITT!