Vissza a Blogra

Mi az a Prompt Engineering? Értsük meg egy példán keresztül!

3
 perc

Vendégszerző: Bereczki Nóra

Az utóbbi pár hónapban a csapból is olyan szavak folytak mint a mesterséges intelligencia (MI), chatGPT, nyelvi modellek, gépi tanulás, természetes nyelvi modell (NLP/Natural Language Processing), Midjourney, DALL-E, Bing és még sorolhatnánk... Mindenki érezheti, hogy jelenleg egy technológiai forradalom zajlik, ahol egymás után jelennek meg AI alapú generatív megoldások. Kapkodhatjuk kétségbeesetten a fejünket, vagy megpróbálhatjuk megérteni az alapokat annak érdekében, hogy ne vesszünk el teljesen az új fogalmak között.

Az utóbbi években a természetes nyelv feldolgozásának (NLP azaz Natural Language Processing) területén jelentős előrelépések történtek, amelyek lehetővé teszik a gépi tanulás alapú MI szolgáltatások elterjedését- lásd chatGPT, Bert, LaMDA, LLaMA, stb.. Jelenleg az egyik legnagyobb kihívás az, hogy a felhasználók által használt nyelvet pontosan értsék a MI algoritmusok és a legjobb választ/megoldást adják. 

Az egyik kifejezés amit mindenképpen meg kell értenünk az a prompt engineering. De kezdjük az elején mi is az a prompt a mesterséges intelligencia és természetes nyelv generálás vonatkozásában? A prompt az az input vagy utasítás, amit a nyelvi modellbe táplálunk annak érdekében, hogy a legjobb választ kapjuk. Minél specifikusabb, árnyaltabb a promptunk, annál jobb megoldást (választ) fogunk kapni a rendszertől. A válasz lehet szöveg, kép, hang, videó vagy akár egy kódsor is. 

A prompt engineering azt a tervezési folyamatot jelenti, hogy hogyan adjunk utasítást a legjobb módon a nyelvi modellnek, megfelelő kontextust és útmutatást biztosítva. Egyszerűbben fogalmazva: hogyan tegyünk fel jó kérdést/kérést? Minél részletgazdagabb, specifikusabb az input amit betáplálunk, annál jobb lesz a válasz/megoldás amit kapunk. 

Mutatok is egy példát, amihez a Midjourney AI képalkotó programot használtam. Szerettem volna létrehozni egy képet egymásra helyezett pizza szeletekről. Az első képen azt a promptot használtam hogy “stack of pizza slices”. Nem specifikáltam túl, nem segítettem a programnak hogy mi a végeredmény, amit kapni akarok, ezért egy nagyon általános megoldást hozott: 

Midjourney pizza szeletek egymáson, AI által generált kép

Azt kaptam amit kértem? Igen. Tudom-e esetleg használni a social media felületeimen ha egy pizzériát üzemeltetek? Arra már kevésbé alkalmas a kép… De mi történik, ha elkezdjük pontosítani a promptunkat annak megfelelően, hogy mi az a végcél amit el akarunk érni? Tegyük fel, hogy még mindig egy pizzéria tulajdonosa vagyok és szeretném, ha egy nagyon ízletesnek tűnő pizza képet tudnék használni a social media felületeimen. Írjuk hát át a promptot, egészítsük ki további jelzőkkel amik pontosíthatják a végeredményt, próbáljuk meg az alábbi promptot amelybe kiegészítő jelzőket helyeztünk a stílusra, perspektívára, felbontásra, fényelésre vonatkozóan: “stack of delicious pizza slices, food photo style, close up, photo, 8k, rustic, cinematic shot, dramatic lighting” - így jutunk el a második eredményhez, ami már sokkal inkább megfelel a célnak: 

Midjourney valósághű pizza szeletek egymáson, AI által generált kép

Ahogy látható, annak érdekében, hogy megfelelő legyen a végeredmény, képesnek kell lennünk előre elképzelni a fejünkben mit is szeretnénk készíteni, hiszen ez alapján tudunk kellően specifikus promptot megadni. Ebből adódóan is azt gondolom, hogy igazán jó képet az fog tudni alkotni, akinek erős a kreatív látásmódja és azt megfelelően tudja definiálni szavakká. Erről szól a prompt engineering, azaz hogy hogyan tudjuk úgy felépíteni az utasítást, hogy a legjobb végeredményt hozza a modell. Ez nemcsak a képalkotásnál, hanem minden más Generative AI megoldásnál igaz, legyen szó szöveg alkotásról, videós vagy egyéb hang anyag létrehozáskor vagy akár kód alkotáskor. 

Ha ki szeretnéd próbálni magad, és meg szeretnéd jobban érteni a prompt engineering világát, jelentkezz Generative AI Bootcamp kurzusunkra, ahol mélyebben is belemegyünk a témába elméleti és gyakorlati példákon keresztül. 

AI szótár - kifejezések és definíciók kezdőknek

Töltsd le AI szótárunkat

Ismerd meg a AI (Artifiial Intelligence), azaz a mesterséges intelligencia technológia alapvető terminológiáját!
Add meg alább az adataidat és az email címedre elküldjük a szótárt!

AI szótár
🙌
Köszönjük, hamarosan küldjük az anyagot
Hiba történt a küldés során, kérjük ellenőrizd a beírt adataidat és próbáld újra