Már a szövegekkel is megbirkózik az OpenAI legfejlettebb képgenerátora

Thumbnail for 6420222

Az OpenAI bemutatta az eddigi legfejlettebb képgenerátorát, amely Sam Altman és csapata ígéretei szerint az eddigi modellnél sokkal jobb minőségű, fotorealisztikusabb képeket tud készíteni, miközben a feliratokkal is jobban bánik. Altman szerint „ez az egyik legszórakoztatóbb és legmenőbb dolog, amit valaha is lelepleztek”, az eredményeket elnézve pedig nem túloz a techguru.

A vállalat vezetője és mérnökei a bemutató során több példát is mutattak a fejlesztés képességeire, ugyanis látszólag valós időben promptolták a modellt. Az első megoldás egyből érdekes volt, ugyanis azt kérték, mutassa meg, mi van a kamera másik oldalán a szobában a stream felvételekor. A fotón megjelenő emberek sokkal realisztikusabbak voltak, és a szöveg helyes megjelenítésével sem volt gondja a modellnek, ami nagy előrelépést jelent az eddigiekhez képest.

Ezután azt is jelezték, hogy a képgeneráláshoz saját fotókat is megadhatunk kiindulási alapként. A fejlesztők által készített szelfit így a program egy-két perc alatt egy anime-jelenetté tudta átalakítani. Altman jelezte, hogy bár eleinte még sokáig fog tartani a képek legenerálása, hamarosan ez a folyamat is felgyorsulhat.

Az új modell hamarosan minden ChatGPT felhasználónak elérhető lesz, a ChatGPT Plus, Pro, és Team ügyfeleken túl tehát a szolgáltatást ingyenesen használók is kipróbálhatják majd „a képgenerálás következő korszakát.”

Az is nagy előrelépés, hogy mivel a képgenerálás immár a GPT‑4o alapján működik, természetes kommunikációval lehet finomítani a képeken, így tulajdonképpen beszélgethetünk a chatbottal, hogy mit kell pontosan javítania.

Az OpenAI jelezte, hogy míg más rendszerek 5-8 objektummal küzdenek meg csak egyszerre, a GPT-4o akár 10-20 különböző objektumot is képes kezelni. A ChatGPT által generált képeken ezután sem lesz vízjel, de a fájl metaadatai tartalmazni fogják, hogy a képet az OpenAI hozta létre. A cég jelezte, hibák azonban vannak még: az MI gyakran furcsán vágja le a képeket, a hallucinálás sem tűnt el, a grafikonok és ábrák nem mindig pontosak, és nyelvkeveredés is előfordulhat.

The post Már a szövegekkel is megbirkózik az OpenAI legfejlettebb képgenerátora first appeared on 24.hu.

Tovább az erdeti cikkre:: 24.hu

Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedInPin on Pinterest