Mi a mesterséges intelligencia?

A mesterséges intelligencia (Artificial Intelligence, AI) 2024-re már nem csak a tudományos és tech világában létezik, hanem egyre inkább részévé válik mindennapjainknak és munkánknak. Nap mint nap találkozunk vele, tudatosan és nem tudatosan is. Sokan úgy hivatkoznak rá, mint egy új forradalomra, és az egészen biztos, hogy új dimenziókat nyit meg az innováció és a kreativitás terén.

Az AI egyszerűen fogalmazva olyan számítógépes rendszer, amely képes valamilyen formában utánozni az emberi intelligencia bizonyos részeit. Nem kell bonyolult dologra gondolnunk, a telefonunkban ha írunk és ajánlásokat ad ki a billentyűzet, vagy a traffipax rendszámleolvasója is egy fajta AI. Amikor a Netflix új sorozatot ajánl nekünk azok alapján, amit eddig néztünk, az is AI.

Ezeknél persze sokkal összetettebb, bonyolultabb AI rendszerek is léteznek. Maga az AI nem újdonság, évtizedek óta kutatja az emberiség, és már évekkel ezelőtt is rengeteg helyen alkalmazták.

Az AI nem új - akkor mi ez a nagy felhajtás?

2023 óta, de főleg idén, tényleg rengeteg mindent hallani az AI-ról és az új eszközökről. Miért nem jöttek ezek hamarabb, ha az AI, mint technológia, nem újdonság? Ennek több oka is van.

Egy Vaswani nevű kutató a Google-nél 2017-ben publikálta az "Attention is All You Need" című publikációját, amiben egy új felépítést, az úgynevezett transzformer felépítést javasolja az emberi nyelvet feldolgozó AI modelleknek. Ez hamar bebizonyosodott, hogy valóban forradalmi, és olyan minőségű nyelvi feldolgozást tesz lehetővé, amire ezelőtt nem volt példa.

Emellett folyamatosan fejlődik a technológia, egyre nagyobb számítási kapacitás és adathalmaz áll rendelkezésünkre. Mivel egy AI modell tanítása kifejezetten adat és számítási kapacitás igényes feladat, a technológiai fejlődés katalizálja az AI fejlődését is. Nem véletlen kezdtek el az AI számítástechnikában otthonos cégek tőzsdei árai drasztikusan emelkedni.

Ezeket a trendeket meglovagolva több nagy tech cég is felült az AI vonatra, és olyan eszközöket hozott létre, amik az új technológiákkal és AI modellekkel eddig nem látott eredményeket tudtak elérni. Ilyen az OpenAI is, akinek a ChatGPT eszközét talán a legtöbben ismerik és használják.

Mi a generatív AI, és mik a nagy nyelvi modellek?

A generatív AI a mesterséges intelligenciák egy speciális ága. Az eddig ismert mainstream AI modellek valamilyen bemenetből állítanak elő valamilyen kimenetet, például az eddig megnézett sorozatokból egy másikra ráböknek, hogy valószínűleg az is tetszeni fog, vagy az emberi beszédet hangból szöveggé alakítják - ismert adatokkal dolgoznak.

Ezzel szemben a generatív AI lényege, hogy a betanult adatok alapján addig nem látott, új tartalmakat képes létrehozni. Ez lehet szöveg, kép, videó, zene, de lehet ember számára értelmetlen gépi adat is, különféle felhasználásokra.

Az AI egyik másik ága az úgynevezett nagy nyelvi modellek (Large Language Model, LLM). Ilyen modellek például a chatbotok és írási segédprogramok. Ezek a modellek abban szuperek, hogy képesek feldolgozni, megérteni és/vagy generálni az emberihez hasonló szöveget. Magát a nyelvet is megtanulják, de azt is, hogyan tudnak egy-egy stílusban írni, és azt is értik, milyen kontextusban beszélnek. A jobb LLM modelleknél egészen úgy tűnhet, mintha élő emberrel beszélgetnénk.

Ez tette lehetővé ezeknek az LLM modelleknek, hogy mindenkit lenyűgözzenek és elképesztően széles körben elterjedjenek - egyáltalán nem kell hozzá semmilyen technikai háttér vagy tudás, hogy megdöbbentően jó eredményeket érjünk el vele.

Mire lehet használni?

Maga az AI technológia rengeteg mindenre használható, de talán érdekesebb, hogy a technikához nem értők hogyan tudják ezeket a modern eszközöket maguk is használni. A publikusan, interneten elérhető LLM modelleket (mint például a ChatGPT-t vagy a Google Gemini-t) használhatjuk szöveg generálásra, meglévő szövegek, dokumentumok összefoglalására, vagy bármilyen szövegfeldolgozási feladatra. Emellett, mivel rendkívül jól értik, amit mondunk nekik, tudunk tőlük információt kérni, egy új témába beletanulni, vagy nagyjából tényleg bármiről kérdezni. Egyes modellek a nyelvi képességeik mellett egyéb funkciókkal is ki lettek egészítve, például tudnak fájlokat olvasni, adatot elemezni, internetes oldalakat látogatni.

Nem csak az LLM-ek érhetőek el mindenki számára. A nyelvi modellek mellett nagy fejlődésen megy át a képi modellek világa is. A Midjourney, a DALL-E, vagy a Leonardo AI képesek emberi parancsból képet generálni, különböző stílusban, megfelelő parancsok mellett megdöbbentő pontossággal. Ma már nem ritka, hogy AI generál olyan képeket, amiről meg sem tudjuk mondani, hogy nem ember készítette őket egy fényképezőgéppel.

Szöveg és képek mellett sok publikus modell van zene generálására is, de az egyik legizgalmasabb és a cikk írásakor leginkább várt dolog a videók generálása. Képekből videót már ma is több modell tud, némelyik szövegből is, de a tapasztalatunk szerint ezek még eléggé gyerekcipőben járnak, könnyen látható, hogy AI készítette őket. Már vannak nyilvános preview-k olyan modellekről, amik ezeket a korlátokat lebontják, de ezek a cikk írásakor még nem publikusan elérhetőek. Mi is izgalmasan várjuk, valószínűleg hetek vagy legfeljebb hónapok kérdése, és elkezdenek ezek a modellek is jönni.

Hogyan tovább?

Az AI berobbant a mindennapi életbe. Ahogy minden új technológiát, persze ezt is sokszor övezi kételkedés és szkepticizmus. Sokan félnek, hogy az AI elveheti az emberek munkáját, mások meg egyszerűen azt gondolják, hogy majd lecsillapodnak a kedélyek és minden a régi lesz.

Az egészen biztos, hogy az AI innentől kezdve örökké velünk marad. Az is biztosnak tűnik, hogy az technológia jelenlegi állása szerint az AI nem fogja átvenni az emberek munkáját, és nem fog kiszorítani minket a világból. Cserébe olyan hatékonyságnövelést adhat, és új képességekkel vértezhet fel sok mindenkit, amilyet eddig nem láttunk - a McKinsey riportja szerint a generatív AI több trillió dollárnyi értéket ad majd a világgazdasághoz.

Szerintünk az AI az internethez hasonlóan a következő nagy dobás. Ahogy az ezredfordulós dotcom boom esetében, itt is a korai adapterek lesznek a nagy nyertesek. Magánemberek és cégek egyaránt folyamatosan kezdik használni ezeket az eszközöket. Az, hogy igazunk lesz-e, majd az idővel kiderül, de azt mindenkinek ajánljuk, hogy járjon nyitott szemmel, és tartsa a tempót a technikai fejlődéssel!