Hogyan tanul az AI? Érthető magyarázat példákkal

A mesterséges intelligencia (AI) egyik legizgalmasabb kérdése, hogy hogyan képes egy gép tanulni. Nem tankönyveket forgat, és nem a tapasztalataira épít, mint mi, hanem óriási mennyiségű adatot dolgoz fel, és mintázatokat keres. A folyamat elsőre bonyolultnak tűnhet, de valójában sok szempontból hasonlít ahhoz, ahogy mi tanulunk: példákból, próbálkozásokból, hibákból.

A tanulás alapja: Adatok

Az AI tanulásának kulcsa az adat. Egy algoritmus önmagában csak szabályok halmaza. Ahhoz, hogy felismerjen egy kutyát egy képen, rengeteg fotót kell megmutatni neki – kutyás és nem kutyás képeket egyaránt. Eleinte sokszor téved, de minden hibából javítja a belső „beállításait”. Minél több példát lát, annál pontosabban képes különbséget tenni a kutya és más állatok között.

Ez hasonlít arra, ahogy egy gyerek tanulja meg az állatok felismerését: először minden négylábú lehet „kutya”, de később egyre pontosabb lesz.

Gépi tanulás és mélytanulás

Az AI tanulásának legismertebb formája a gépi tanulás (machine learning). Itt az algoritmus statisztikai módszerekkel keres összefüggéseket az adatokban. Például egy webshop a vásárló szokásainak elemzése alapján képes ajánlani más termékeket is.

A gépi tanulás egyik különösen fontos ága a mélytanulás (deep learning), amely a neurális hálózatokra épül. Ezek a hálózatok rétegesen elemzik az információt:

az alsó rétegek egyszerű mintákat (például vonalak, színek) azonosítanak,
a középső rétegek már bonyolultabb formákat (arc, kerék),
a felső rétegek pedig a teljes objektumokat, fogalmakat (kutya, bicikli, szó).

Ez a hierarchikus feldolgozás teszi lehetővé, hogy az AI egyre összetettebb feladatokat oldjon meg.

A tanulás három fő típusa

Felügyelt tanulás

Ebben az esetben az adatokhoz címkék is tartoznak. Az adatok és hozzá tartozó célértékek/címkék halmaza adott, ezt hívjuk tanító adatbázisnak. A cél, hogy ez alapján olyan modellt tanuljunk ami korábban nem látott példákon is helyesen működik. Például minden képhez odaírjuk, hogy „kutya” vagy „macska”. Az algoritmus ezek alapján tanulja meg a helyes döntéseket. Minél több képet dolgoz fel, annál ügyesebben fogja felismerni a kutyákat még nem látott képeken is. Ide tartozik az osztályozás (pl. „kutya vagy macska?”) és a regresszió (pl. „mennyi lesz a holnapi hőmérséklet?”).

Felügyelet nélküli tanulás

Itt nincsenek címkék, nincs célérték: az algoritmusnak magától kell mintázatokat találnia. A tanítás itt a kérdéses mintázat/összefüggés definícióját jelenti, ami általában számos mérnöki iteráció után alakul ki. Például képes csoportosítani vásárlókat a böngészési szokásaik alapján, még ha nem is tudjuk előre, milyen kategóriák lesznek.

Megerősítéses tanulás

Ebben a megközelítésben az algoritmus próbálkozik, és visszajelzést kap. Jó döntés -> jutalom, rossz döntés -> büntetés. Így tanulja meg például egy önvezető autó, hogyan kell biztonságosan kanyarodni vagy fékezni.

A tanulás lépései a gyakorlatban

Az egyetemi szakirodalom (SZTE, Gépi tanulás alapfogalmai) anyagában bemutatott folyamat alapján a gépi tanulás olyan, mint egy jól bevált recept:

Adatgyűjtés és előfeldolgozás – például képeket, szövegeket vagy szenzoradatokat rendezünk, tisztítunk.
Jellemzők (feature-ök) kinyerése – a nyers adatokból kiemeljük a fontos tulajdonságokat. Egy képnél ilyen lehet a színeloszlás vagy élek felismerése.
Modell kiválasztása és betanítása – az adatok alapján beállítjuk a neurális hálót vagy más algoritmust.
Tesztelés és finomhangolás – megnézzük, mennyire pontos a rendszer, és szükség esetén javítunk rajta.

Ez egy iteratív folyamat: a modell folyamatosan tanul és finomodik.

Fontos elv: nincs univerzális megoldás

A szakirodalomból ismert a „No Free Lunch” elv is: nincs olyan algoritmus, amely minden feladatra a leghatékonyabb lenne. Egyes módszerek képfelismerésben erősek, mások szöveganalízisben, és mindig az adott probléma határozza meg a legjobb eszközt.

Példák a mindennapokból

Netflix és YouTube ajánlások: az eddigi megtekintéseidből tanul, és hasonló tartalmakat javasol.
Arcfelismerés a telefonon: több ezer fotódból tanulta meg felismerni az arcodat.
Automatikus fordítók: a Google Fordító hatalmas szövegbázisokból tanulta meg, hogyan fordítsa le minél értelmesebben a mondatokat.
Chatbotok és nyelvi modellek: a ChatGPT milliárdnyi szöveg alapján képes emberi módon fogalmazni.

Az AI tanulása nem varázslat, hanem rengeteg adat és bonyolult algoritmus kombinációja. A tanulási módok között ott van a felügyelt tanulás, a felügyelet nélküli tanulás és a megerősítéses tanulás, kiegészítve az adat-előkészítéssel és jellemzőkinyeréssel.

Ahogy az adatok mennyisége nő, úgy válik az AI egyre pontosabbá és hasznosabbá – de mindig emlékeznünk kell: nincs egyetlen módszer, ami minden problémára megoldást adna.

Forrás: Gépi tanulás alapfogalmai – SZTE Informatikai Kar