A mesterséges intelligencia (AI) egyik legizgalmasabb kérdése, hogy hogyan képes egy gép tanulni. Nem tankönyveket forgat, és nem a tapasztalataira épít, mint mi, hanem óriási mennyiségű adatot dolgoz fel, és mintázatokat keres. A folyamat elsőre bonyolultnak tűnhet, de valójában sok szempontból hasonlít ahhoz, ahogy mi tanulunk: példákból, próbálkozásokból, hibákból.
A tanulás alapja: Adatok
Az AI tanulásának kulcsa az adat. Egy algoritmus önmagában csak szabályok halmaza. Ahhoz, hogy felismerjen egy kutyát egy képen, rengeteg fotót kell megmutatni neki – kutyás és nem kutyás képeket egyaránt. Eleinte sokszor téved, de minden hibából javítja a belső „beállításait”. Minél több példát lát, annál pontosabban képes különbséget tenni a kutya és más állatok között.
Ez hasonlít arra, ahogy egy gyerek tanulja meg az állatok felismerését: először minden négylábú lehet „kutya”, de később egyre pontosabb lesz.
Gépi tanulás és mélytanulás
Az AI tanulásának legismertebb formája a gépi tanulás (machine learning). Itt az algoritmus statisztikai módszerekkel keres összefüggéseket az adatokban. Például egy webshop a vásárló szokásainak elemzése alapján képes ajánlani más termékeket is.
A gépi tanulás egyik különösen fontos ága a mélytanulás (deep learning), amely a neurális hálózatokra épül. Ezek a hálózatok rétegesen elemzik az információt:
- az alsó rétegek egyszerű mintákat (például vonalak, színek) azonosítanak,
- a középső rétegek már bonyolultabb formákat (arc, kerék),
- a felső rétegek pedig a teljes objektumokat, fogalmakat (kutya, bicikli, szó).
Ez a hierarchikus feldolgozás teszi lehetővé, hogy az AI egyre összetettebb feladatokat oldjon meg.
A tanulás három fő típusa
Felügyelt tanulás
Ebben az esetben az adatokhoz címkék is tartoznak. Az adatok és hozzá tartozó célértékek/címkék halmaza adott, ezt hívjuk tanító adatbázisnak. A cél, hogy ez alapján olyan modellt tanuljunk ami korábban nem látott példákon is helyesen működik. Például minden képhez odaírjuk, hogy „kutya” vagy „macska”. Az algoritmus ezek alapján tanulja meg a helyes döntéseket. Minél több képet dolgoz fel, annál ügyesebben fogja felismerni a kutyákat még nem látott képeken is. Ide tartozik az osztályozás (pl. „kutya vagy macska?”) és a regresszió (pl. „mennyi lesz a holnapi hőmérséklet?”).
Felügyelet nélküli tanulás
Itt nincsenek címkék, nincs célérték: az algoritmusnak magától kell mintázatokat találnia. A tanítás itt a kérdéses mintázat/összefüggés definícióját jelenti, ami általában számos mérnöki iteráció után alakul ki. Például képes csoportosítani vásárlókat a böngészési szokásaik alapján, még ha nem is tudjuk előre, milyen kategóriák lesznek.
Megerősítéses tanulás
Ebben a megközelítésben az algoritmus próbálkozik, és visszajelzést kap. Jó döntés -> jutalom, rossz döntés -> büntetés. Így tanulja meg például egy önvezető autó, hogyan kell biztonságosan kanyarodni vagy fékezni.
A tanulás lépései a gyakorlatban
Az egyetemi szakirodalom (SZTE, Gépi tanulás alapfogalmai) anyagában bemutatott folyamat alapján a gépi tanulás olyan, mint egy jól bevált recept:
- Adatgyűjtés és előfeldolgozás – például képeket, szövegeket vagy szenzoradatokat rendezünk, tisztítunk.
- Jellemzők (feature-ök) kinyerése – a nyers adatokból kiemeljük a fontos tulajdonságokat. Egy képnél ilyen lehet a színeloszlás vagy élek felismerése.
- Modell kiválasztása és betanítása – az adatok alapján beállítjuk a neurális hálót vagy más algoritmust.
- Tesztelés és finomhangolás – megnézzük, mennyire pontos a rendszer, és szükség esetén javítunk rajta.
Ez egy iteratív folyamat: a modell folyamatosan tanul és finomodik.
Fontos elv: nincs univerzális megoldás
A szakirodalomból ismert a „No Free Lunch” elv is: nincs olyan algoritmus, amely minden feladatra a leghatékonyabb lenne. Egyes módszerek képfelismerésben erősek, mások szöveganalízisben, és mindig az adott probléma határozza meg a legjobb eszközt.
Példák a mindennapokból
- Netflix és YouTube ajánlások: az eddigi megtekintéseidből tanul, és hasonló tartalmakat javasol.
- Arcfelismerés a telefonon: több ezer fotódból tanulta meg felismerni az arcodat.
- Automatikus fordítók: a Google Fordító hatalmas szövegbázisokból tanulta meg, hogyan fordítsa le minél értelmesebben a mondatokat.
- Chatbotok és nyelvi modellek: a ChatGPT milliárdnyi szöveg alapján képes emberi módon fogalmazni.
Az AI tanulása nem varázslat, hanem rengeteg adat és bonyolult algoritmus kombinációja. A tanulási módok között ott van a felügyelt tanulás, a felügyelet nélküli tanulás és a megerősítéses tanulás, kiegészítve az adat-előkészítéssel és jellemzőkinyeréssel.
Ahogy az adatok mennyisége nő, úgy válik az AI egyre pontosabbá és hasznosabbá – de mindig emlékeznünk kell: nincs egyetlen módszer, ami minden problémára megoldást adna.

