A mesterséges intelligencia a technológiai fejlődés legújabb mérföldköve. Használata az elmúlt években széles körben elérhetővé vált, és egyre több területen válik mindennapivá. Az úgynevezett nagy nyelvi modellek növekvő népszerűségnek örvendenek, mert használatuk egyszerű, a párbeszéd „emberi” és bármilyen kérdésre gyorsan válaszolnak. Bár ezek a válaszok helyesnek tűnhetnek, azonban teljesen hibásak is lehetnek. A helytelen válaszok kiszűrése érdekében fontos megérteni ezeknek a modelleknek a működését.

A ChatGPT-hez hasonló alkalmazások 1-2 év alatt a mindennapok részévé váltak. Sokan használják őket tanulásra, munkára, fordításra vagy információszerzésre. A mesterséges intelligenciára épülő nagy nyelvi modellek képesek válaszolni, magyarázni, összefoglalni, sőt akár tanácsokat is adni.

Egyre többen fordulnak hozzájuk egészségügyi kérdésekkel is, ezért különösen fontos megérteni, hogy ezek a rendszerek nem orvosok, nem keresőmotorok és nem is emberek. Egy jó magyarázat segíthet megérteni egy diagnózist vagy felkészülni egy orvosi vizsgálatra, ugyanakkor a pontatlan vagy félrevezető válaszok komoly kockázatot jelenthetnek. Ahhoz, hogy tudatosan használjuk ezeket az eszközöket, érdemes megérteni, hogy miként működnek, mire képesek, és hol húzódnak a határai.

Mi az a mesterséges intelligencia?

A mesterséges intelligencia (rövidítve MI, vagy angol megfelelője alapján AI) olyan számítógépes rendszerek összefoglaló neve, amelyek bizonyos feladatokat az emberi gondolkodáshoz hasonló módon képesek elvégezni. Idetartozik a szövegértés és a kép vagy beszéd tartalmának „felismerése” és létrehozása is.

Bár az utóbbi években a ChatGPT és más chatbotok tették igazán közismertté a mesterséges intelligenciát, az MI már jóval korábban megjelent a mindennapi életben. Számos navigációs rendszerben, fordítóprogramban, illetve a kéretlen levelek kiszűrésére használt rendszerekben is mesterségesintelligencia-alapú program működik.

Bár a chatbotok „emberi” válaszokat adnak, a mai mesterséges intelligenciák nem rendelkeznek emberi tudattal vagy önálló gondolkodással. Nem „értik” a világot úgy, mint az emberek, és nincsenek érzéseik vagy saját szándékaik. A legtöbb rendszer rendkívül fejlett matematikai modellekből és algoritmusokból áll, amelyek hatalmas mennyiségű adat alapján tanulnak meg bizonyos mintázatokat felismerni, és azokra reagálni.

A mesterséges intelligencia sokszínűsége

A mesterséges intelligencia nem egységes technológia. Az MI-alapú rendszerek különböző feladatokra készülhetnek, működésük és képességeik jelentősen eltérhetnek egymástól. Egyes modellek specializált feladatokra készülnek, például röntgenfelvételek elemzésére vagy szívritmuszavarok felismerésére.

Az utóbbi évek legnagyobb áttörését a generatív mesterséges intelligencia megjelenése hozta. Ezek a rendszerek nem csupán elemezni vagy felismerni tudnak adatokat, hanem új tartalmak létrehozására (generálására) is képesek.

Az alábbi anyagok előállítására lehet képes a generatív MI:

  • szöveg;
  • kép;
  • hang (pl. szöveg, ének, zene);
  • videó.

A generatív mesterséges intelligencia azért vált különösen népszerűvé, mert a felhasználók közvetlenül kommunikálhatnak vele az anyanyelvükön. Ugyanakkor fontos különbséget tenni a társalgás, az alkotás látszata és a valódi megértés között. A generatív MI emberi értelemben véve nem tudatos és nem kreatív. A létrehozott tartalmak statisztikai mintázatokból épülnek fel, vagyis a rendszer azt próbálja előállítani, amit a tanulási adatok alapján a legvalószínűbbnek számol ki.

Hogyan működnek a nyelvi modellek?

A nagy nyelvi modelleket (angol megfelelője alapján rövidítve: LLM) hatalmas mennyiségű emberi szöveg feldolgozásával hozták létre. Többféle nyelven íródott könyvekből, weboldalakról, cikkekből és más nyelvi forrásokból „tanulták meg” a nyelv működését. A tanulás folyamán mintázatokat ismernek fel a szövegben. Működésük során a tanult mintázatok és a kapott kérdés vagy utasítás alapján, szóról szóra haladva a legvalószínűbb következő szót írják le az adott szövegkörnyezetben; így hozzák létre egységről egységre a megírt szövegeket.

Fontos! A válaszokat, tanácsokat sosem szabad ellenőrzés nélkül tényszerűnek tekinteni!

A nyelvi modellek nem tudnak különbséget tenni helyes és helytelen, igaz vagy hamis állítás között. Nem „gondolkodnak”, és nem értik a valóságot emberi módon. A válaszok statisztikai valószínűségek, mintázatok alapján generáltak.

A nyelvi modellek határai

A nyelvi modellek felhasználhatóságának több határa is van, ami a működésük módjából következik.

Az alábbi problémákat érdemes szem előtt tartani.

Valótlan vagy pontatlan információ (hallucináció): egyik legnagyobb problémája, hogy időnként valótlan vagy pontatlan információkat állíthatnak teljes magabiztossággal. Ezt a jelenséget gyakran hallucinációnak nevezik. Ez egyébként nem klasszikus értelemben vett hibája a rendszernek, hanem szükséges „képesség” ahhoz, hogy a modell változatos tartalmakat tudjon generálni.

Logika, „józan ész” hiánya: az LLM-ek mintázatok alapján generálnak szöveget, nem pedig fogalmi megértés alapján. Emiatt az ok-okozati összefüggések, vagy az információk más helyzetben való alkalmazása hibás lehet.

Válaszkényszer: működésükből adódóan a chatbotok minden elküldött üzenetre válaszolnak, ami a gyakorlatban azt jelenti, hogy a modell olyan esetekben is generál választ, amikor az nem ismert, vagy nincs elég háttérinformáció. A generált szöveg gyakran magabiztos, jól megfogalmazott, ezért a pontosság vagy helyesség illúzióját kelti.

Tanulásból származó korlátok: bár egyes modellek már képesek az internetes keresésre a válasz megalkotásához, sok modell tudása a tanítási adatokból származik. Az sem ritka, hogy a valós idejű internetes keresést külön be kell kapcsolni. Ezért az új eseményekről a modell nem feltétlenül tud, így bizonyos szakterületeken (pl. ritka betegségek, speciális jogi esetek) és aktuális témákban a „tudása” hiányos lehet.

Információvesztés: a modell típusától függően meghatározott mennyiségű információ megjegyzésére képes. Emiatt hosszabb beszélgetések eleje „kieshet”, illetve nagyméretű dokumentumoknak csak a részleteit dolgozza fel.

Beépített határok: vannak olyan témák, amelyek morális, etikai, egészségügyi vagy egyéb okok miatt tiltottak; az ezekről való beszélgetés, információszerzés gátolt.

Mindezekből látszik, hogy a nyelvi modellek elsődleges funkciója nem egy általános tudástár megalkotása volt. A mesterséges intelligencia nem helyettesíti az emberi tudáson alapuló kritikus gondolkodást, megértést és döntéshozást. (Az AI-tanács veszélyeiről részletesen itt olvashat.)

Mesterséges intelligencia az egészségügyben

Az egészségügyben a mesterséges intelligenciát egyre több területen alkalmazzák. Segíthet orvosi dokumentációk összefoglalásában, adminisztratív feladatok automatizálásában vagy a betegek tájékoztatásában.

A hétköznapi használatban a nagy nyelvi modellekre épülő chatbotok segíthetnek közérthető formában megérteni orvosi fogalmakat, vizsgálatokat vagy kezelési lehetőségeket. Ez különösen hasznos lehet azok számára, akik nehezen igazodnak el az egészségügyi információk között, illetve szeretnének többet tudni. (Az ehhez kapcsolódó konkrét tanácsokról itt olvashat.)

Összességében az a fontos, hogy a mesterséges intelligencia támogató eszköz maradjon, ne pedig kizárólagos információforrás. Az egészséggel kapcsolatos döntéseket továbbra is egészségügyi szakemberekkel együtt szükséges meghozni.

 

Ajánlott tartalom:

A jó kérdés fél diagnózis? Promptolás az egészség témájában

Ne higgyünk el mindent: így ellenőrizhető egy AI-válasz

Mit NE írjunk be a ChatGPT-nek