Ugrás a tartalomhoz
  • MAGAZIN
  • BLOGTÉR
  • PODCAST
  • TV
  • GYŰJTEMÉNY
  • WEBSHOP
  • FOLYÓIRATOK
  • KIADÓ
Menü
  • MAGAZIN
  • BLOGTÉR
  • PODCAST
  • TV
  • GYŰJTEMÉNY
  • WEBSHOP
  • FOLYÓIRATOK
  • KIADÓ
  • MAGAZIN
  • BLOGTÉR
  • PODCAST
  • TV
  • GYŰJTEMÉNY
  • WEBSHOP
  • FOLYÓIRATOK
  • KIADÓ
Menü
  • MAGAZIN
  • BLOGTÉR
  • PODCAST
  • TV
  • GYŰJTEMÉNY
  • WEBSHOP
  • FOLYÓIRATOK
  • KIADÓ
Mitrovits Miklós

Ezer éve koronázták meg Vitéz Boleszlávot

Lengyelország Piast-öröksége és az állami szuverenitás kérdése.

Mitrovits Miklós 2025.05.14.
Pató Viktória Lilla

Fémesen fényes?

Gondolatok az ukrán–amerikai nyersanyag-megállapodásról.

Pató Viktória Lilla 2025.05.14.
Balogh Zsolt György

Jog és logika – III. rész

A fuzzy logika a klasszikus logika kiterjesztése.

Balogh Zsolt György 2025.05.13.
Tóth Kálmán

A huszadik század női gondolkodója

Egy napjainkban is aktuális gondolkodó szellemi öröksége.

Tóth Kálmán 2025.05.13.
Mernyei Ákos Péter

Az Európai Parlament szigorítaná a harmadik országokból származó befektetések ellenőrzésére vonatkozó szabályokat

Mire jut a tagállami diplomácia az európai bürokrácia hatáskör-étvágyával?

Mernyei Ákos Péter 2025.05.13.
KORMÁNYZÁS ÉS TUDOMÁNY BLOG
Fehér András Tibor
Fehér András Tibor
alezredes, tanársegéd, NKE HHK Informatika Tanszék
  • 2025.05.05.
  • 2025.05.05.

Az MI-télről egy MI-tavaszban – II. rész

Okok a szakirodalom szerint

E kétrészes bejegyzés célja, hogy bemutassa azokat az időszakokat, amikor a mesterséges intelligencia (MI) fejlődése megtorpant, egyben ezek néhány fontosabb tanulságára is rávilágítson. Miután az első részben röviden két ilyen időszakot történetét foglaltam össze, ebben az második részben rendszerezve mutatom be azokat az okokat, melyek előidézték ezeket a regressziókat.

A szakirodalomban feltárt okokat és a hozzájuk szorosan kapcsolódó kommentárokat alább saját rendszerezés szerint ismertetem.

A „hájpregresszió”, avagy a túlzott elvárások hatása

A szakirodalom egyöntetűen kiemeli, hogy a túlzott elvárások után bekövetkező csalódás jelensége öltött testet az MI két említett telében. Talán kimondható, hogy ez a kiábrándulás volt a legfőbb oka a regresszióknak. Általános jellemzője a hasonló technológiai visszaeséseknek a túlzó elvárások két főszereplője:

  1. A kutatók, akik túl optimista előrejelzéseket adnak.
  2. A döntéshozók, akikben túlzott remények keletkeznek, ezért támogatásról döntenek, majd csalódásuk miatt nem invesztálnak tovább a technológiába.

Ez a két szereplő alapesetben egymást lelkesítve és támogatva esik az elbizakodottság hibájába. (Előfordulhat azonban olyan eset is, amikor a döntéshozó érzelmi elfogultsága miatt vár áttörést, különösebb tudományos alap nélkül – de a jelenség ilyen speciális esete kívül esik vizsgálódásomon).

Fontos azonban megjegyezni, hogy amit itt hájpkövetkezményként tárgyalok, az merőben eltér a ma már jól ismert hájpciklus-típusú prognózisoktól[1]. A csalódást nem lassú növekedés követi, hanem leállás. Tehát – ahogyan az előző rész történeti leírásában is rámutattam – a kutatások részben vagy teljesen „befagyott” állapotban maradtak, és teljesen új paradigmák mentén indulhat csak be valamilyen új MI-tavasz.

Annyiban azonban kapcsolódik ez a két féle hájpolás, hogy ha az 1950-es években már ismerték volna, és alkalmazzák a hájpciklus elvét, akkor valószínűleg óvatosabb előrejelzések születtek volna, és visszafogottabb lett volna a döntéshozók bizakodása is. Manapság ugyanis általában egy óvatosabb hozzáállás tapasztalható az új technológiák hivatalos hátterében. Ez alól kivételt az olyan esetek képeznek, amikor egy cég lemaradást érzékel a mezőnyhöz képest. 

A hardverprobléma több oldala

A hardver- és adathiány mint ok

A szakértői rendszerek kudarcában (a második tél kialakulásában) szerepet játszott, hogy a hardvergyártók nem tudtak hozzá megfelelő alapokat biztosítani [2]. Visszatekintve egyértelmű, hogy a XX. századi hardverek és tanítóadatok valóban elégtelenek voltak egy használható MI-hez, hiszen a technológia jelentősebb fejlődése csak a 2000-es évek hardverein, szélesebb körű alkalmazása pedig  a 2010-es évekre kifejlődött informatikai rendszereken kezdődött meg.

A „hardverhiány-hit” mint mentség

A hardver tényezőnél maradva, fontos kiemelni, hogy sokszor hitték azt, hogy a felállított modell jó, csupán egy minden paraméterében erősebb számítógép kellene hozzá. Ez azonban nem mindig volt igaz: sok modell jó hardvereken sem futott volna megfelelően. Ez rávilágít arra, hogy egy modell „humán része” is lehet hibás, például, ha úgy képezi le a kogníció adott oldalát, hogy abból túl fontos vonások és attitűdök tűnnek el. 

Például attól még nem helyes egy modell (a leképezés), hogy matematikailag jónak „tűnik”, vagyis nem tudunk benne valamilyen matematikai hibát azonosítani. Hasonló hibát sok tudomány vétett saját fejlődésében, például a pedagógia nem vett figyelembe bizonyos sajátos nevelési igényeket, hanem „azt hitték”, hogy az ilyen tanuló tehetségtelen. Vagyis könnyen fordulhat át a gondolkodás „elhívésbe”, amely nem legitim tudományos közelítés – amint a „hardverelégtelenség-hite” is elfedett még objektív matematikai problémákat is, amint azt rögtön bemutatom. 

Egy „jó modell hit” bizonyítható cáfolata

Nézzünk tehát egy olyan esetet, amikor a megközelítés hibájára matematikailag is sikerült rávilágítani. Ilyen fordulat volt, amikor Minsky levezette, hogy a Perceptron[3] nevű egyrétegű MI-modell – melyhez pedig nagy reményeket fűztek – elméletileg sem  képes megvalósítani a XOR függvényt (ami pedig egy elég alapvető elvárás egy számítógéptől).[4]  Ez a bizonyítás az első tél egyik legjelentősebb konkrét okaként van számontartva, hiszen objektív módon cáfolta meg a modellbe vetett hitet. A második tél esetében nem volt hasonlóan látványos matematikai hiba, ott egyszerűen csak elégtelennek bizonyult a modell tudása.

A tanítóadatok hiányába vetett hit

Egy-egy tanítómetódus lehet működőképes egy erősen leszűkített, kicsi halmazon, de illegitim kiterjesztés ez alapján azt gondolni, hogy elegendő lesz csupán több adat ahhoz, hogy ezek általános problémákat oldjanak meg. Ez talán súlyosabb hiba az előzőnél, hiszen észrevehető lett volna a megközelítés hibája. Ehhez szembe kellett volna nézni azzal, hogy ezek a modellek mennyire leegyszerűsítették a valóságot, továbbá gondolni arra az evidenciára, hogy egy szimplifikáció mindig kompromisszumokat hoz, eltekint dolgoktól a jobb kezelhetőség érdekében. Vagyis a modellezés, mint metódus elvileg is alkalmatlan arra, hogy a benne alkalmazott egyszerűsítést újra általánosítva ugyanahhoz a valósághoz érkezzünk vissza. 

Amikor ugyanis egy egyszerűsítés visszaáltalánosíthatóságát feltételezik, olyankor mindig keletkeznek „kiskapuk”, melyek nem fedik le a valóság valamely szegmensét. Ott keletkezik ilyen hézag, ahol valamit figyelmen kívül kellett hagyni az eredeti egyszerűsítés során. 

Ezért az MI esetében is eleve illegitim kiterjesztés feltételezni, hogy ha a modell óriási adathalmazt kap, akkor ettől majd jól teljesít. Ez ugyanis attól függ, hogy mennyire komplex a kapott adathalmaz. Ha homogén, csak nagy számosságú, akkor nagy eséllyel jól működteti a modellt. Ám ha szerteágazóbb, mint a kapott halmaz, mint amelyre a modellt tervezték, akkor számos hibát generál majd a modell. Ezt észlelhetjük még a mai nyelvi modellek esetében is, melyek a mai napig nem kezelik jól a magyar nyelvet, mivel az logikájában és jellegében túl sok szempontból tér el a nagyobb nyelvektől, melyre alapvetően tervezték őket.

Helytelen antropológiából adódó elvi félreértések

Az úgynevezett Moravecz-paradoxon hitvilága

A korszellem leegyszerűsítő tévedésére jól világít rá ez a vélekedés. Lényege, hogy egy bogár egyszerű agyát vagy egy fejletlen gyermek képességeit könnyebb gépileg másolni, mint egy felnőtt sakkozó okosságát.[5] Ezt a vélekedést tudományos igazolás nélkül fogadta el szinte mindenki, hiszen a fejlődés logikája ezt diktálta. Pedig illegitim kiterjesztés a gépvilágra alkalmazni a törzsfejlődés és az egyedfejlődés, illetve a tanuláselméleti szintek alakulásának folyamatát.

Furcsa, hogy nem gondoltak bele, hogy a gépek nem egy DNS információhalmazzal jöttek létre, és fejlődésük iránya is tökéletesen más motivációkon alapul, mint az élőlények életösztöne.  Ez az eltérés egyben cáfolat is, melyet már akkor is megfogalmazhattak volna. Tehát ez a vélekedés nem valódi tudományos hipotézis volt, hanem egy átgondolatlan elhivés. A Moravecz-paradoxon jelensége szempontunkból is igen tanulságos, ha az okait is megértjük. Itt a három okra rámutatok rá, melyre ez a vélekedés visszavezethető: 

  1. az akkori túlbizakodó racionális és progresszivista (a végtelen fejlődésben hívő) korszellem; 
  2. egy nyájeffektus, mely miatt lángelmék hittek egymásnak, így követték egymást ebben a tévedésben;
  3. a filozófia és humántudományok csak névleg váltak a kognitív tudományok részévé, valójában a fejlesztők keveset foglalkoztak ezekkel (ez ma sincs másképp).

A megközelítő paradigma szélsőségei

A szélsőségekbe esés különböző eseteit is azonosíthatunk a visszaesésekben. Az első MI-tavasz esetében az emberi gondolkodást akarták lemásolni,[6] általánosan akarták megoldani a problémákat: ez vezetett az első télhez. Ezt a túlzó célt oldotta fel a második tavasz alulról építkező megközelítése, mely a feladat elemzéséra alapult,[2, o. 9] viszont az ellentétes végletbe estek. A második tél esetében ugyanis a működő feladatmegoldó gépek alapján azt feltételezték, hogy ez a modell szinte végtelenségig általánosítható. Vagyis úgy vélték, hogy az emberi intelligencia formalizálható és rekonstruálható pl. „ha-akkor” szabályok kellő mennyisége által.[7]

Összegzés

A fentiek számos okot bemutattak, nagy részük mögött különféle elhívés-jellegű mozzanatok, netán érzelmek (pl. a kiábrándulás) állnak, illetve ezek következményei. Az utolsó fejtegetés alapján az is világos, hogy sem a túlzottan általános, sem pedig a túlzottan leszűkített paradigma nem volt tartós. A jelenlegi paradigma, mely a kogníció bizonyos funkciónak másolására törekszik, biztos, hogy tartósabb, immáron úgy 30 éve bizonyítja ezt azzal, hogy töretlen fejlődést mutat.

Kérdés marad azonban, hogy a fentebb azonosított problémakörök nem merülnek-e fel újra, amikor elérjük a mostani paradigmák és modellek határait? Ha felmerülnek, akkor is egészen bizonyos, hogy más módon jelentkeznek – de vajon hogyan? A következő bejegyzésekben ezeknek a kérdéseknek járunk utána.

Források

[1] Gartner Institute, „Understanding Gartner’s Hype Cycles”, Gartner. Elérés: 2024. október 8. [Online]. Elérhető itt.

[2] A. Toosi, A. Bottino, B. Saboury, és A. Rahmim, „A Brief History of AI: How to Prevent Another Winter (A Critical Review)”, PET Clinics, köt. 16, szept. 2021, doi: 10.1016/j.cpet.2021.07.001.

[3] P. Chowdhury, „Perceptron: A Simple yet Mighty Machine Learning Algorithm”, Medium. Elérés: 2024. január 13. [Online]. Elérhető itt.

[4] M. L. Minsky és S. Papert, Perceptrons, An Essay on Computational Geometry. Cambridge, MA: MIT Press, 1969.

[5] Fehér A. T., „A mesterségesintelligencia-alapú hidegháború etikai háttere”, A mesterséges intelligencia és egyéb felforgató technológiák hatásainak átfogó vizsgálata, o. 355–392, okt. 2023.

[6] M. Haenlein és A. Kaplan, „A Brief History of Artificial Intelligence: On the Past, Present, and Future of Artificial Intelligence”, California Management Review, köt. 61, sz. 4, o. 5–14, aug. 2019, doi: 10.1177/0008125619864925.

[7] A. Kaplan és M. Haenlein, „Siri, Siri, in my hand: Who’s the fairest in the land? On the interpretations, illustrations, and implications of artificial intelligence”, Business Horizons, köt. 62, nov. 2018, doi: 10.1016/j.bushor.2018.08.004.

Nyitókép forrása: carol / Wikipédia

Témakörök: gazdaság, mesterséges intelligencia, történelem
nke-cimer

LUDOVIKA.hu

KAPCSOLAT

1083 Budapest, Ludovika tér 2.
E-mail:
Kéziratokkal, könyv- és folyóirat-kiadással kapcsolatos ügyek: kiadvanyok@uni-nke.hu
Blogokkal és a magazinnal kapcsolatos ügyek: szerkesztoseg@uni-nke.hu

IMPRESSZUM

Ez a weboldal sütiket használ. Ha Ön ezzel egyetért, kérjük fogadja el az adatkezelési szabályzatunkat. Süti beállításokElfogad
Adatvédemi és süti beállítások

Adatvédelmi áttekintés

This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary
Always Enabled
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
SAVE & ACCEPT