A tavaly nyáron publikált 148 oldalas könyv (1) a jelenlegi egyik legátfogóbb összefoglalása a témának. Nemcsak alapvető fogalmakat tisztáz, hanem igen jó áttekintése a különböző szektorokban jelenleg használt MI alkalmazásoknak és egy sor ország MI-vel kapcsolatos stratégiájának.
Az OECD színvonalas tanulmányai sok területen elsődleges forrást jelentenek a kutatók számára is. A szervezet tavaly nyáron publikálta a több tucatnyi szakértő munkáját tartalmazó tanulmányát, amely hatalmas mennyiségű hivatkozással és adattal alátámasztva ad szinte átfogó képet a mesterséges intelligencia (MI) és a társadalom összefüggéseiről.
Az OECD a 2010-es évek közepe óta intenzíven foglalkozik a témával, 2017-ben egy nagyszabású konferenciát is szerveztek, és egy szakértői testületet is felállítottak, majd ennek az anyagnak a megjelenésével szinte egyidőben egy ajánlást is megfogalmaztak a tagállamok számára. Az anyag bevezetése megállapítja, hogy a célja elsősorban „keretezés”, az MI jelenség közös megértésének („shared understanding”) megteremtése a közös kategóriakészlet, és a gazdasági és társadalmi következmények felvázolásával, valamint az, hogy ajánlásokat, lehetséges utakat fogalmazzon meg a szabályozással kapcsolatban. Az anyag öt fejezetre bomlik, a technikai alapok ismertetése után az MI gazdasági környezetéről szóló fejezet következik, majd egy hosszabb fejezet foglalkozik a különböző ágazatokban már jelenleg is használt MI alkalmazásokkal, a szabályozást befolyásoló tényezőkkel, végül egy hatalmas katalógust találunk az egyes országok, nemzetközi szervezetek MI-vel kapcsolatos kezdeményezéseiről.
Az anyag egyik fontos vezérmotívuma, hogy az MI-t lényegében azonosnak tekinti a gépi tanulással. A bevezetőben (19. o.) még azt olvassuk, hogy a gépi tanulás (machine learning, ML) az MI egyik alváltozata („subset”), majd az MI-t a széles körben alapmunkának elfogadott, és magyarul is hozzáférhető Russel-Norvig könyv alapján definiálja, („emberi módon cselekedni/gondolkodni képes ágens”). Ugyanakkor a 27. oldalon egy MIT-s forrásra támaszkodva a kétféle MI megközelítés (szimbolikus és statisztikai) közötti különbséget taglalva az anyag beismeri, hogy a gépi tanulás manapság az MI messze fontosabb területe, mint a szimbolikus (szabályalapú) MI, és ezen belül is a neurális hálók és a mély neurális hálók uralják a területet.
Ez a motívum sok szempontból érdemel figyelmet. Az MI-nek a gépi tanulásra történő redukálódása az elmúlt évek egyik egyértelmű és karakteres fejleménye. A jelenség összefüggésben van a Big Data jelenséggel és a számítási kapacitás exponenciális növekedésével: a statisztikai alapú gépi tanulás csak nagy adathalmazokon lehetséges. Ugyanakkor, ahogy erre többen rámutattak a statisztikai, Big Data és neurális háló alapú gépi tanulás teljesen másfajta „intelligenciát” képvisel, mint amilyen módon az emberi intelligencia működik. Ezzel együtt az „emberhez hasonló viselkedés/gondolkodás” mint elvárás lassan eltűnőben van az MI-vel kapcsolatban. Helyette az MI-től egy hármas kimeneti „formátumot” várunk csak el: tegyen pontos ajánlásokat és előrejelzéseket, és/vagy hozzon jó döntéseket. A „recommendation-prediction-decision” hármasa az anyagban számtalanszor visszaköszön, ez – mondhatni – az anyag második vezérmotívuma.
A harmadik fontos megállapítás pedig az, amelyet a második, gazdasági hatásokkal foglalkozó fejezetben találhatunk, majd az anyagban többször feltűnik. Eszerint az MI olyan „általános célú” technológia, mint a gőzgép, az elektromosság vagy a számítógép volt az elmúlt két évszázadban, és ugyanúgy, ahogy ezek a technológiák teljesen átrajzolták az egyes iparágak, sőt a mindennapi életünk képét is, a szerzők ezt várják az MI-től is.
A második, gazdasági aspektusokkal foglalkozó fejezetben a szerzők azzal az előfeltevéssel élnek, hogy az MI mint általános célú technológia gazdasági hatásmechanizmusa elsősorban azon alapszik, hogy csökkenti az előrejelzések és a döntések költségeit, miközben megnöveli azok pontosságát. Ha ebből a szemszögből nézzük az MI-t, azt láthatjuk, hogy meglepően sok emberi tevékenység célja az előrejelzés, vagy tartalmaz a jövő „megjóslására” vonatkozó mozzanatot. A hitelbírálati döntés az adós jövőbeli fizetési hajlandóságát jósolja, az előzetes letartóztatás elrendelésekor a terhelt szökési, elrejtőzési stb. hajlandóságáról teszünk kijelentéseket, és így tovább. A jobb jóslatok jobb és olcsóbb döntéseket eredményeznek, az MI hatása tehát elsősorban ezen keresztül érvényesül. Ugyanakkor a statisztikai, gépi tanuláson alapuló MI jó működéséhez adatok kellenek, méghozzá nagy tömegű és jó minőségű adat. Az adatok begyűjtése, tárolása, feldolgozása, majd az értékelése önálló szakmákat hoz majd létre és jelentősen átalakíthatja az egyes cégek munkafolyamatait, értékláncát és üzleti modelljeit. Csak egy példa: ha a repülőgépek indulása pontosan kiszámíthatóvá válik, akkor nincsen szükség reptéri várókra. (37. o.) Ehhez hozzátehetjük, hogy ez esetben a reptéri boltok is eltűnnek majd. Ugyanilyen hatásokat jósolnak az autonóm járművek és a parkolóhelyek kapcsán.
A gazdaság fejezet foglalkozik azzal is, hogy mekkora tőke áramlik az MI-vel foglalkozó cégekbe. Bár a kutatásban egy sok szempontból megkérdőjelezhető, és semmiképpen sem teljesen pontos módszert alkalmaztak, (ld. lentebb) a fejezet nagy vonalakban mindenképpen képet ad arról, hogy hogyan néz ki ma az MI fejlesztési világtérkép.
Az első megállapítás, hogy az MI-be áramló magántőke az összes innovációs tőkén belül a 2011-es 3%-os arányról 12%-os arányra nőtt. (Az anyag a 39. oldalon írja le a kiszámítás módját: ehhez a Crunchbase adatbázisát használták, amely a háromféle MI-be fektetett tőketípus közül: hagyományos cégek belső MI fejlesztésekre fordított összegei, a start-upok felvásárlására fordított összegek és a start-upokba áramló magán- és kockázati tőkebefetetések közül csak az utóbbit, a közvetlen tőkebefektetéseket veszi számba.)
A részletekben nem érdemes elmerülni, azonban ami igazán érdekes (aggasztó), hogy az utolsó lezárt év, 2017 az MI-be történő befektetések több mint a 2/3 része USA-beli és Kínai vállalkozásokba, projektekbe történt. Az igazán meghökkentő az a dinamizmus, amellyel Kína a semmiből az USA-val egyenrangú szereplővé vált. És még ijesztőbb, hogy az EU – pestiesen szólva – a fasorban sincsen, és ezen belül különösen sokkoló, hogy az egyébként sem túl acélos európai tőkeösszeg több mint 80%-át voltaképp három országba fektették be: az Egyesült Királyságba, Franciaországba, és Németországba. A többi 25 EU ország kevesebb, mint 20%-ot kapott összesen (41. o.).
Nehéz megmondani, hogy ennek a jelenségnek pontosan mi az oka, de azt is, hogy ennek hogyan fog jelentkezni 10 év múlva a gazdasági hatása. Ami az okokat illeti, egy szempontot mindenképpen érdemes megemlíteni, mégpedig az európai adatvédelem igencsak szigorú szabályait. A statisztikai alapú MI rendkívül sok adatot igényel, és az adatok túlnyomó része személyes adat. Ha a személyes adatok gyűjtésével, tárolásával, felhasználásával kapcsolatban túl sok az adminisztratív akadály, az az én véleményem szerint mindenképpen visszafogja az ilyen irányú innovációt. Ami pedig a következményeket illeti, nem nehéz elképzelni azt, hogy azok a cégek, akik akár azért, mert a hagyományos termékeiket tudják sokkal olcsóbban és hatékonyabban előállítani MI-támogatással, akár azért, mert egy sor új termékkel és szolgáltatással tudnak előlépni, mekkora versenyelőnyre fognak szert tenni.
A 3. fejezet különböző gazdasági ágazatokban már létező MI-alkalmazásokat, ötleteket mutat be. Mivel a területek rendkívül szerteágazók, én itt csak röviden egy területet villantok fel, a pénzügyi szektort.
Az anyag megállapítja, hogy a pénzügyi szektorban elsősorban a nagy cégek (nagy bankok, befektetési alapok stb.) kezdtek el MI technológiákat fejleszteni. A legfontosabb terület továbbra is a credit scoring, a hitelbírálat automatizálása, illetve MI-támogatása. Egyértelmű tendencia, hogy – ott, ahol erre a jog lehetőséget ad – a hitelbírálati szempontok közé olyan személyes adatokat is bevonnak (pl. közösségimédia-aktivitást), amelyet hagyományosan eddig nem használtak ilyen célokra. Mivel a világon rengeteg olyan ember él, akinek a hagyományos banki logika szerint semmilyen kölcsönt nem lehetne adni, mert nem tud fedezetet felmutatni, és „pénzügyi előélete” is alig van. Ugyanakkor pl. egy Alipay, amely az adott személy teljes tranzakciós előéletét tárolja, egy jól megtervezett MI segítségével könnyűszerrel el tudja dönteni, hogy mekkora hitel adható egy ilyen személynek. Ide kívánkozik ugyanakkor az a megjegyzés, hogy a social scoring (közösségimédia-profil alapján történő hitelnyújtás) az EU-ban lényegében kivitelezhetetlen az adatvédelmi akadályok miatt, hiszen ez sem a célhoz kötöttség, sem az adattakarékosság követelményeit nem elégíti ki, ráadásul egy adott profilhoz tartozó közösségi média-aktivitás más személyek személyes adatait is tartalmazza, amelynek kezeléséhez ők nem adtak engedélyt. A világ Európán kívüli része mindenesetre efelé halad.
A pénzügyi szektorban – akárcsak más szférákban – az egyik legnagyobb kihívást az MI-vel kapcsolatban az MI ajánlásainak, predikcióinak és döntéseinek elmagyarázhatósága jelenti. Ez a probléma annyira akuttá vált, hogy vannak olyan cégek, akik kifejezetten azzal foglalkoznak, hogy az egyébként black-box-szerű működést valahogy értelmezhetővé tegyék. A megoldások a szöveges magyarázatoktól (pl. Equifax – SAS együttműködésben készült alkalmazás – 56. o.) a vizualizált adatokig terjednek, vagy kombinálják a kettőt. Az anyag a szabályozási fejezetben is visszatér erre a problémára, és több jó gyakorlatot is ismertet.
A pénzügyi szektorban az anyag ezen kívül még három területet említ, mint ahol az MI egyre fokozódó szerepre tesz szert: a pénzügyi piacokon – különböző funkciókra használt – MI-támogatással rendelkező alkalmazásokat (mint amilyenek a robot tanácsadók, vagy a piaci hírekben szentiment-elemzést végző alkalmazások, illetve a kereskedő-botok), valamint a jogi megfelelőség elemzésére, illetve végrehajtására szolgáló legal compliance MI-ket, illetve az ezzel összefüggő pénzmosás és csalásfelderítő (fraud detection) algoritmusokat.
A szabályozási (public policy) fejezet előbb a kockázatokat veszi számba, majd megpróbál szabályozási ötleteket, alternatívákat nyújtani. Az MI veszélyei, kockázatai közt találhatjuk a már unásig ismételt veszélyeket: átláthatatlanság, reprodukálhatatlanság, hajlam az elfogultságra stb., új veszélyként azonosít ugyanakkor az anyag két tényezőt. Egyrészt, hogy nagyon gyakran a nem személyes adatokból a nyilvános információkkal összekapcsolva nagyon érzékeny következtetések vonhatók le (87. o.), illetve olykor a nem különleges és a különleges adatok közt is elmosódhat a határvonal, mert a nem különleges adatokból lehet következtetni a különlegesekre. Másrészt az anyag felfigyel az adat-privacy paradoxonra: eszerint ahhoz, hogy az MI rendszerek elfogultságát, pontatlanságait ki tudjuk küszöbölni, egyre több adatot kell gyűjtenünk. Ugyanakkor az egyre több adat begyűjtése egyre nagyobb privacy kockázatokkal jár együtt (82. o.).
Ebben a fejezetben olvashatunk arról a problémáról is, amelyet egyre komolyabban és egyre többen vetnek fel: az adatvédelem és ezen belül a hozzájárulás-alapú adatvédelmi rendszer tarthatatlanságára az MI korszakában. A tanulmány helyesen ismeri fel, hogy a gyűjtés, tárolás és felhasználás korlátozása, valamint a célhoz kötöttség elve ellentmondásban van az MI keltette igényekkel, és ezt a tendenciát az IoT, azaz az internetre kötött szenzorok által generált adatok csak tovább erősítik. Egyelőre nem látszik, hogy mi lesz a megoldás ebben a helyzetben.
Az anyag a szabályozási javaslatokat alapvetően két részre osztja: az egyik halmazban azokat az unásig ismételt mantrákat olvashatjuk, amelyeknek az MI „fékentartását”, „humanizálását”, „átláthatóságát”, „elszámolhatóságát” kellene biztosítaniuk, míg a másik csokorba az MI fejlesztését, elterjedését facilitáló jogi megoldásokat gyűjtötték. Ennek megfelelően az anyag az első részben sorra veszi az MI-vel kapcsolatos etikai követelményeket: az MI-nek „inkluzívnek”, „emberközpontúnak”, „fair-nek” kell lennie stb. Ezekkel a jámbor óhajokkal több probléma is van: egyrészt nem tudjuk, hogy kinek is szólnak. A programozóknak? Az MI haszonélvezőinek/működtetőinek? Vagy egyenesen magának az MI-nek? Másrészt ezek a magas szintű elvek bizonyosan nem lesznek elegendők, amikor majd megjelennek az első alkalmazások, és egy sor konkrét problémát és kockázatot kell egészen konkrétan (akár kód-szinten) kezelni.
Sokkal hasznosabb az anyag azon része (92. o.), amely az átláthatóság és elszámoltathatóság követelményeinek teljesítésére ad konkrét ötleteket. Ez a fejezet azokkal az ajánlásokkal zárul, amelyek nem az MI kockázatait, hanem éppenséggel a gyorsabb elterjedését hivatottak előmozdítani. Ezek közé tartozik az a felismerés, hogy az MI fejlesztéséhez a nagy adatmennyiség és az adatok szabványos formában történő, könnyű hozzáférhetősége elengedhetetlen, amelyet a kormányzatoknak jogi eszközökkel is elő kell segíteni.
Az utolsó fejezetben végül a különböző MI-kezdeményezésekről, programokról olvashatunk. Sok ország kifejezetten az MI-tematikában helyezi el ezeket a kezdeményezéseit (mint ahogy Magyarország is – a Mesterséges Intelligencia Koalícióval), más országok inkább a digitalizációt (pl. Dánia „digitális növekedés”, Szingapúr „digitális gazdasági keretrendszer”) helyezik a középpontba és az MI-stratégia ennek része. Se szeri, se száma az MI-vel valamilyen módon foglalkozó szervezeteknek, projekteknek, kezdeményezéseknek, intézményeknek, és az ezek által kibocsátott szakértői anyagoknak, dokumentumoknak, kódexeknek, ajánlásoknak, policy paper-eknek. Ezek közé tartozik az OECD, és ez az anyag is, amelynek elolvasását és forrásként való használatát a téma iránt érdeklődőknek mindenképpen ajánljuk.
Lábjegyzet:
1 – OECD (2019), Artificial Intelligence in Society, OECD Publishing, Paris, https://doi.org/10.1787/eedfee77-en