Kutatási szabadság és etikus tudomány a mesterséges intelligencia korában
Április utolsó napjaiban a magyar sajtót is bejárta az a hír, hogy a zürichi egyetem kutatói hónapokon át kísérleteztek a Reddit közösségi oldal egyik aloldalán (subreddit-jén) mesterséges intelligencia ágensekkel (botokkal) anélkül, hogy erről az aloldal több millió felhasználóját tájékoztatták volna.
A Change My View (r/changemyview, CMV) egy olyan internetes tér, ahol bármelyik felhasználó karakteres, (olykor szélsőséges vagy nagyon megosztó) kijelentéseket posztolhat ki: várva azt, hogy a többi felhasználó meggyőzi őt arról, hogy részben vagy egészben nincsen igaza. Amennyiben a posztolót meggyőzték, az egy delta (Δ) betűvel jelzi ezt.
A kísérletben a kutatók több tucat – összesen 34 – profilt hoztak létre, és szabadítottak rá különböző vitaindító posztokra – összességében 1500 bejegyzést generálva. (A kísérlet leírását és első eredményeit a kutatók eleinte közzétették, de azóta már elérhetetlen lett. Ebből a cikkből ugyanakkor megtudható néhány részlet.) A zürichiek az egyes profilokat megszemélyesítő ágenseknek adtak egy karaktert, (pl. nemi erőszak áldozata, a BLM mozgalmat elítélő fekete vagy az egészségügyben rossz ellátást kapó személy) és a posztoló személyes tulajdonságait is megtanították a bottal. Ezután megmérték a bot meggyőző erejét, azaz a bot által kapott deltákat. Bár a kísérlet eredménye már nem érhető el, a néhány nappal ezelőtt még nyilvános összefoglalóból úgy tűnt, hogy a botok az embereknél sokkal jobb hatékonysággal tudták meggyőzni a posztolókat, azaz több deltát tudtak gyűjteni az embereknél.
A kutatás végeztével a kutatók tájékoztatták a Reddit moderátorait, elnézést kértek az előzetes tájékoztatás hiányáért és a szabályszegésért (a Reddit, akárcsak bármelyik más közösségi médiafelület, tiltja az automaták és a robotok használatát a felületein). A kutatók bemutatták az egyetem kutatásetikai bizottságának engedélyét is. Jelezték, hogy azért kellett bejelentés nélkül végezniük a kísérletet, mert az előzetes bejelentéssel értelemszerűen a felhasználók magatartása oly mértékben változott volna meg, amely az egész kutatást értelmetlenné tette volna. Érveltek továbbá azzal is, hogy a kísérlet olyan jelentőséggel bír, és olyan komoly eredményeket produkált, amelyhez képest a felhasználók tájékoztatásának elmaradása csekély és vállalható sérelem.
Ami azonban ezután következett, arra valószínűleg nem voltak a kutatók felkészülve. A Reddit csapata és a CMV subreddit felhasználói ugyanis nemcsak nehezményezték a kísérletet, hanem ebből egy lényegében világraszóló botrányt is kavartak.
A Reddit csapatának véleményét itt olvashatjuk. Fő érvük nem elsősorban az, hogy a robotok működtetése szabályzatellenes, hanem, hogy több szempontból is súlyosan etikátlan. A CMV egy emberek számára létrehozott online tér, ahol nincsen a robotoknak keresnivalójuk. Emellett azt is sérelmezik, hogy a kutatásetikai bizottság eredeti engedélyében még „értékalapon” érvelő botok vannak, míg a végleges kísérlet személyre szabott érvekkel operált. A Reddit csapata szerint továbbá a kísérlet lefolytatható lett volna teljesen etikusan is, ahogy azt maga az Open AI épp a CMV subredditből letöltött adatokkal megtette. Ebben a kísérletben ugyanis (a kísérlet leírását ebben a TechCrunch cikkben találhatjuk) nem élő embereken kísérleteztek, hanem a letöltött indító posztokra generáltattak a ChatGPT-vel válaszokat, majd ezeket összevetették a subreddit valódi emberek által írt érveivel. Tehát – érveltek a redditesek – igenis létezik a chatbotok érvelő erejének mérésére etikus kísérleti dizájn is.
Az ügyben a legtöbb sajtóorgánum a Reddit és a felhasználók pártjára állt, én azonban nem vagyok teljesen biztos abban, hogy a platform képviselőinek mindenben igaza van, és főképp mindenben őszinték a szándékaik. Egyrészt kérdés, hogy a kutatóknak mit kellett volna még tenniük azon kívül, hogy engedélyeztették a kutatást az egyetemük kutatásetikai bizottságával. Másrészt milyen sérelem érte a CMV felhasználóit azzal, hogy bizonyos érveket és bejegyzéseket a chatbotok generáltak egy amúgy kontrollált kísérletben? Hogyan definiáljuk itt az etikai problémát? Hiszen, mondjuk, ha valaki egy ilyen csevegésen kívül megkérdez egy chatbotot egy adott témában, majd a chatbot által adott válaszból (ötletből) maga ír egy választ, érvet, az miben különbözik attól, hogy a bot által generált szöveget változtatás nélkül másolják be a kommentfolyamba? Az eset kapcsán különböző helyeken kibontakozó vitáknak egyik visszatérő eleme, hogy nem tudjuk, mennyi a gépekkel generált tartalom ezeken a platformokon, de nagyon valószínű, hogy jóval magasabb, mint gondolnánk. Őszintén szólva én a LinkedInen vagyok aktív, és egy sor olyan „influenszert” ismerek, akiknél, részben a posztolás gyakorisága, részben meg a nyelvezet miatt eléggé gyanús, hogy chatbotok segítik a tartalomelőállításukat. Akkor ez is etikai vétség? Érezzem magam átverve, megalázva azért, mert érdekesnek találok, sőt akár lájkolok egy gép által előállított tartalmat? Mi ezzel tulajdonképpen az etikai probléma?
A Reddit csapatának szenvedélyes elutasítása mögött azonban ott motoszkál a szerintem legfontosabb kérdés, amely eddig méltatlanul kevésszer került terítékre. A valódi emberek által előállított tartalmak hihetetlen módon felértékelődtek a nagy nyelvi modellek korában. A fentebb már idézett Techcrunch cikkben olvashatjuk, és a részletekről pl. itt tájékozódhatunk, hogy az OpenAI és a Reddit éppen 2024 májusában kötött egy együttműködési szerződést, amelyben a Reddit átengedi a tartalmait az OpenAI-nak tanítóadatként. (Fun fact: Sam Altman a Reddit legnagyobb tulajdonosa 8,7% részesedéssel.) Ennek nem lehet tudni az összegét, de a Redditnek a Google-lal kötött 2024 februári tartalomátengedési szerződése esetében egy névtelen forrás 60 millió dollárról beszélt a Reutersnek, valamint arról, hogy a Reddit ekkortájt nagyon felpörgette az üzleti tevékenységét, mivel tőzsdére akart menni. Ez tavaly márciusban be is következett, a részvény egészen jól is teljesített.
A fő bevételi forrás bevallottan a tartalomértékesítés (content licensing). Nehéz szabadulnom attól a gondolattól, hogy a redditeseket nemcsak az etikai problémák háborították fel, hanem főképp az, hogy a saját tulajdonuknak tekintett és kiválóan monetizált felhasználói tartalmaik veszélybe kerülnek, ha ezeket egyesek (kutatók vagy bárki) ingyenesen felhasználják. (Ilyen érvek egyébként a CMV-ügy hivatalos Reddit kommunikációjában is megjelennek – mi lesz, ha mások is felbátorodnak a zürichi kutatók nyomán?).
Ebben az érvelésben ugyanakkor csak annyi a kis bökkenő, hogy a Reddit nem tulajdonosa a felhasználók bejegyzéseinek, ahogy a Facebook sem rendelkezhetett korlátlanul a felhasználók adataival a Cambridge Analytica ügyben – más kérdés hogy simán megtette. A Reddit azzal, hogy az üzleti tevékenységének középpontjába a felhasználók által generált adatok direkt eladását teszi, véleményem szerint ezerszer etikátlanabb, mint a zürichi kutatók. Ugyanakkor ez a probléma már olyan kérdésekig vezet, mint a személyes adatok és a személy helye az információs kapitalizmusban, az USA platformjainak nyomasztó üzleti és nyilvánosságbeli dominanciája, az adatokkal folytatott kétes gyakorlataik, és az egésznek világmegváltó „értékekbe” „alapjogokba” és „etikába” csomagolása, mint ebben az esetben is.
Nyitókép forrása: Brett Jordan / Pexels