A blogbejegyzés célja a mesterséges intelligencia (MI) alapú kutatási asszisztensek és a nagy nyelvi modellek (large language model – LLM) előnyeit és korlátait vizsgálni az egyetemi kutatásban.
Az MI számos előnnyel járhat bármely szakirodalommal való munka során, például a szöveg hatékonyabb feldolgozásával, a szövegből való célzott információnyerés és tanulás lehetőségével, valamint szövegek automatikus generálásával. A kutatóknak azonban az MI alkalmazásakor számos buktatót is el kell kerülniük, például a közvetlen és teljes szövegíratást, a hivatkozások elmaradását, a paradigmaváltások hiányát, az automatikusan generált szöveg ellenőrzés nélküli használatát, valamint a „gép soha” és „ember mindig” paradigmák csapdáját. A kutatók és a gyakorlati szakemberek együttműködésével ezek a korlátok csökkenthetők, és az MI közel teljes potenciálja kihasználható. A szerző meggyőződése, hogy a Nemzeti Közszolgálati Egyetemen a mesterséges intelligencia nem maradhat csupán a kutatások tárgya, hanem azok eszközévé kell válnia.
Az MI polgári alkalmazása jelentős előrelépést hozott az élet szinte minden területén. Az államigazgatásban a MI hatékonyan támogatja a kommunikációt, az online panaszkezelést és általában az ügyiratok készítése terén is kulcsszerepet játszik, elősegítve a gyorsabb és precízebb dokumentumkezelést. Nyelvi fordításban is kiemelkedő, hozzájárulva a kulturális és nyelvi határok áthidalásához.
Az MI különösen hatékony az írott szöveggel való munka során. Az MI képes gyorsan és hatékonyan azonosítani a szövegben található kulcsszavakat, kifejezéseket és témákat, értékelni a szöveg minőségét, például a pontosságát, a kohézióját és a nyelvi stílusát, valamint strukturálni a szöveget, például fejezetekre, bekezdésekre vagy mondatokra osztani. Ez lehetővé teszi az MI-t olyan feladatok elvégzésére, amelyek az emberek számára túlságosan időigényesek vagy nehézkesek lennének, például cikkek, jelentések vagy ítéletek összefoglalása, a hamis hírek vagy a nyelvi zavarok felismerése, vagy e-mailek, hírek vagy kreatív tartalmak generálása.[1] Az MI képes hatalmas mennyiségű szöveg adatot gyorsan feldolgozni és értelmezni, tanulni a szövegből, és automatikusan generálni a szöveget. A mesterséges intelligenciával való munkának a fenti előnyök ellenére megvannak a saját korlátjai is.[2]
Az első hiba, amelybe az MI-vel való munka során a kutató belecsúszhat, a közvetlen és teljes szövegírás csapdája. Rendkívül gyakori, hogy olyan témában utasítjuk (promptoljuk) a mesterséges intelligencia alapú platformokat, amiben hamis vagy téves szöveget fog generálni. Ennek négy oka lehet: a kutatók nem megfelelő MI interfészt alkalmaznak akadémiai munkához (1), amelyből nyert téves vagy hamis adatokat a kutatók nem ismerik fel, mert az adott szakterületen nem elég kompetensek (2). Végül az lehetséges, hogy a kutató a promptolásban nem elég felkészült, ezért nem tudja igényeit megfelelő promptokba foglalni (3) vagy egyszerűen nem rendelkezik elegendő idővel az alapos kutatómunkához (4). Bármi is a közvetlen és teljes szövegíratás oka, egy kutatónak ezt messze el kell kerülnie.
A második hiba a hivatkozások elmaradása. Rendkívül gyakori, hogy kiváló írásművek nem vagy nem megfelelően részletes hivatkozásokat tartalmaznak. Különösen gyakori ez a jelenség a nagy nyelvi modellek segítségével felépített írásművekre. A pontos hivatkozások rendkívül fontosok például egy tanulmányban, mert bizonyítják az irodalomismeretet, erősítik a hitelességet, biztosítják az átláthatóságot és a szakirodalomra való építkezést. A hivatkozások elkészítésére jelenleg számos hatékony szoftver létezik (Zotero[3], Citefast[4], Grammarly[5], Scispace[6] stb.), amelyek még mindig kevésbé ismertek az akadémiai életben. A Zotero hivatkozáskezelő és a Scispace nyelvi modell integrációja például rendkívül előnyös lehet. A Zotero szakirodalmi adatbázisából lehet válaszokat generálni és Scispace platformon talált szakirodalmak pedig a Zoteroba felvihetők, onnan hivatkozhatóak bármely írott szövegbe. Az automatizált hivatkozáskezelők tehát a mesterséges intelligencia interfészekkel össze is kapcsolhatóak, így a szakirodalmi adatok könnyedén felvihetőek.
A harmadik hiba a paradigmaváltás hiánya lehet a tudományos kutatás során. Ilyenkor ugyanazokat a lépéseket akarjuk megtenni, mint a hagyományos szövegíráskor. Ezt természetesen meg lehet tenni, de sokkal alacsonyabb lesz a MI-val való munka hatásfoka. A hagyományos szövegírás esetén általában az írásmű vázlatát előre elkészítjük, majd azokat meghatározott sorrendben, de több visszatekintés mellett dolgozzuk ki. A mesterséges intelligencia segítségével sokkal hatékonyabb, ha a megfelelő adatok begyűjtését követően részekre bontjuk, bővítjük és átstrukturáljuk az adatbázisunkat. A MI alapú kutatási asszisztensek alkalmazása során a leghatékonyabb eljárás a szakirodalmi adatbázis legyűjtése, majd feldolgozása nagy nyelvi modellek segítségével.
A negyedik hiba, ha a tudományos írásművek szerzői nem élnek a mesterséges intelligencia javaslataival az írásmű felépítésére (vázlatolás). A rendkívül széles internetes adatbázisok segítségével a mesterséges intelligencia kiemelkedő képessége, hogy a nyílt (open access) szakirodalmi adatbázisokat felhasználva csupán másodpercek alatt összeállíthatja bármelyik szakirodalom vázlatát. Emellett figyelemre méltó, hogy az írás szövegtörzséből automatikusan létrehozható részek – különösen a kulcsszavainak, összefoglalójának, absztraktjának – előkészítése. Ezekre kiválóak a Qillbot[7] és a Bard[8] modellek. A szövegtörzs természetesen sohasem ad egy megjelentetésre kész szöveget, de akár 70–90% közötti tanulmányszöveg nyerhető, ha megfelelő mesterséges intelligencia alapú platformot és hozzá promtokat választunk. Azok, akik figyelmen kívül hagyják ezt a lehetőséget, el is veszíthetik azt az értékes segítséget, amely a mesterséges intelligencia által nyújtott strukturált és gyors vázlatolás révén könnyen elérhető lenne számukra.
Az ötödik hiba a „gép soha” és „ember mindig” paradigmák csapdája. Ez azt jelenti, hogy élénken élnek olyan nehezen áttörhető hiedelmek, amelyek eredményeként a szerzők egyszerűen biztosra veszik a mesterséges intelligencia korlátait. Ez azt jelenti, hogy kellő ismeretek hiányában is elhatárolódnak a mesterséges intelligencia alkalmazásától, amikor az alkalmazásának lenne helye. A leggyakrabban szerzői jogi vagy etikai fenntartásokat emlegetnek, miközben a mesterséges intelligenciát nem illetik meg szerzői jogok, azokkal kizárólag természetes személyek rendelkeznek. Hangsúlyozni kell, hogy az egyik oldalon a mesterséges intelligencia által generált tartalmak esetében csak meghatározott körülmények között tehetnek a kutatók jogos követelést a szerzői jogra.[9] A másik oldalon viszont az MI-eszközök a már megjelent művekből tanulnak és hoznak létre új tartalmakat, amelyek más természetes személyek alkotásai. Az ilyen alapon indított perek egyike sem került még jogerősen elbírálása, a közbenső végzések mégis számos értékes megállapítást tartalmaznak[10]. Ebből következően megjelenhet az ezekkel kapcsolatos plágium lehetősége, amely etikailag, sőt szerzői jogilag problémásnak bizonyulhat.[9], [11]
Ezzel szoros összefüggésben van a hatodik csapda, amikor a kutatók az adott mesterséges intelligencia alapú alkalmazás jelenlegi képességét figyelik és nem szemlélik a villámgyors fejlődés folyamatát. 2023 szeptemberéig hetente 3–5 akadémiai felhasználóknak készült alkalmazás is megjelent. A kutatás során ezek számos hibás választ generáltak (hallucináció), amely miatt ma is számos kutató végletesen alul becsüli a mesterséges intelligencia képességeit. Az azóta eltelt időszakban viszont inkább a bevált interfészeket fejlesztik és a képességeiket bővítik. Ezért nagyon fontos, hogy a bevált felületekkel a kutatók folyamatosan dolgozzanak és magas szintű gyakorlatot szerezzenek.
Az utolsó, hetedik hiba a „XXI. századi luddizmus”, amely az előző két felfogás ellenpólusa. A luddizmus egy XIX. századi mozgalom volt, amely a gépek elpusztítását szorgalmazta, mert attól féltek, hogy a gépek elveszítik az emberek munkáját.[12] Ez esetben a kutató éppen azon félelmében határolódik el a mesterséges intelligenciától, mert az „leválthatja” őt. Sok esetben hallhatók kutatásetikai fenntartások, miközben a nagy nyelvi modelleket alkalmazó MI alkalmazások felhasználását már most is széles körben elismerik[13]. Az igazság az, hogy kutatások önálló lefolytatására jelenleg egyetlen mesterséges intelligencia alapú platform sem képes. Még azok sem (Squibler[14], HIX.AI[15] stb.), amelyek a kutatókat ezzel kecsegtetik, nem képesek elfogadható minőségű szöveget teljesen önállóan generálni.
Összességében az MI kiemelkedő színvonalon és számos módon segíthet az írott szöveggel való munka során. Az MI-t felhasználhatjuk a szöveg hatékonyabb feldolgozására, a szövegből való tanuláshoz és a szöveg automatikus generálásához is. Azonban az MI-vel való munka során számos korlát is felmerülhet. A jelen írás szerzője hét gyakori csapdát határoz meg, amelyekkel a kutatók szembesülhetnek a mesterséges intelligencia (MI) alapú kutatási asszisztensek és a nagy nyelvi modellek alkalmazásakor. Mindezek ellenére a szerző biztos benne, hogy a Nemzeti Közszolgálati Egyetemen a mesterséges intelligencia nem maradhat csupán a kutatások tárgya, hanem azok eszközévé kell válnia.
Felhasznált irodalom
[1] D. Ismail, I. Sahin, és G. Salih, „Conducting Academic Research with the AI Interface ChatGPT: Challenges and Opportunities”, Journal of STEAM Education, köt. 6, sz. 2, o. 101–118, 2023, [Online].
[2] H. H. Thorp, „ChatGPT is fun, but not an author”, Science, köt. 379, sz. 6630, o. 313–313, jan. 2023, doi: 10.1126/science.adg787 .
[3] „About Zotero – Zotero: A Beginner’s Guide – Research Guides at University of New Mexico”. Elérés: 2024. január 18. [Online].
[4] K. Med, „CiteFast- An Incredibly Easy Citation Tool for Students – Educators Technology”. Elérés: 2024. január 18. [Online].
[5] D. Alison, „What Is Grammarly?” Elérés: 2024. január 18. [Online].
[6] „SciSpace: Revolutionizing Research Paper Understanding with AI | by Nicole Gallicchio-Elz | Medium”. Elérés: 2024. január 18. [Online].
[7] R. Margaret, „What is Quillbot? How It Works, How to Use It, Top Competitors”. Elérés: 2024. január 18. [Online].
[8] W. Lance, „How to Use Google Bard AI: 10 Ways It Can Make Your Life Easier | PCMag”. Elérés: 2024. január 18. [Online].
[9] G. Csősz, „Áttekintés a Generatív Mesterséges Intelligenciák szerző jogi kérdéseiről”, Iparjogvédelmi és Szerzői Jogi Szemle, köt. 128, sz. 2, 2023, [Online].
[10] C. Metz, „OpenAI Says New York Times Lawsuit Against It Is ‘Without Merit’”, The New York Times, 2024. január 9. Elérés: 2024. január 20. [Online].
[11] Grad-Gyenge A., „A mesterséges intelligencia által generált tartalmak értelmezésének lehetőségei a szerzői jog útján”, Magyar Jog, sz. 6, 2023, Elérés: 2024. január 20. [Online].
[12] „Mi a(z) luddizmus definíciója, jelentése? HR-szótár – HR Portál”. Elérés: 2024. január 18. [Online].
[13] C. Christy és A. Francesca, „The winner of a prestigious Japanese literary award has confirmed AI helped write her book | CNN”. Elérés: 2024. január 20. [Online].
[14] C. Dave, „Squibler Review for 2024: Read This Before Purchasing!”, Kindlepreneur. Elérés: 2024. január 21. [Online].
[15] „HIX AI – All-in-One AI-Powered Writing Copilot – ToolPilot”. Elérés: 2024. január 18. [Online].
Nyitókép forrása: geralt, Pixabay