Egy akadémiai adatszakértő (academic data scientist) szerepe rendkívül összetett. Ezek a szakemberek az akadémiai, statisztikai és programozási ismereteiket használják az adatok begyűjtésére, elemzésére és modellezésére annak érdekében, hogy támogassák az oktatást, a kutatást és a döntéshozatalt a legkülönbözőbb területeken. Szerepük különösen fontos az adatvezérelt döntéshozatalban, amely egyre nagyobb jelentőséggel bír az üzleti, a kormányzati és az akadémiai életben egyaránt.
Az akadémiai adatszakértők gyakran dolgoznak együtt más tudományágak szakértőivel vagy optimális esetben maguk is akadémia szakemberek annak érdekében, hogy komplex problémákat még hatékonyabban oldjanak meg. Például egy jogi kutatás során az adatszakértő segíthet a jogszabályok, egyedi vagy nemzetközi döntések elemzésében és ezek értelmezésében, míg egy közgazdasági kutatásban az adatok modellezésével és előrejelzésekkel járulhat hozzá a kutatás sikeréhez. Az akadémiai adatszakértő szerep betöltéséhez számos technikai és módszertani ismeretre és készségre van szükség. Ezek közé tartozik a programozás, a statisztikai elemzés, a gépi tanulás, valamint az adatok vizualizálása és problémamegoldás készsége. Ezek mellett ugyanilyen fontos a tudományos módszertan ismerete, az üzleti érzék, valamint a kiváló kommunikációs készségek. A programozási nyelvek közül a Python[1] a leggyakrabban használt az adattudomány területén, mert lehetővé teszi az adatok hatékony feldolgozását és elemzését, valamint a gépi tanulási modellek fejlesztését. Az R és SQL[2] is népszerű programozási nyelvek, amelyeket adatkezelés, adatelemzés és adatbázis-kezelés terén használnak. Az SQL adatbázis-kezelő nyelv, amely lehetővé teszi a felhasználók számára, hogy egyszerűen kezeljék, elemezzék és tárolják az adataikat, valamint bonyolult adatelemzéseket és vizualizációkat végezhessenek. Az adatok vizualizálása mindháromnál kulcsfontosságú, mivel segítenek a kutatási eredmények érthető és áttekinthető bemutatásában.
Az akadémiai adatszakértő szerepe különösen fontos az adatvezérelt döntéshozatalban (data-driven decision-making: DDDM; magyarul rövidítve AVDH), amely egyre nagyobb jelentőséggel bír az üzleti, a kormányzati és a tudományos életben egyaránt. Ennek lényege, hogy a döntéshozók és kutatók döntéseiket és munkájukat a megszokás, tradíciók, és a napi rutin helyett konkrét adatokra alapozzák, amelyek védhető, elszámoltatható és validált eredményekre vezethetnek[3]. Az adatszakértők ennek érdekében képesek azonosítani a releváns kérdéseket, és megválaszolni azokat az adatok segítségével, ezáltal hozzájárulva a szervezetek hatékonyabb működéséhez és a jobb döntésekhez. Az akadémiai adatszakértők gyakran dolgoznak kutatási projektekben és programokban (Integrált Közlekedésfejlesztés Operatív Program, Nemzeti Tehetség Program, Tématerületi Kiválósági Program stb.), ahol az adatok elemzésével és modellezésével segítik a kutatótársak munkáját. Emellett részt vehetnek oktatási tevékenységekben is, például adatvizualizációs kurzusokat tartva hallgatóknak és kollégáknak. Az akadémiai adatszakértők számára ezért máris rendkívül sok foglalkoztatási lehetőség nyitott. Ide tartozik az egyetemi oktatás és kutatás, valamint az ipari és kormányzati szektor, amelyek egyaránt kiemelt területek. A jelen blogbejegyzés szerzőjének személyes tapasztalata, hogy az adattudomány területén szerzett tapasztalatok és készségek rendkívül értékesek, egymással kompatibilisek és számos különböző szakterületen is alkalmazhatók. Egy egyetemi adatszakértő például a vonatkozó szakirodalom kikutatásának és elemzésének készségével ugyanúgy képes támogatni a hallgatók diplomaírását, a jogászok ügydarabjainak megfogalmazását, valamint egy közigazgatási vagy nemzetközi döntés megfogalmazását, mert mindezen területek közös követelménye ugyanaz: nagy mennyiségű szakirodalmi forrás (jogszabályok, bírói döntések, szakirodalom stb.) kikutatása, értelmezése és konzervatív szempontok alapján való összevetése, illetve megfogalmazása. Mindezek alapján felmerül a kérdés, hogy az akadémiai adattudomány milyen diszciplínának vagy multidiszciplínának minősül[4]?
Az adattudomány az utóbbi években egyre nagyobb figyelmet kapott az akadémiai körökben, de a tudományág pontos definíciója és helye a tudományos életben még mindig vita tárgyát képezi. A transzdiszciplináris szemlélet az adattudományt egy minden tudományterületet átható, univerzális módszertanként értelmezi. Ebben a megközelítésben az adattudós elsősorban módszertani, különösen mesterségesintelligencia-szakértő, aki képes különböző területek adatait elemezni és értelmezni, függetlenül azok kontextusától. Ez a szemlélet az adattudományt egyfajta diszciplínák felett álló „szuperdiszciplínaként” helyezi el, amelynek eszközei és módszerei minden más tudományág számára alkalmazhatók. Az extradiszciplináris megközelítés ezzel szemben az adattudományt a különböző tudományterületek közötti együttműködésből kibontakozó, rugalmas és alkalmazkodó gyakorlatként írja le. Az extradiszciplináris adattudós nemcsak a módszertanban jártas, hanem mélyen ismeri az adott tudomány- és szakterület kérdéseit és kontextusát is. Ebben a modellben az adattudomány nem egy különálló diszciplína, hanem inkább egy „közvetítő”, amely lehetővé teszi a különböző tudományterületek közötti tudásátadást és együttműködést. A transzdiszciplináris és extradiszciplináris adattudomány közötti különbségek leginkább úgy foglalhatók össze: ameddig a transzdiszciplináris adattudomány a módszertanra fókuszál és univerzális, az akadémiai adatszakértő egy egyszerű szakértőként működik, aki általános tudással rendelkezik és célja új módszerek fejlesztése, addig az extradiszciplináris adattudomány az alkalmazásra és kontextusra helyezi a hangsúlyt, együttműködő partnerként tevékenykedik, speciális szaktudással bír és adott szakmai problémák megoldására törekszik. A transzdiszciplináris megközelítésben az adatszakértő kapcsolatot tart fenn más tudományágakkal, míg az extradiszciplináris megközelítés inkább kapcsolódási pontokat keres. A jelen blogbejegyzés jogász szerzője szerint az extradiszciplináris megközelítés jobban tükrözi az adattudomány jelenlegi gyakorlatát, és nagyobb valószínűséggel vezet eredményes és releváns kutatásokhoz, hiszen ez esetben az adatszakértő maga is szakembere az adott diszciplínának, így sokkal pontosabb válaszokat tud nyújtani saját szakterületén. Azonban a transzdiszciplináris szemlélet sem elvetendő, mivel az általa kínált univerzális eszköztár a személyes tapasztalata szerint számos további területen (könyvtárak, kormányhivatalok, ügyvédi irodák, bíróságok, közjegyzői irodák stb.) egyaránt hasznos lehet. Az adattudomány jövője valószínűleg a két megközelítés kombinációjában rejlik: az adatszakértőknek egyszerre kell törekedniük a módszertani innovációra és az adott szakterületek problémáinak mélyebb megértésére. Csak így válhat az adattudomány valóban hatékony és hasznos eszközzé a tudományos kutatás mellett a legkülönbözőbb problémák megoldásában[5].
Felhasznált irodalom
[1] „Welcome to Python.org”. Elérés: 2024. június 9. [Online].
[2] „Codefinity”. Elérés: 2024. június 11. [Online].
[3] E. Sebestyén, „A pedagógiai adatvezérelt döntéshozatal: elméleti megközelítések és vizsgálati lehetőségek”, Magyar Pedagógia, köt. 119, sz. 4, o. 287–312, 2019, doi: 10.17670/MPed.2019.4.287.
[4] J. T. Klein, „Typologies of Interdisciplinarity: The Boundary Work of Definition”, in The Oxford Handbook of Interdisciplinarity, 2. kiad., R. Frodeman, Szerk., Oxford University Press, 2017, o. 21–34. doi: 10.1093/oxfordhb/9780198733522.013.3.
[5] A. Tanweer és J. Steinhoff, „Academic data science: Transdisciplinary and extradisciplinary visions”, Soc Stud Sci, köt. 54, sz. 1, o. 133–160, febr. 2024, doi: 10.1177/03063127231184443.
Nyitókép forrása: vecteezy