Skip to content
  • MAGAZIN
  • BLOGTÉR
  • PODCAST
  • TV
  • WEBSHOP
  • FOLYÓIRATOK
  • KIADÓ
Menü
  • MAGAZIN
  • BLOGTÉR
  • PODCAST
  • TV
  • WEBSHOP
  • FOLYÓIRATOK
  • KIADÓ
  • MAGAZIN
  • BLOGTÉR
  • PODCAST
  • TV
  • WEBSHOP
  • FOLYÓIRATOK
  • KIADÓ
Menü
  • MAGAZIN
  • BLOGTÉR
  • PODCAST
  • TV
  • WEBSHOP
  • FOLYÓIRATOK
  • KIADÓ
Szűcs Petra

Innovatív zöld technológiák

A fenntartható jövő felé vezető út előkészítése.

Szűcs Petra 2023.11.20.
Szűcs Petra

A csatlakoztathatóság forradalmasítása

Sebesség és alacsony késleltetés: a változás katalizátorai.

Szűcs Petra 2023.11.15.
Szalai Piroska

Ébredés az inflációs sokkból

Szeptembertől itt a reálkereseti fordulat.

Szalai Piroska 2023.10.27.
Kalas Vivien

Az uniós ifjúság helyzete

Alig javult életminőségük az Európai Unióban.

Kalas Vivien 2023.10.26.
Kutasi Gábor

Múló infláció

A témát szakértői konferencián vizsgálják november 9-én az egyetemen.

Kutasi Gábor 2023.10.20.
LUDECON BLOG
Marton Ádám
Marton Ádám
junior kutató, NKE Gazdaság és Versenyképesség Kutatóintézet
  • 2023.07.26.
  • 2023.07.26.

Módszertani lehetőségek: hagyományos ökonometria és a big data elemzés

A digitalizáció és az ipar 4.0 technológiai fejlődése magával hozta az adatok forradalmát is. Számos adatot generálnak a fogyasztók, a vállalatok és az állam is. Az elemzések során egyre több adat áll rendelkezésünkre, melyek a kutatások során egyik oldalról bővítik az elemzési lehetőségeket, a kutatási területeket, valamint pontosabb elemzési, előrejelzési eredményeket érhetünk el velük. Másik oldalról viszont potenciális kihívásokat is magukban hordoznak, melyek kiterjednek a megfelelő elemzési lehetőségek megválasztására, illetve az önkényesen megválasztott elemzési módok, modellek, becslési eljárások okozta torzított eredményekre, az azokból levont nem megfelelő szakpolitikai következtetésekre is, valamint a nem szándékos torzítás okozta divergenciákra is. Ez még inkább hangsúlyozza, hogy a kutatói és az elemzői szerepkör felelőssége az adatok rendelkezésre állásával felértékelődik, s még fontosabbá teszi az elemzések során a megfelelő módszerek kiválasztását.

Kiindulópontnak tekintsük az adatokat mint fő vizsgálati tényezőket, valamint azok megváltozott jellegét. A hagyományos adatok, illetve az adatgyűjtés és a big data közötti különbség több tényező mentén határozható meg. Mindazonáltal két nagy területet lehet lehatárolni: az adatok méretéből és jellegéből fakadó eltérést, illetve ezzel szoros összefüggésben a nagyobb mennyiségű, illetve potenciálisan nagyobb gyakoriságú adatokból fakadó eltérő elemzési lehetőségeket és kihívásokat. Az adatok jellegét vizsgálva leszögezhető, hogy a hagyományos adatok fő jellegzetessége, hogy strukturáltan állnak rendelkezésre, általánosságban kisebb méretűek, kezelésük és elemzésük egyszerű, illetve esetükben alkalmazhatók a hagyományos elemzési módszerek és függvények. A hagyományos adatok elemzési lehetőségei között tarthatjuk számon – a teljes igénye nélkül – például a statisztika két nagy területét: a leíró és következtető statisztikát; a különböző adatredukciós módszereket, csoportosító eljárásokat, ok-okozati kapcsolatok és összefüggések vizsgálatát. Emellett az egyes tudományágakban – különösen a közgazdaságtanban – az empirikus vizsgálatok oldaláról fontos szerep jut a különböző modellezési eljárásoknak (pl. DSGE modellek), amelyek lehetővé teszik az egyes elméletek tesztelését. Ezzel szemben a big data legtöbb esetben nem strukturált vagy félig strukturált formában áll rendelkezésre, s az adatok kisebb része érhető el strukturált formában. További tulajdonságaként tartható számon az adatok számottevő méretéből fakadó eltérés, ezzel összefüggésben az adatok kezelésével kapcsolatos kihívások, illetve a szükséges speciális adatbáziskezelők használata, valamint az adatméretből fakadó nagyobb rendszerkapacitási igény. A big data elemzése számos esetben a meglévő statisztikai, ökonometriai technikákon alapuló kiterjesztett és specializált módszertani kereteken alapul, azonban a pontos elemzési eredményekhez speciális függvények alkalmazására van szükség. Összefoglalva a big data elemzés a számottevő adatot magában foglaló adatbázisok kezelésén, az adatminőség biztosításán, az adattisztításon, illetve az adatok kezelésén alapul, melyek vizsgálata végső soron a big data-ra specializált különböző elemzési módszerek alkalmazásával valósítható meg. A hagyományos adatok és a big data azonban össze is kapcsolható, nem szükséges azokat külön kategóriákat kezelni. Ezek kombinálására számos lehetőség kínálkozik, például a big data alkalmazható kiegészítő vagy segédadatként a hagyományos statisztikai adatokhoz kapcsolódóan.

A big data elemzésére és a gépi tanulásra épülő modellek számos tudományágban az elemzések alapjául szolgálnak. Ez alól nem képez kivételt a közgazdaságtan sem. Erre egy jó példa, hogy egy elemzés során megállapították, hogy a közösségi médiában tapasztalható hangulat és a fogyasztói bizalmi index között korreláció mutatható ki, viszont mindkettőnek vannak hiányosságai. A hagyományos fogyasztói bizalmi index tartalmazhat mintavételi hibákat, torzításokat, míg a közösségi médiához kapcsolódó hangulatindex ugyan rendkívül időszerűnek tekinthető, viszont például az összehasonlíthatóságot korlátozhatja a közösségi médiában való részvétel potenciális megváltozása. Emellett hangsúlyozni kell azt is, hogy a big data-n alapuló adatvezérelt módszerek javíthatják az ok-okozati összefüggések azonosítását és ezzel kapcsolatban az előrejelzési képességet is a hagyományos statisztikai módszertanhoz képest.

A fentiek, s big data egyre növekvő népszerűségének ellenére ezen elemzések alkalmazásának jelenleg módszertani korlátai is felmerülhetnek. Amennyiben az előrejelzési technikákat vesszük górcső alá, úgy kijelenthető, hogy a nagy adatokkal végzett előrejelzéssel kapcsolatban kezdetben a túlillesztés okozta becslési torzítás eredményezhetett torzított előrejelzési eredményeket. Mindazonáltal az utóbbi időben a tesztek és becslési eljárások pontossága folyamatosan javult, mely a modellválasztás folyamatát és az előrejelzési képességet is javítja. Megállapítható tehát, hogy az elemzési módszerek is folyamatos fejlődést mutatnak, mely a jövőben elősegítheti a big data vizsgálatok még nagyobb mértékben történő elterjedését. Továbbá szükséges kiemelni, hogy a big data elemzési technikákkal történő empirikus vizsgálatok során különösen fontos a nem szándékos torzítások elkerülése, s ezáltal a torzított eredmények és következtetések lehetőségének kiküszöbölése. A big data-val szemben megfogalmazhatók további kritikák is. Ezek között említhetjük meg, hogy nem rendelkezünk megfelelő információval az adatgeneráló folyamatról vagy az adatforrás kapcsolatait illetően, valamint ki kell emelni az adatvédelem szerepét is, ugyanis nem megfelelő adatvédelem mellett a magán adatgyűjtők számára – melyeket nem köt olyan szigorú szabályozási rendszer, mint az állami szereplőket – lehetőséget teremt a profilalkotásra.

Számos kutatás kiemeli, hogy a big data elemzés, valamint kapcsolódóan a gépi tanulás lehetőségeinek kihasználása stratégiai fontosságú a közgazdászok, a politikai döntéshozók és a társadalomtudósok számára. Ezen módszerek ismerete, valamint az ezzel szoros összefüggésben álló kódolási képességek (különösen R és / vagy Python használata) fejlesztése kulcsfontosságú tényező a jövőbeni elemzői tevékenységhez (legyen szó közgazdaságtudományi vagy társadalomtudományi elemzésről, vagy a politikai döntéshozatalról, de a módszertan ezen vállfaja az állam- és jogtudomány számára is további perspektívákat kínálhat, pl. szövegelemzés), sőt a jelenbeli elemzések során is egyre inkább elengedhetetlenné válik. 

Összegzésképpen megállapítható, hogy az adatalapú elemzési környezet egyre inkább elterjed a mindennapokban. Ez felértékeli a big data adatgyűjtést, s a kapcsolódó elemzések jelentőségét is, melyek a lehetőségek mellett kihívásokat is magukban hordoznak. Emellett a folyamatban lévő változások a kutatói és elemzői képességeket is felértékelik. Továbbá szükséges kiemelni, hogy a pontos, megbízható, torzításmentes elemzések a hagyományos módszertani keretrendszerben is elengedhetetlenek. Ez a kritérium ugyanakkor az adatok egyre nagyobb elérhetősége mellett – kapcsolódóan a big data strukturálatlan és félig strukturált tulajdonságához – még fontosabbá válik a big data elemzések során, valamint aláhúzza az elemzések során alkalmazott becslési eljárások, módszerek, modellspecifikációk megfelelő alkalmazását.

A blogposzt a TKP2021-NKTA-51 számú projektben, a Kulturális és Innovációs Minisztérium Nemzeti Kutatási Fejlesztési és Innovációs Alapból nyújtott támogatásával, a TKP2021-NKTA pályázati program finanszírozásában valósult meg.

Nyitókép: Mohamed Hassan / PxHere

Témakörök: big data, döntéshozatal, elemzés, gazdaság
nke-cimer

LUDOVIKA.hu

KAPCSOLAT

1083 Budapest, Ludovika tér 2.
E-mail:
Kéziratokkal, könyv- és folyóirat-kiadással kapcsolatos ügyek: kiadvanyok@uni-nke.hu
Blogokkal és a magazinnal kapcsolatos ügyek: szerkesztoseg@uni-nke.hu

IMPRESSZUM

Ez a weboldal sütiket használ. Ha Ön ezzel egyetért, kérjük fogadja el az adatkezelési szabályzatunkat. Süti beállításokElfogad
Adatvédemi és süti beállítások

Adatvédelmi áttekintés

This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary
Always Enabled
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
SAVE & ACCEPT