Články označené ako BrandCom sú pripravené a publikované v spolupráci s komerčnými partnermi. Hoci redakcia TRENDU nie je ich autorom, ich obsah považuje za prínosný pre čitateľa a preto umožnila ich publikovanie. Viac o BrandCom

BLOG Listy z Ženevy

Ekonomické modely a R2

12.09.2017 | Roman Kanala

Väčším problémom, ako presnosť modelu, môže byť interpretácia výsledkov.

  • Tlačiť
  • 46

Rubrika

Ekonomika

Model je redukovaná, štylizovaná, zjednodušená alebo abstraktná reprezentácia reality, systému, teoretického vzťahu alebo javu. Modelovanie je technika, ktorou sa postaví model väčšieho systému, vzťahu alebo javu za cieľom študovať, extrapolovať alebo predpovedať správanie sa pôvodného systému. Pri redukcii a schematizácii sa prejavia vedľajšie účinky zjednodušenia, ktorým treba čeliť súborom hypotéz alebo obmedzení oblasti použitia modelu a ktoré sú platné len v pôvodnom kontexte. Pri každej zmene mierky, rozsahu alebo podmienok modelu, tieto hypotézy a obmedzenia musia byť znovu preskúmané, inak môže dôjsť k systematickej chybe.

Model môže byť závislým na jeho určení, môže byť obmedzený i spôsobom chápania komplexnej reality a zodpovedať dosiahnutému poznaniu objektívnej reality. Napríklad i nasledovný model spĺňa definíciu modelu ako zjednodušenej, štylizovanej reprezentácie reality zodpovedajúcej gnozeologickej úrovni užívateľa: Ťap, ťap, ťapušky, išli mačky na hrušky.

Ekonomický model je teoretický konštrukt predstavujúci ekonomické procesy, vzťahy a javy pomocou množiny premenných a množiny logických alebo kvantitatívnych väzieb medzi premennými, zjednodušená teoretická reprezentácia nejakého komplexnejšieho vzťahu či javu. Kľúčovým slovom je "zjednodušenie", nakoľko ekonomické vzťahy sú komplexné a zahŕňajú ľudské správanie sa, ktoré je nelineárne a veľmi ťažké modelizovať. Extrémne zjednodušený ekonomický model je napríklad: Kolo kolo mlynské, za štyri rýnske.

Ekonometrické modely sú štatistické modely, aké sa používajú v ekonometrii. Ekonometria je aplikácia štatistických metód na ekonomické dáta, vetva ekonomických vied, ktorá dáva ekonomickým vzťahom empirický obsah, poplatná induktívnej metóde spoločenských vied. Induktívna metóda je spôsob uvažovania, kde je premisa považovaná za dôkaz pravdivosti záveru a všeobecné princípy sú tak odvodené od jednotlivých pozorovaní. Napríklad ak máte k dispozícii panel dát a vzťahy medzi nimi umožnia konštrukciu nejakého modelu, postupujete induktívnou metódou. Odvodíte vzťah z oblaku dát.

Typický ekonometrický model je lineárna kombinácia nezávislých premenných a ich koeficientov plus nejaká konštanta, a na druhej strane rovnice je závislá premenná. Hodnoty premenných v minulých rokoch sú známe a hľadajú sa koeficienty. Najčastejšie to je metódou najmenších štvorcov, aby sa penalizovali veľké odchýlky od priemeru. Premenné si vyberiete také, ktoré majú logický vzťah, a ktoré majú štatistickú signifikanciu. Tá sa dá otestovať štandardnými metódami na testovanie štatistických hypotéz. Model má najčastejšie tvar Q(t) = K + a1 X1(t) + a2 X2(t) + ... + an Xn(t). K je konštanta, Xi sú nezávislé premenné, Q je závislá premenná, ai sú koeficienty získané metódou najmenších štvorcov. Akonáhle sú známe koeficienty, je možné z modelu zistiť príspevok tej-ktorej premennej, alebo extrapolovať výsledky do budúcnosti.

Konštrukcia modelu môže byť aj automatizovaná a robená z oblaku dát pomocou techník data mining. Výber premenných sa urobí z matice kovariancií a signifikancia premenných sa preverí F-testom. Algoritmus môže priniesť zviditeľnenie netušených vzťahov, ale treba mať na pamäti, že kovariancia neznamená automaticky kauzalitu. Nezamestnanosť môže mať matematicky signifikantnú koreláciu s populáciou bocianov, ale logicky to nedáva zmysel. Preto treba byť nanajvýš opatrný pri interpretácii výsledkov ekonometrických analýz.

Opakom indukcie je deduktívna metóda, kde sú známe vzťahy a hľadajú sa k nim dáta. Napríklad normatívne modely, kde je predpísaný vzťah premenných ako pri modeloch spotreby energie, kde konečná spotreba Q závisí od množstva spotrebičov Z, od ich mernej spotreby N a od intenzity používania A. Vzťah sa dá vyjadriť nasledovne: Q = A N Z. V diskrétnom čase to bude Qt = At Nt Zt, kde index t znamená časový úsek, typicky rok, a v spojitom čase Q(t) = A(t) N(t) Z(t).

Ak sú spotrebiče rôzne, tak sa rozdelia do tried, prepočíta sa príspevok jednotlivých tried spotrebičov a urobí sa suma príspevkov, ktorá bude hľadaným výsledkom, celkovou hodnotou spotreby energie v danom roku. Takým modelom sa občas hovorí aj inžinierske alebo technicko-ekonomické modely. Množstvo spotrebičov v minulosti je známe, rovnako ako ich špecifická spotreba a intenzita používania, napríklad kilometre prejazdené za rok, alebo hodiny prevádzky chladničky počas jedného roka (kde je rozumné predpokladať nepretržitú prevádzku). Nehľadajú sa koeficienty, ale hodnota závislej premennej na ľavej strane rovnice, ktorá má fyzikálny význam. Ak viete extrapolovať nezávislé premenné, napríklad počet automobilov či chladničiek, ich technické vlastnosti a ich používanie, tak môžte získať hodnoty spotreby energie v budúcnosti. Ak chcete sledovať vplyv technického pokroku generácií spotrebičov na spotrebu energie, tak vezmete nie priemernú mernú spotrebu všetkých spotrebičov v prevádzke N(t), ale mernú spotrebu nových spotrebičov, ktoré sa dali kúpiť na trhu v roku t', označme ju n(t').

Rovnica spotreby potom bude mať tvar Q(t) = A(t) Suma(t') b(t-t') n(t') z(t'), kde t je dnešný rok, t' je rok zakúpenia spotrebiča a t-t' je jeho vek. Funkcia b(t-t') je funkcia prežitia v závislosti na veku spotrebiča. Pre autá bude v roku 0 hodnota 100%, v roku 1 už len 99% kvôli nehodám s totálnym zničením auta, v roku 12 to bude asi 50% a potom krivka klesá už len veľmi pomaly, lebo časť áut ostáva ako historické automobily. V prípade chladničiek bude hodnota dlho rovná 100%, lebo čelných zrážok chladničiek býva menej, ako v prípade automobilov a po 10 či 15 rokoch začne krivka prudko klesať. Pri klasických žiarovkách hodnota klesne veľmi strmo medzi 900 a 1100 hodinami prevádzky, lebo boli tak vyrobené, aby po 1000 hodinách +/- 10% všetky vyhoreli.

Už vidíme aj prvý rozdiel medzi týmito modelmi. Kde je výsledok deduktívneho modelu istý, lebo je daný nemenným vzťahom, ktorý je vopred známy alebo stanovený, pri induktívnej metóde je výsledok len pravdepodobný, lebo zmenou dát k dispozícii je možné zvoliť iné premenné či dôjsť k iným výsledkom. Kým pri technicko-ekonomickom inžinierskom modeli je možné zachytiť aj také nuansy ako generácie spotrebičov a zostrojiť model, ktorý ich bude rešpektovať, ekonometrický model nemá zjavný fyzikálny význam a vplyv jednotlivých premenných závisí od oblaku dát. Identifikácia modelu je obtiažnejšia.

Povedľa zjednodušenia reality je teda dôležitou vlastnosťou ekonomického modelu výber dát podľa paradigmy ekonometrického modelu. Paradigmou sa nazýva množina konceptov, schém myslenia, teórií, metód, postulátov a noriem, ktorá predstavuje kognitívny rámec nejakej vedeckej disciplíny. Inak povedané, množina problémov na skúmanie, ako aj techník a metód, akými budú preskúmané. Čiže ak chceme skúmať infláciu, nebudeme sa zaujímať o populáciu bocianov a žiab, ale o cenové hladiny a hľadať premenné, ktoré s nimi môžu súvisieť.

Pri deduktívnom techno-ekonomickom inžinierskom modeli majú premenné jasný fyzikálny zmysel a preto inžinieri majú radi inžinierske modely, lebo im nie je ťažké porozumieť. K nim treba dosť veľa dát dobrej kvality. Na druhej strane do ekonometrického modelu stačí málo dát, aké sú dostupné zo štatistík. Vzťahy medzi premennými sú dané koeficientmi a v multilineárnej rovnici sa nachádza i nejaká konštanta, ktorá nemá fyzikálny význam a slúži len k tomu, aby bola ľavá strana rovnice rovná pravej. Vzťahy medzi premennými vyjadrené koeficientmi schovávajú komplexnú realitu, ktorú sa modelizátor ani nesnaží zistiť a pochopiť. Ekonometrické modely sú ako mágia, rozumejú im len vyvolení a aj medzi nimi nie všetci.

V ekonometrických modeloch sa ako závislá premenná X väčšinou používajú HDP, počet obyvateľov, disponibilný príjem, a iné dobre známe veličiny. Zber dát urobí buď štatistický úrad, alebo ich treba zbierať svojpomocne meraním nejakej obmedzenej vzorky a rozumnou extrapoláciou na celok. Meranie sa robí pozorovaním alebo sociologickým prieskumom. Nemá zmysel konštruovať model, pre ktorý nebudú dáta. Disponibilita dát ovplyvňuje kvalitu modelu. Kvalita modelu sa hodnotí hodnotou R2. Čím väčšia hodnota R2, tým viac sa tešíme. Ak je R2=1, tak je to perfektný fit a model má problém, lebo sú tam kolineárne dáta. Snaha o čo najlepší fit a hodnotu R2 je len matematické hranie sa s dátami a môže zakrývať aj metodologické chyby. Vidíme, že stavať ekonometrické modely je činnosť podobná remeslu, lebo kvalita výsledku závisí okrem iného od zručnosti a skúseností modelizátora. Iný modelizátor môže dospieť k rozdielnym výsledkom. Stačí vybrať iné sady dát.

Okrem toho je slabinou ekonometrických modelov to, že sú to štatistické modely. Ako každý štatistický model, i tu je štatistika vecou, o ktorej Churchill povedal, že jej verí, len ak ju sfalšoval on sám: "I only believe in statistics that I doctored myself."

Problém so štatistikou však nemusí spočívať v presnosti dát. Môže to byť aj v ich interpretácii alebo prezentácii výsledkov. Pravdepodobnosť výhry v lotérii je jedna k niekoľkým miliónom. Ale 100% výhercov si podalo tiket. V jednej show Benny Hill predviedol ešte iný spôsob interpretácie pravdepodobnosti a štatistiky: "Pravdepodobnosť, že na palube lietadla bude bomba, je veľmi nízka. Pravdepodobnosť, že na palube lietadla budú bomby dve, je už úplne zanedbateľná. Cestujte bezpečne, prineste si do lietadla vlastnú bombu."

Kde je problém? Problém tkvie v tom, že pravdepodobnosť málo pravdepodobného úkazu bola odvodená zo štatistických údajov. Ak však zámerným konaním aktívne zmeníme stavovú premennú pre jednu udalosť, už nejde o štatistiku a pravdepodobnosť nebude blízka nule, ale dosiahne 100% pre onu jednu udalosť. Podobne, ako výstavba diaľnice na Žilinu, ktorú tam treba, lebo za Lučencom aj tak nič nie je. A vďaka Žiline ani nebude.

Niečo podobne humorné je možné čítať napríklad v tomto blogu, kde kovaný ekonóm odvodzuje zo štatistického pozorovania na vzorke N=1 poznanie, že diaľnica sa naozaj mala stavať na severe, lebo keď sa tam stane nehoda, tak je tam zápcha.

Inú smiešnu metódu použil jeden bývalý riaditeľ žilinskej dopravnej spoločnosti, keď tvrdil, že treba súrne začať s dostavbou tunela Branisko. Ak sa s výstavbou nezačne ihneď, hrozí jeho zahltenie. Potom vyšlo najavo, že extrapoloval skokový nárast intenzít z posledného roka po otvorení nových úsekov na žilinskej D1. Ako už vieme z jedného z minulých blogov na túto tému, intenzity majú dve komponenty. Tranzitnú a regionálnu dopravu. Tranzitná zložka sa zmení skokovo po každej zmene topológie dopravnej siete, keď sa zmenia preferencie vodičov. Lokálna zložka rastie pomaly a lineárne, úmerne ekonomickému rozvoju regiónu. Žilinskí dopravní experti na modely intenzít stále používajú metódu multiplikátorov, ktoré extrapolujú. Ešte aj potom, ako dotyčný zožal vážnu dávku hanby, pokračoval s tvrdeniami, že obchvat Košíc, Prešova a kompletné Branisko sú nevyhnutné. Týždeň nato bol odvolaný.

Ešte väčšia veselosť nastala, keď jeden inžinier ekonómie v televízii ukázal graf, kde po privatizácii za Dzurindu cena plynu stúpla dvojnásobne a za Fica náhle klesla na desatinu. To znamená, že privatizácia je zlá, Dzurinda zlý a Fico je dobrý. V skutočnosti podnik SPP zmenil fakturáciu z metrov kubických na výhrevnosť v kWh, čím klesla jednotková cena 10.6 krát, ale faktúra pri rovnakej spotrebe ostala rovnaká, lebo sa zároveň zmenil počet spotrebovaných jednotiek. Podsúvané závery sa stali legendou a onen graf vstúpil do dejín. Ministrovi prischla prezývka Kažigraf.

O niečo menej viditeľný problém s ekonometrickými modelom je v prípade porovnávania koeficientov v rovnici pre mieru nezamestnanosti, korelovanej s prítomnosťou diaľnice a priemerným vzdelaním v regióne. Na túto tému bolo urobených viac štúdií. Jedna veľmi seriózna je od dvoch ekonómov Národnej banky. Slabinou tej práce je, že študuje vzťah medzi diaľnicou a nezamestnanosťou, no nie s hospodárskym rozvojom. Ekonomický rozvoj je agregát, ktorý sa nedá vyjadriť jedinou premennou, kým nezamestnanosť je jednoduchá a dobre merateľná premenná. Nezamestnanosť a ekonomický rozvoj spolu súvisia, no úmera nie je priama. Priamo úmerné by boli vtedy, ak by všetky zamestnania vyžadovali rovnakú kvalifikáciu a neexistovala migrácia. V skutočnosti aj pri veľkej investícii do nejakého regiónu investor nebude vedieť upotrebiť všetkých miestnych nezamestnaných a bude potrebovať cezpoľných zamestnancov, lebo sa nemusia prekrývať požadovaná a disponibilná kvalifikácia. Citát z iného dobrého článku: Hovoriť o náraste či poklese regionálnych rozdielov len na základe jedného indikátora je trochu ako pre stromy nevidieť les.

Iná štúdia o vzťahu diaľnice a nezamestnanosti však ide ďalej. Hovorí o tom, že R2 vlastne ani netreba, lebo príspevok dobrej cesty k znižovaniu nezamestnanosti bude malý. Väčší vplyv bude mať "rómska politika". Vplyv totiž hlavne má agregovaná kvalifikácia. No jasne. Čo malo ruky nohy a bolo trochu súce, už všetko odišlo za prácou inam. Doma ostali len dôchodcovia a neschopáci. Stačí položiť rovnítko medzi množinu neschopáci a množinu Cigáni a máme na svete ďalšiu krívajúcu teóriu. Odvodzovať z nej "rómsku politiku", lebo je lacnejšia, ako výstavba rýchlostnej cesty, je rovnako uletené. Nezamestnanosť je len jedným aspektom rozvoja, či jeho absencie. Dostupnosť po ceste a železnici je nutnou, no nie postačujúcou podmienkou regionálneho rozvoja. Ak je región dobre dostupný, externí investori časom do podkapitalizovaného regiónu prídu. Ak však nie je dostupný, neprídu nikdy.

Práve kvôli takýmto uleteným záverom nie sú ekonometrické modely vhodné na tvorbu politiky. Stále sa nájde niekto, kto neodolá pokušeniu vyvodzovať zo štúdie závery, ktoré presahujú rozsah alebo vysvetľujúcu schopnosť modelu. A pekne sa popáli. Ako niekto môže na základe ekonometrických výpočtov doporučiť tretí pruh na Soroške a pri Bátke, keď také premenné do jeho ekonometrického modelu ani nevstupujú? Do inžinierskeho modelu je možné ich zakomponovať.

Až keď dajú rovnakú odpoveď ekonometrické a technicko-ekonomické inžinierske modely, až potom je možné uvažovať o konkrétnych opatreniach. V prípade regionálneho rozvoja je možným technicko-ekonomickým modelom napríklad metóda regionálnych clusterov. Tvorba ekonomického tkaniva je iteratívny proces s regionálnou komponentou, prichádza postupne a do dodávateľských vzťahov zapojí len susedný alebo blízky región. Blízky v zmysle dopravnej dostupnosti. A to je vysvetlenie, prečo Veľký Krtíš, Rimavská Sobota, Revúca, Rožňava nikdy nebudú poznať ekonomický rozmach, kým budú v takom dopravnom tieni, ako dnes. Aj keď sa nachádzajú na trase najkratšej a najlacnejšej cesty medzi Bratislavou a Košicami, ak by tam raz náhodou niekedy bola aj postavená.

Súvisiace blogy: tag diaľnice.

Článok je možné podporiť na vybrali.sme.sk.

  • Tlačiť
  • 46

Rubrika Ekonomika

Tagy diaľnice, doprava, energia

Listy z Ženevy

Listy z Ženevy
  • Počet článkov: 139
  • Priemerná čítanosť: 2688
  • Priemerná diskutovanosť: 22
  • RSS blogu

O blogu

Roman Kanala - fyzik, inžinier, ekonóm, žije a pôsobí v Ženeve.

Listy z Ženevy

Listy z Ženevy
  • Počet článkov: 139
  • Priemerná čítanosť: 2688
  • Priemerná diskutovanosť: 22
  • RSS blogu

O blogu

Roman Kanala - fyzik, inžinier, ekonóm, žije a pôsobí v Ženeve.

Kalendár sa načítava...