Štatistické paradoxy

Autor: Pavol Zlacký | 29.10.2014 o 9:17 | (upravené 29.10.2014 o 23:13) Karma článku: 6,10 | Prečítané:  1851x

"V časoch, keď miera nezamestnanosti dosahuje 13 %, príjmy poklesli o 5 % a počet samovrážd stúpa, strašne ma vie rozčúliť to, že vláda míňa peniaze na veci ako zbieranie štatistík." Snáď najznámejší súčasný popularizátor štatistiky a vizualizácie dát, Hans Rosling, takto začína jedno zo svojich videí.

Z neho vám odporúčam túto pasáž a ak vás zaujme, viac jeho vystúpení nájdete napr. tuto.

O tom, že štatistika nemusí byť nuda sa matematikárom na našich školách presviedčať svojich žiakov veľmi nedarí. V tomto článku to skúsim ja.

 

Simpson's paradox

V USA medzi rokmi 1980 a 2005 stúpol mediánový príjem nasledovne:

  • u mužov belochov o 15%
  • u ostatných mužov o 16%
  • u žien belošiek o 75%
  • u ostatných žien o 62%

Na základe tohto, o koľko si myslíte, že stúpol mediánový príjem v rámci celej populácie? Odhadom o nejakých 40 %? Z týchto čísel sa to nedá presne určiť, ale asi to bude niečo medzi 20 a 60 percentami, že?

Nie. Odpoveď je len 3 %. Nuž, toto je efekt tzv. Simpsonovho paradoxu. Vysvetlenie nájdete napr. v článku Stevena Landsburga. V skratke ide o to, že v roku 2005 tvorili tie menej zarábajúce skupiny väčšiu časť zo všetkých pracovníkov než v roku 1980. Takže so štatistikami opatrne. 

 

Two envelopes paradox (paradox dvoch obálok)

Položím pred vás 2 napohľad rovnaké obálky – obálku A a obálku B. V jednej z nich je dvakrát viac peňazí než v tej druhej. Ktorú by ste si vybrali? Obálku A alebo B?

Poviete si, že to je jedno a vyberiete si, povedzme, obálku A. Ak je v nej 100 eur, tak v obálke B je s 50% pravdepodobnosťou 50 eur a s 50% pravdepodobnosťou 200 eur. To znamená, že stredná hodnota sumy v obálke B je 50*0,5 + 200*0,5 = 125 eur.

Nechcete si vašu pôvodnú voľbu rozmyslieť?

 

Birthday paradox

Predstavte si skupinu 367 ľudí. Aká je pravdepodobnosť, že aspoň dvaja z nich majú narodeniny v rovnaký deň? Easy, 100 %. Podobne, aká by bola pravdepodobnosť, ak by išlo o skupinku 2 ľudí? Odpoveď: Približne 0,3 % (zhruba 1/365). Potiaľto alles klar.

Skúste si teraz tipnúť, (1) aká veľká musí byť skupinka, aby pravdepodobnosť (že aspoň dvaja ľudia majú narodeniny v rovnaký deň) dosiahla 50 %. A (2) koľko ľudí musí byť v našej skupine pre pravdepodobnosť 99,9%?

Kto túto hádanku vidí prvýkrát, bude zrejme prekvapený. Odpoveď na 1. otázku je len 23 ľudí, na 2. otázku len 70 ľudí. Pekne je to vidieť na grafe.

 

Boy or Girl paradox

a) Existuje rodina s dvoma deťmi a vy viete, že aspoň jedno z nich je dievča, no neviete si spomenúť, či ďalšie z detí je dievča alebo chlapec. Aká je pravdepodobnosť, že obe deti sú dievčatá?

b) Existuje rodina s dvoma deťmi a vy viete, že aspoň jedno z nich je dievča menom Táňa, no neviete si spomenúť, či ďalšie z detí je dievča alebo chlapec. Aká je pravdepodobnosť, že obe deti sú dievčatá?

Skúste si zapísať vaše tipy. (Uvažujeme, že pravdepodobnosť narodenia chlapca a dievčaťa je zhodná = 50 %)
...

Odpovede na tieto dve otázky nie sú rovnaké. Skúsite sa zamyslieť ešte raz nad správnym riešením?

Nechcem pokaziť pekný hlavolam okamžitým prezradením riešenia. Ale pripájam aspoň odpoveď (skrytú bielym fontom):
a) 1/3
b) 1/2
Riešenie doplním neskôr.

Riešenie (doplnené):

a) Chlapcov označíme B, dievčatá G. V rodine s 2 deťmi mohli nastať 4 rovnako pravdepodobné prípady: Narodil sa im (i) starší syn a mladšia dcéra, (ii) staršia dcéra a mladší syn, (iii) dve dcéry alebo (iv) dvaja synovia. Teda BG, GB, GG, BB. Možnosť BB môžeme zjavne vylúčiť a zo zvyšných 3 prípadov má rodina dve dievčatá práve v jednom -> p=1/3.

b) Podobnou logikou ako v prvej časti úlohy si vypíšeme prípustné možnosti. TB, TG, BT, GT, TT. Dve Táne je možnosť matematicky málo pravdepodobná a na Slovensku dokonca legislatívne zakázaná. Zo zvyšných 4 prípadov má rodina dve dievčatá práve v dvoch -> p=1/2.

 

Apportionment paradox

V roku 2016 sa na Slovensku budú konať parlamentné voľby. Volebná miestnosť je ďaleko, vonku je škaredo. Ak by ste sa volieb nezúčastnili, vami preferovaná strana by získala, povedzme, 20 kresiel v parlamente. Vy sa ale prekonáte a idete im dať svoj hlas. A tento jeden hlas rozhodne o tom, že strana nezíska 20, ale len 19 mandátov.

Nezmysel? Nie. (Nielen) v slovenskom volebnom systéme je takáto situácia možná. Ak stále neveríte, Vladimír Dančišin o tom napísal článok, ktorý vás presvedčí.

Prvý známy prípad tohto paradoxu dostal pomenovanie Alabama paradox. V roku 1880 sa prišlo na to, že ak by Snemovňa reprezentantov mala 299 kresiel, štátu Alabama by pripadlo 8 z nich. Ak by sa však prerozdeľovalo 300 kresiel, Alabame by pripadlo len 7.

 

Podobných paradoxov/hádaniek existuje ešte viacero. Aby však článok nebol príliš dlhý, tak môžete skúsiť napr. tuto a ešte tuto.

A keď už sme pri štatistike, niekoľko z mojich obľúbených grafov môžete nájsť tuto.

Páčil sa Vám tento článok? Pridajte si blogera medzi obľúbených a my Vám pošleme email keď napíše ďalší článok
Pridaj k obľúbeným

Hlavné správy

EKONOMIKA

Technic sa nedá naučiť. Ako sa učiteľ stal dizajnérom Lega

Nevyštudoval techniku ani dizajn. Napriek tomu sa stal jedným z jedenástich dizajnérov Lego Technic. Len vďaka tomu, že si rád z lega skladal veci, na ktoré nemal návod.

SVET

Výbuchy po futbalovom zápase v Istanbule zabili 29 ľudí

K explóziám došlo hodinu po zápase medzi Besiktasom a Bursasporom.

DOMOV

Smer chce byť politicky nekorektný aj robiť poriadky v osadách

Novými podpredsedami sú Blanár a Žiga.


Už ste čítali?