neděle 22. dubna 2012

Skutečný kámen mudrců

Legendární kámen mudrců byl vysněným cílem středověkých alchymistů. Měl produkovat elixír života a být schopen transmutace neušlechtilých prvků na zlato. Nebyl nikdy objeven a i kdyby existovat mohl a byl vyroben, znamenal by okamžitou devalvaci zlata na cenu konvergující k nule a k poklesu kvality lidského života tímtéž směrem.

Skutečný kámen mudrců byl však objeven v roce 1809 a od té doby je využíván ve vědě neustále. Nedělá nic tak banálního jako je výroba zlata, i když už se významně podepsal na délce života všech, kdo čtou tento článek a víceméně celého lidstva. Ale nejedná se o žádnou magickou substanci, nýbrž o koncept popisující realitu takovým způsobem, jež jediný umožňuje realitu skutečně měřit, chápat a předvídat - i když ne tak, jak by se většině lidí líbilo.
Pohleďte na bez nadsázky jeden z nejvýznamnějších objevů v historii lidstva.


Ano, je to Gaussova křivka. Statistický koncept, jehož explanační síla a vliv jsou takové, že bez jejího pochopení je prakticky nemožné chápat moderní vědu. Bez jeho pochopení není možné chápat nic, co stojí za pochopení. Bez jeho pochopení realita prostě nedává smysl. A bez jeho pochopení není možné chápat tento blog a vůbec většinu toho, co říkám a to zdůrazňuji.

Setkal jsem se už s celou řadou lidí, kteří si myslí, že "chápou statistiku", včetně Gaussovy křivky, a pak z nich stejně vypadla nějaká perla blbosti dokazující přesný opak. Jsou mezi mými známými, jsou mezi mými kolegy v práci, jsou dokonce i mezi mými nadřízenými tamtéž, jsou na internetu, jsou všude. Jsou i na tomto blogu, jak je evidentní z některých komentářů, a tudíž asi vznik tohoto článku je poněkud opožděný. Respektive tímto článkem a články navazujícími, jsem měl začít.

Nejprve se podívejme, co ten obrázek vlastně říká. Jedná s o lineární graf, kde na ose y je procentuální zastoupení nějaké vlastnosti vynesené na ose x. Plocha tohoto grafu pod křivkou pak dá dohromady 100%. Byla-li by tedy například na ose x výška stromu v lese a tento graf by popisoval výšku stromů v lese v metrech, pak by to znamenalo, že v dotyčném lese je 2,66% stromů s výškou 50m, 2,65% stromů o metr vyšších a 2,65% metrů o metr nižších atd atp.

Stromy samozřejmě nemají výšky v diskrétních metrech, takže jsme-li spokojeni s výškami zaokrouhlenými na celé metry, můžeme místo lineárního grafu použít graf sloupcový, kde výška jednotlivých sloupců ukazuje zastoupení jednotlivých výšek.


To je ovšem trochu nepraktické a nepřehledné, v praxi se většinou rozděluje na co nejméně kategorií, podle potřeby, většinou 3-5. Chilli nějak takto.

Tomuto grafu se říká histogram. Obsahuje tytéž informace, co předchozí grafy, akorát s hrubším rozlišením, ale to je principielně jediný rozdíl oproti prvnímu grafu. Každý sloupec zde svou výškou odpovídá ploše pod křivkou grafu pro daný interval v prvním obrázku.

A proč považuji tento poznatek za tak strašně důležitý? Protože bez něj skutečně nelze vědět a chápat nic a protože je úplně všude. Neexistuje oblast, v níž by se Gaussovo normální distribuce vlastností nebo nějaká její derivace neprojevila, a odpovídá na velmi dlouhou řadu "proč". Uveďme jen pár příkladů.

Ve vědě:
  • Proč to, že nevíme všechno, neznamená, že nevíme nic.
  • Proč nemožnost něco předvídat na úrovni prvků neznamená, že nelze předvídat chování celku.
  • Proč evoluce může fungovat na mikro i makro úrovni.
  • Proč nic nelze změřit úplně přesně, a přesto lze odvodit přesné závěry.
  • Proč se někdy nadějný objev ukáže jako chyba.
  • Proč je někdy důležitý objev přehlédnut.
  • Proč skutečný vědecký poznatek musí být v principu falsifikovatelný.
  • Proč věda nefunguje na základě snahy něco potvrdit, ale vyvrátit. 
  • Proč minulé neúspěchy a omyly vědy nejsou argumentem proti platnosti moderních poznatků.
  • Proč i nejmodernější vědecké poznatky nejsou dokonalé a obsahují míru chyby.
V lékařství:
  • Proč kouření není zdravé, i když něčí dědeček hulil jak fabrika a dožil se stovky.
  • Proč neexistují absolutně bezpečné léky a vakcíny a přesto je projev blbosti odmítat a priori jedno a/nebo druhé.
  • Proč neexistuje žádný univerzální lék na všechno, dokonce ani na něco ne.
  • Proč nexistuje žádný zaručený recept na dlouhověkost či zdravé zuby.
  • Proč i sebelepší léčba/lékař někdy selže.
  • Proč i sebehorší nemoc někdy skončí dobře.
  • Proč i banální operace může skončit tragicky.
  • Proč alternativní medicína je obecně nebezpečné bunkum, i když občas někomu "funguje".
  • Proč domácí porody a jejich propagace jsou projevem mdlého rozumu.
V průmyslu:
  • Proč něco takového jako nulová zmetkovitost neexistuje.
  • Proč něco takového, jako absolutní přesnost neexistuje a jakákoliv přsnost je funkcí stanovených tolerancí.
  • Proč i když všechny součástky jsou v pořádku, jejich komplet může být zmetek.
  • Proč počítání norem podle nejlepšího pracovníka vede k nespokojenosti.
  • Proč počítat systematicky termíny podle 100% výrobní kapacity skončí fiaskem.
  • Proč diskriminace na základě rasy/pohlaví je kontraproduktivní i v případech, kdy je mezi pohlavími/rasami měřitelný rozdíl.
V politice:
  • Proč politická strana se skutečně rozumným programem nemá v demokracii prakticky šanci.
  • Proč vyhraněné politické názory a programy dlouhodobě vždy napáchají škodu.

V argumentaci a logice:
  • Proč je "a dicto simpliciter" logickým klamem.
  • Proč jsou "post hoc ergo propter hoc" a "cum hoc ergo propter hoc" logické klamy.
  • Proč sebelepší argument nepřesvědčí každého.
  • Proč vždy někdo bude věřit i úplným blbostem.
V psychologii:
  • Proč i inteligentní lidé mohou zastávat úplně pitomé názory.
  • Proč je koncept IQ problematický.
V každodenním životě:
  • Proč stejné šance neznamenají stejný úspěch.
  • Proč neúspěch není automaticky známkou neschopnosti - a naopak.
  • Proč "podle sebe, soudím tebe" přístup k lidem je krajně pitomý.
I následující přísloví naznačují, že na určité úrovni byl tento koncept obsažen i v lidové moudrosti:
  • Jedna vlaštovka jaro nedělá.
  • I mistr tesař se utne.
  • Dvakrát měř, jednou řež.
  • Není na světě člověk ten, jež zavděčil by se lidem všem.
  • Výjimka potvrzuje pravidlo.
 Zkuste se zamyslet nad jedním každým proč. Byl jsem stručný, a přesto je jich celkem slušná řádka. V příštím článku zkusím vysvětlit princip, proč všechna tato proč vysvětluje právě Gaussova křivka.

    3 komentáře:

    1. Původně jsem chtěla psát soukromě, ale říkám si, že má možná více lidí podobný problém jako já, takže to bude lepší napsat sem. Chápu článek až do okamžiku, když se dostáváš k tomu, co všechno normální rozdělení vysvětluje - tam už mi nedává smysl, proč to tak je (přemýšlela jsem o tom dlouho a nastudovala si lépe statistiku, ale téhle části prostě pořád nerozumím).
      Pokud to umíš nějak lépe vysvětlit, budu vděčná - připadá mi to celkem důležité. A zajímavé.

      OdpovědětVymazat
    2. To je právě ten důvod, proč jsem napsal druhý článek na toto téma a proč mám v úmyslu pokračovat dalšími články, které by měly všechna ta "proč" odpovědět detailněji. Problém je, že to je opravdu hodně informaci, které musím přežvýkat, promyslet, přepočítat, sepsat, zkontrolovat.

      Tento článek neměl ani za úkol všechna ta proč vysvětlit, jen upozornit na to, jak široce je ve vědě i v každodenním životě vidět vliv Gaussovy křivky.

      OdpovědětVymazat