Hic est Charly.: Statistika nuda je

Zobrazují se příspěvky se štítkemStatistika nuda je. Zobrazit všechny příspěvky

neděle 20. července 2014

Experimenten statistikoš - část 2

Po více než měsíci prakticky non-stop fyzické práce a absolutně minimalistického používání počítače jsem se rozhodl jeden víkend hodit na všechno bobek a nářadí jsem nechal odpočinout, zaslouží si to. Stejně bylo takové horko, že se nic dělat nedalo. Takže jsem mohl věnovat nějakou tu hodinku dalšímu vyhodnocení svého statistického experimentu. Konkrétně druhé části své předpovědi:

Rozdělím-li řady na kratší, stejně dlouhé úseky, řekněme 5-10 čísel dlouhé, budou tyto úseky samy o sobě poměrně dobře odpovídat tomu, co by bylo k očekávání od skutečně náhodného systému. Jejich celková distribuce ale bude více uniformní, než by tomu bylo u skutečně náhodného systému.

Nejprve je třeba upozornit na to, že je při absolutně doslovné interpretaci je to nesmysl, což jsem si uvědomil až dodatečně, když už bylo pozdě to reformulovat. Za prvé předpověď první se vylučuje s doslovnou interpretací této druhé předpovědi v případě, že by byla správná (což byla). Za druhé je omezený počet kombinací nul a jedniček, a žádné kombinace obsažené v číselných řadách jakýmkoliv způsobem nemohou nebýt možné v řadě generované náhodně. Takže, ačkoliv se mi to moc nelíbí, musím přiznat chybu a nejdříve trochu vysvětlit, co jsem myslel tím, co jsem napsal.
Měl jsem na mysli, že tvar distribuce u pěti - desetimístných řad bude přibližně stejný, jako u očekávaná distribuce u skutečně náhodných řad, ale "konce" této distribuce budou trochu přizvednuté a vrchol trochu nižší (současně v návaznosti na první předpověď je nevyhnutelné, že vrchol této distribuce bude trochu vystředěný oproti ideálu, což jsem si původně neuvědomil vůbec). Čili že budou správně převažovat řady oscilující kolem středu, ale řady na extrémech budou více než je zdrávo. Nejlépe to asi vysvětlí příklad.

Červená čára zobrazuje ideální distribuci sledované veličiny. V tomto případě jaké by bylo zastoupení pětimístných řad obsahujících 0 až 5 jedniček v nekonečně dlouhé řadě náhodně generovaných čísel. Histogram zobrazuje jejich zastoupení v jedné řadě dodané čtenáři. Toto jsem tak nějak očekával. Ovšem toto není to, co jsem obdržel.

To je opět nejlépe zobrazeno obrázkem, tentokráte větším:

Zde už je vidět, že mému očekávání jakžtakž odpovídaly jenom tři z devíti dodaných řad (Řady 4, 5, 7). Zbývající vykazují poněkud slabší odchylky, než jsem očekával. Až na řadu 1 všechny vykazují zátěž k více jedničkám, jinak ale nic extra. Pro vizuální srovnání jeden diagram skutečně (pseudo)náhodné řady.

I když se jednalo o řady značně dlouhé, nemohu s klidným svědomím bez statistického testu a počítání p-hodnoty říci na základě pouhého "kouknu a vidím", zda se tyto distribuce značně významně liší od ideální binominální distribuce. Doma postrádám potřebný software a nemám tolik času se s tím pižlat ručně. Mírná zatíženost směrem k jedničkám ovšem statisticky významná je, to vyplynulo už z prvního vyhodnocení.

Teď jak to vypadá u desetimístných řad:

Víceméně by se k tomu dalo říci totéž, co k řadám pětimístným.

Závěrem by se tedy dalo na základě dostupných dat říci, že má předpověď platí pro přibližně polovinu lidí, ale polovina lidí vygenerovala poměrně věrohodné vzorce náhodných pětimístných řad. Věrohodné z pozice této jedné veličiny. Zda skutečně odpovídala alespoň nějaká ta řada tomu, co by se dalo očekávat od skutečně náhodného systému definitivně rozlousknu (snad) někdy příště.

pátek 13. června 2014

Experimenten statistikoš - část 1

Bouchněmež společně šampus. Konečně jsem se dostal k tomu, abych se alespoň trochu mohl podívat na statistický experiment, k němuž mi někteří z vás v loni mlaskavě dodali data.

Nejprve kratililinká rekapitulace:
Před více než rokem jsem ve článku "Sháním morčata" požádal čtenáře o spolupráci. Sedm se jich přihlásilo a společně mi opatřili devět číselných řad podle zadání, zaslaného mailem. O pár měsíců později jsem sběr dat definitivně ukončil a učinil určité předpovědi ve článku "Náhoda je vůl".

Dnes se budu věnovat první předpovědi, totiž této:

Takto získané řady čísel budou vykazovat významnou zátěž jedním směrem, k jedničkám či nulám.

Pokusné řady, jež jsem obdržel, si vedly v sumáři jak můžete vidět na přiložené minitabulce. Samozřejmě pokud nejste skutečně enormně talentovaný matematik, tak vám tato čísla sama osobě řeknou totéž, co mě. Všechny řady se liší od ideálního stavu 500 jedniček a 500 nul, ale jak moc je tato odchylka významná? Na první pohled to nevypadá až tak hrozně a analýza "kouknu a vidím" toho moc neřekne. Na první pohled, přiznám se bez mučení, jsem si už myslel, že moje první předpověď padla.

Ovšem statistika už nám říká něco jiného a pro názornost jsem výsledky vizualizoval. Černá, šrafovaná křivka zobrazuje jakou distribuci v počtu jedniček (nebo nul, to je phuck) by mělo nekonečno náhodných řad jedniček a nul, dlouhých tisíc čísel. Dlouhodobí čtenáři blogu by měli zpozornět, protože v tom grafu vidí Gaussovu křivku normálního roznložení, o níž už jsem psal. To je správně, ovšem Gaussova křivka to není. Zde vyobrazená distribuce není normální, nýbrž binomická, což je ovšem na této úrovni už jedno, liší se od distribuce normální tak málo, že to nestojí za řeč (toto je velmi důležitý statistický poznatek, k němuž se ještě vrátím - prozatím nechť vám to vrtá hlavou). Červeně označená plocha zahrnuje 95%, což je (není-li důvod pro něco jiného) považováno obecně za hranici, při níž jest vhodné minimálně zpozornět. Modré trojúhelníčky zobrazují, jak si vedly čtenáři dodané "náhodné" řady.

Zde už je zcela jasně vidět, že čtyři z devíti řad se pohybovaly mimo interval 95%, dvě dokonce jsou už v oblastech, kde je pravděpodobnost generování takové řady skutečně náhodně pro všechny praktické účely nula (byť má určitou teoretickou, spočitatelnou hodnotu) a pouze dvě se jakžtakž blíží středu. Pravděpodobnost, že 44% z náhodně generovaných řad bude mimo 95% interval je 0,06%.

Takže závěrem lze říct, že tato předpověď byla potvrzena - lidmi vygenerované řady jedniček a nul obecně vykazují tendenci preferovat jedno nebo druhé číslo.

pondělí 10. března 2014

Svoboda smradu

Když jsem minule psal o zákazu kouření v restauracích, pokusil jsem se vysvětlit rozdíl mezi svobodou legislativní a svobodou reálnou. Svoboda není jenom to, co nám vláda dovolí či nedovolí dělat. Svoboda je to, co v rámci socioekonomického kontextu dané společnosti jedinci reálně dělat mohou. A v tomto ohledu je nevyhnutelně vždy určitým způsobem omezená. Například v hypotetické zemi absolutně bez zákazů a bez regulací legálnosti držení atomových zbraní stejně naprostá většina lidí nebude mít tuto svobodu v reálu, v důsledku obrovských pořizovacích nákladů těchto zbraní. Takže i kdyby tato svoboda byla pro všechny "na papíře" v reálu by byla pouze pro ultrabohaté oligarchy.

Reálné omezení svobody je v případě zákazu/nezákazu kouření v restauracích jenom jedno: určité procento lidí bude postaveno před volbu - buď vstoupit do restaurace a snášet určité nepohodlí, nebo nevstoupit do restaurace. Není podstatné, je-li tato volba na lidi uvalena legislativně nebo jinak. Zdánlivou kontroverzi ohledně zákazu kouření v restauracích a z něj plynoucí redukce svobody je možné tedy vyjádřit jedním číslem.

Procento lidí, kteří budou stát před touto volbou, lze vypočítat podle následujícího jednoduchého vztahu (aspoň doufám, vymyslel jsem to v autě cestou z práce a chybu jsem ještě nenašel):
z=x*(1-y)+y*(1-x)

Kde x je procento kuřáků v populaci, y je procento kuřáckých restaurací a z oni omezení na svobodě.

Vzniklé závislosti je možné vyjádřit tabulkou:

V tabulce jsem označil sloupec, který je relevantní pro aktuální stav v ČR, kde je přibližně 30% kuřáků. Jak vidíte, procento lidí s reálným omezením svobody za tohoto stavu lineárně roste od 30% při totálním zákazu (omezováni jsou pouze kuřáci), až po 70%, (omezováni jsou jenom nekuřáci).

Za tohoto stavu věcí skutečně nelze argumentovat tím, že zákaz kouření v restauracích zredukuje svobodu občanů ČR. Zredukuje co je dovoleno na papíře, to ano. Ale nezredukuje to reálné volby lidí v kontextu společnosti - naopak, ty to rozšíří.

A to je jenom chladná řeč čísel, přičemž tato kalkulace počítá s tím, že ono jedno omezení svobody je symetrické, tzn je stejné z pohledu kuřáka před nekuřáckou restaurací a vice versa. Což není pravda. Zatímco kouření kuřáků škodí nekuřákům v restauracích, nekouření nekuřáků neškodí nikomu.

Tento vliv už bohužel nijak jednoduše kvantifikovat nelze. Lze sice zjistit, že kouření lidem zkracuje život o ca 15%, ale nenapadá mne, žádný způsob, jak to zohlednit v tomto výpočtu vezmu-li v potaz to, že uznávám právo jedince si škodit, když se domnívá, že mu to za to stojí

Ne, že by to podle mého bylo potřeba pro pochopení. Doufám.

A doufám i že se naši politici konečně rozhoupou k něčemu užitečnému a onen zákon prosadí.

sobota 22. června 2013

Náhoda je vůl

Někdy v budoucnu se vrhnu nikoliv z okna, ale na vyhodnocení svého blobového experimentu. A když už si hraju na vědátora, udělám to pořádně. Tzn. ještě před tím, než se podívám na sebraná data a začnu s nimi dělat nějaká vyhodnocení, formuluji hypotézu, již chci testovat, a předpověď, jíž by měla data podle této hypotézy odpovídat. A pak se podíváme, zda data hypotézu falzifikují či nikoliv.

Nejprve hypotéza:

Lidé obecně, a to většinou bez ohledu na vzdělání a inteligenci, jsou tak maximálně ještě dobří v posuzování krátkých sledů náhod, ale nejsou schopni správně posuzovat náhodnosti rozsáhlé či dlouhodobé trendy.

Zadání, jež jsem rozeslal pokusným morčatům:

Potřebuji od Vás řadu dlouhou tisíc čísel - náhodně na střídačku jedniček a nul. Napsaných z hlavy za sebou, nejlépe v jednom sloupci excelové tabulky, ale klidně i jednoduše řada čísel napsaná v notepadu, tak jak vás náhodně napadnou. Zdůrazňuji - tak, jak vás napadnou, když se pokusíte ta náhodná čísla vygenerovat z hlavy, žádné dlouhé dumání, prostě jen nadatlujte náhodnou řadu jedniček a nul. Bez použití pomůcek pro generování skutečně náhodných řad čísel.

Předpověď, jak data budou přibližně vypadat. Pokud tak vypadat nebudou, bude hypotéza falzifikována a budu muset formulovat jinou, možná drasticky:

Takto získané řady čísel budou vykazovat významnou zátěž jedním směrem, k jedničkám či nulám.
Rozdělím-li řady na kratší, stejně dlouhé úseky, řekněme 5-10 čísel dlouhé, budou tyto úseky samy o sobě poměrně dobře odpovídat tomu, co by bylo k očekávání od skutečně náhodného systému. Jejich celková distribuce ale bude více uniformní, než by tomu bylo u skutečně náhodného systému.
Rozdělím-li tyto řady na delší stejně dlouhé úseky, nad 20 čísel, už ani tyto úseky samy o sobě nebudou odpovídat tomu, co by se dalo čekat od náhodného systému. a jejich distribuce se bude hodně lišit od té u skutečně náhodného systému.
Rozdělím-li tyto řady na úseky vždy jenom stejných čísel jdoucí za sebou, nebude délka a distribuce těchto úseků odpovídat tomu, co by se dalo čekat od náhodného systému.

Očekávám, že ať budou výsledky jakékoliv, umožní mi demonstrovat důvody, proč lidé tak často podléhají některým chybám v úvaze a některým logickým klamům.

Všem, kdo se přihlásili do experimentu a dodali data děkuji. Nešel jsem do toho s přehnanými představami, už dávno vím, že kritizovat - mnohdy bez dat - je připravený kdekdo, ale pomoci málokdo. O to více si toho cením.

pátek 7. prosince 2012

Sebevražda rozumu

Takže tři lidé spáchali společně sebevraždu, přičemž se na tom předtím domluvili na internetu. Je těžké takovým případům zabránit, takže je nesmyslné vinit společnost a vůbec kohokoliv. Když se někdo rozhodne spáchat nedemonstrativní sebevraždu, většinou se mu to povede.

Nicméně já nechci psát o této tragédii, víceméně k tomu není co říct. Rád bych se ale vyjádřil k vedoucím komentářům - a to oběma.

Je smutné, že jeden dostal tolik plusů a druhý tolik mínusů. Oba by měly dostat jenom mínusy, protože oba jsou stejně pitomé. Vlastně jsou oba stejné, protože oba vycházejí ze stejné argumentační chyby.

V argumentaci a logice se tomuto logickému klamu říká "ad hoc argumentace". Tento logický klam jsem už několikrát zmínil, ale ještě nemá svůj vlastní článek. Jedná se o spěšné a účelové napasovávání interpretace náhodných faktů tak, aby odpovídala předem zastávanému názoru, přičemž logika jde stranou. Je to hodně často logickým klamem samoaplikovaným - tzn. lidé se tímto způsobem nesnaží až tak často vyhrát debaty či přesvědčit ostatní, ale používají jej k posilování a udržování vlastních názorů, předsudků a podujatostí.

V psychologii je pro toto chování, vůči němuž jsme náchylní více nebo méně úplně všichni (do určité míry je to zřejmě důsledkem heuristických zkratek, jež lidský mozek používá), odborný název "racionalizace". Je poměrně snadné a zároveň nebezpečné tomu podlehnout, protože zejména inteligentní lidé pak mohou být extrémně dobří v hledání výmluv pro všechno možné a dokáží pak tvrdohlavě přímo aktivně přehlížet i do očí bijící fakta jako expert. Tímto způsobem se rodí a udržují při životě nejrůznější konspirační teorie a i právě už vícekráte cupované alternativní medicíny a podobné ptákoviny. Takto vznikají sebevědomí laici.

To, že článek samotný o důvodech sebevraždy oněch tří nešťastníků nic neříká, je silným indikátorem toho, že se v obou případech jedná právě o ad hoc racionalizace komentátorů. Mají prostě nějaký názor a (vhodná) fakta jsou interpretována tak, aby tomuto názoru zdánlivě dodávala váhu. Je ovšem vhodné před vypuštěním nějakého komentáře na internet použít google a podívat se, co na to širší realita. A ta říká, že sebevraždy u nás prakticky konstantně klesají od roku 1970, s trendem prakticky nepřerušeným změnou režimu v roce 1989. Bohužel nemohu najít číselná data pro graf, takže nemohu říct zda nárůst za posledních pár let je statisticky významný nebo zda se jedná o pouhou normální fluktuaci dat vzhledem k nastavenému trendu (který bude zřejmě limitně se blížící nule). Odhadem podle grafu bych si tipl, že to druhé je pravdou. Každopádně ne, globálně viděno komunisté nepřiváděli lidi nijak abnormálně k sebevraždám, a ani současný režim tak nečiní. Nepochybně jsou a byli a za jakéhokoliv režimu budou jedinci tím kterým režimem k sebevraždě dohnáni, ale obecně viděno dnes žijeme z tohoto hlediska v bezprecedentně skvělé době, kdy lidé sebevraždy až tak moc nepáchají.

Ne že by případná korelace dodávala váhu argumentu, korelace sama o sobě nic moc neříká. Ale vypustit nějaký rádoby argument, který není podložen ani korelací dat s postulovaným závěrem, není ničí dobrou vizitkou.

pátek 23. listopadu 2012

Sním, či bdím? To je Bob Dylema!

Začněme slovní úlohou pro první stupeň základní školy. Máte pytlík se sto kuličkami, smíchané hliněnky a skleněnky. Vyndáte dvacet kuliček a z nich bude šest skleněnek a čtrnáct hliněnek. Vyndáte dalších deset a z těch jsou tři skleněnky a sedm hliněnek. Kolik je na základě tohoto možné odhadnout, že je tam hliněnek a kolik skleněnek?

Pokud je vaše odpověď sedmdesát hliněnek a třicet skleněnek tak je špatně. Správná odpověď, alespoň podle logiky našich úředníků a legislativců, je totiž stočtyřicet hliněnek a šedesát skleněnek. Nedělejte si hlavu s tím, že vám najednou vyšlo celkem dvakrát více kuliček, než kolik jich pytlík obsahoval, protože věci se při počítání nejspíš ode dneška oficiálně množí. Alespoň tak mi to připadá, nejsem si tak docela jist, že jsem pochopil logiku za touto úvahou. Při čtení článku Sčítat, nebo zprůměrovat? Odečet hlasů neúspěšným kandidátům budí dohady mi, přiznávám bez mučení, chvilku prokluzovala kolečka, když jsem se pokoušel pochopit, co za příšerný matematický oříšek se to snaží chudáčci úředníčci a politici rozluštit.

Samozřejmě se má procentuální chybovost dvou náhodně vybraných vzorků zprůměrovat, a ne sečíst. Bylo by možné ovšem i spočítat přibližnou relativní chybovost podílem sumy absolutních chyb obou vzorků a jejich sumy velikosti obou vzorků. Oba výpočty vedou ke stejnému výsledku. Ale sečíst relativní chybovost dvou náhodně vybraných vzorků a aplikovat ji pak na celý vzorek? Ne, to opravdu nejde, a opravdu to je nemám slov.

Nejvíce mne na tomhle ale fascinuje to objevování Ameriky v naší prezidentské kampani, nad nímž jsem se nezávisle na tomto už podivoval dnes ráno, když jsem si četl, jak se ověřuje platnost podpisů. Definujme nejprve řešený problém:

Máme množinu X. Potřebujeme s co nejmenším množstvím námahy zjistit, kolik prvků množiny má vlastnost A a kolik má vlastnost B. Množina X je tak velká, že ji nelze zkontrolovat celou, jaké tedy máme možnosti?

Bývaly doby, kdy pro rozlousknutí tohoto problému bylo nutné vykonat hodně práce a popsat hodně papíru výpočty. Dnes ovšem už nic takového není nutné. Nejprve se podívejme, jak to řešili naši páni legislativci:

Ze zbývajícího počtu vzali 8500 náhodně vybraných jmen a ručně se kontrolovala pravost údajů či jejich duplicita ...

Pokud byla chybovost menší než tři procenta, odečetl se výsledek od počtu jmen a kontrola skončila. To se však žádnému z kandidátů nestalo. V případě, kdy byla chybovost větší, se vzalo dalších 8500 jmen. Chybovost se na konci kontroly sečetla a příslušné procento se z celkového počtu odečetlo.

Zajímavý přístup. Takže ze vzorků různých velikostí se braly vzorky stejné velikosti, z toho se následně spočítala chybovost, a když překročila určitou hladinu, tak se vzal znovu vzorek stejné velikosti a to celé se zopakovalo. I když pomineme ten matematický kotrmelec na konci, tak je to příšerná ptákovina, z níž mě brní hlava.

První problém samozřejmě je, že kandidáti na prezidenta nasbírali různě velké množství podpisů. Pro kontrolu na stejnou úroveň statistické jistoty je neefektivní brát vždy fixní vzorek. U kandidátů, kteří měli méně podpisů, to může znamenat, že kontrolujete zbytečně důkladně a vynakládáte námahu na něco, co lze zjistit mnohem snáze. U kandidátů, kteří měli hodně podpisů naopak může znamenat, že kontrolujete nedostatečně důkladně a zvyšujete možnost statistické chyby a skutečné množství chyb zásadně pře/podhodnotíte.

Rozlousknout oříšek, kolik je tedy třeba jednotlivým kandidátům zkontrolovat hlasů, abychom si byli na (například) 99% jisti, že jsme je vyhodnotili správně, není matematicky žádná legrace. Je na to potřeba skutečný statistik, a ne jenom amatérský nadšenec jako já. Nicméně nepochybuji, že takovíto statistici u nás existují, a není jich málo, a jsou i mezi státními úředníky. Jak to vím? Nevím, předpokládám to na základě skutečnosti, že tzv. princip AQL je v průmyslu používán nejméně deset let, bylo k němu napsáno v rámci EU tři pihele papíru a existuje na toto téma celá řada norem, obsahujících i hezké tabulky a obrázky, jež vysvětlují, jak velký vzorek je potřeba vzít z jak velké populace, abychom měli použitelný výsledek. A tyto normy byly přeloženy i do češtiny, českými úředníky. A i když není možné tyto tabulky použít přímo pro volbu prezidenta, tak skýtají dobrý výchozí bod pro to, jak se tyto věci mají dělat.

No a samozřejmě dnes existují různé komerční programy designované specificky za účelem počítání statistických veličin, některé drahé, některé levnější, některé skýtají dokonce zkušební verzi zdarma.

A je ostudou celého našeho státu, všech jeho politických reprezentantů a všech zainteresovaných úředníků, kteří jsou za tuto veleptákovinu zodpovědní, že úkol vyhotovit pracovní postup na ověření validity podpisů v petici a následné provedení tohoto úkolu pro něco tak důležitého, jako je volba prezidenta, bylo zřejmě svěřeno někomu, komu při počítání prstů na rukou vyjde pokaždé jiné číslo.

neděle 11. listopadu 2012

GIGO princip.

GIGO princip je váš nepřítel. Možná to nevíte. Možná ho neznáte. Ale určitě už jste se s ním setkali.

Pokud používáte jenom deskriptivní statistiku, jste ještě v relativním bezpečí, ale jakmile zkusíte použít statistiku aplikovanou, a to ať už analytickou či prediktivní, musíte si na GIGO dát setsakra pozor. Možná si myslíte, že vás se to netýká, protože statistiku nepoužíváte. Omyl. Každý používá statistiku, někteří si toho jenom nejsou vědomi. A ať jste právník či inženýr, účetní či učitel, GIGO vám jednou může podrazit nohy, aniž o tom víte.

Ani bloggeři nejsou vůči GIGO imunní. Právě GIGO je důvod, proč naprostá většina mých výroků obsahuje kvalifikátory a kvantifikátory, a to i když jsem si jist až za hranice všedních dnů, že má data jsou solidní, má matematika korektní a mé závěry správné. Bojím se GIGO. Setkal jsem se s ním tváří v tvář mnohokrát a není to hezký pohled. GIGO dokáže i inteligentním lidem zatemnit smysly natolik, že melou z cesty se zápalem mudžahedína. Bojím se GIGO. Bojím, bojím.

Při jakémkoliv statistickém zpracování dat je totiž třeba nezapomenout, že nejde jen o čísla. Jde i o to, jak jsou ta čísla získána, kde jsou získána, a jak jsou interpretována.

Způsob sběru dat je důležitý a hraje esenciální roli při následném zpracování výsledků a nevyhnutelně i jejich interpretaci. Proto jakékoliv agentury dávají velký pozor (popřípadě měly by dávat pozor) na to, aby pro své dotazníky získaly tzv. reprezentativní vzorek. To jest takovou skladbu respondentů s ohledem na vzdělání, věk, pohlaví atd. která co nejlépe odpovídá celkovému skutečnému složení populace. Získat úplně reprezentativní výsledky je samozřejmě nemožné bez toho, aby příslušný dotazník vyplnili všichni, a tady vstupuje do debaty tzv. interval věrohodnosti, p-hodnota a různé podobné srandičky, s jejichž pomocí lze spočítat, jaká je pravděpodobnost, že výsledky se blíží realitě. Správně a profesionálně udělaná statistická studie obsahuje vždy nějakou takovouto plusminus informaci.

Například u internetového dotazníku je zásadní chybou předpokládat, že jeho výsledky jsou reprezentativní pro celou Českou republiku. Je zásadní chybou dokonce i předpokládat, že jeho výsledky jsou reprezentativní pro čtenáře dané stránky, a to zejména je-li možné předpokládat například nárazový přísun čtenářů přes Google díky psaní o často vyhledávaném tématu atp. PZ Myers na tuto vlastnost internetových dotazníků už několik let poukazuje tím, že své desetitisíce čtenářů občas pošle na "pharyngulaci" nějakého pošahaného dotazníku např. na stránkách příznivců homeopatie nebo Fox News, čili na zkreslení výsledků tohoto dotazníku (většinou směrem realita, protože problém těchto dotazníků často spočívá v tom, že jejich účel není skutečný sběr dat, ale pouhé poplácávání se po ramenou mezi čtenáři příslušné pošahané stránky v tom smyslu, že jim dodá iluzi toho, že jejich pošahané názory jsou standard).

Pokud tváří v tvář výsledkům internetového dotazníku, zejména pokud nekoriguje pro možnou podujatost a trolly, vycházíte z neověřené premisy, že jeho výsledky jsou reprezentativní a přesné, cokoliv, co s těmi výsledky dále uděláte, je nevyhnutelně GIGO. Je úplně jedno, jak přesně budete počítat, je-li vaše základní premisa chybná GIGO vás dostane a není jiné cesty ven, než celou statistiku zahodit.

Že jsem ještě neřekl, co to vlastně GIGO je? Pravda.

"Garbage In - Garbage Out"

úterý 23. října 2012

Hon na čarodějnice.

Nemám slov. Šest italských vědců a bývalý státní úředník bylo odsouzeno k šesti letům vězení za zabití, protože nedokázali přesně předpovědět zemětřesení ve vsi L'Aquilla v roce 2009.

Doporučuji si přečíst článek na wikipedii k tomuto zemětřesení. Podle něj jeden laboratorní technik údajně velké zemětřesení předvídal, byl obviněn z alarmismu a bylo mu zakázáno o tom mluvit. Je-li to pravda, o to úžasnoucnější je potom tento rozsudek. Tedy abych byl konkrétnější - o to blbější je tento rozsudek. Za to, že následující výrok byl "neúplný, rozporuplný a nepřesný".

It is unlikely that an earthquake like the one in 1703 could occur in the short term, but the possibility cannot be totally excluded.

Je nepravděpodobné, že zěmětřesení jako to v roce 1703 nastane v dohledné době, ale tuto možnost nelze ani zcela vyloučit.

Což je, podle mínění expertů na tuto problematiku velmi přesný výrok. Bohužel to vypadá, že laici mají pocit, že vědci mají křišťálové koule, z nichž mohou vyčíst, co se stane. Jelikož věda je, byla a bude, o předpovědích, žeáno? Ale když předpoví něco, co se nám nelíbí, tak jsou alarmisté (viz nedávná, zcela korektně a správně vyhodnocená a ošetřená pandemie prasečí chřipky), a když něco nepředpoví, tak jsou mordýři. Z té logiky se mi až točí hlava, respektive točí se mi z toho, jak se v tomhle uvažování - jež je bohužel velmi rozšířené - snažím nějakou logiku najít. Nejedná se o nic jiného, než o novodobé hony na čarodějnice, kdy ignorantská veřejnost se snaží za každou cenu najít nějaký chlup na vědcích, kterým vděčí za svůj současný život.

Problém totiž je, že slovo předpověď ve smyslu vědeckém není totéž, co předpověď ve smyslu věšteckém, a zaměňovat tyto dva významy znamená podlehnout logickému klamu, který jsem si česky příhodně pojmenoval záměna významů.

Nečetl jsem wiki článek o předvídání zemětřesení celý, ale na zběžné čtení víceméně říká, co je lze očekávat díky efektu kouzelné lentilky - před každým velkým zemětřesením je někdo, kdo ho správně "předpoví", ale tato předpověď byla jenom statistickou anomálií, kdy se prostě z velkého množství vědců, rádobyvědců a pošuků někdo náhodou trefil. S množstvím zemětřesení, která se ročně stanou v geologicky aktivních zónách, a s množstvím lidí, kteří se zabývají výzkumem, by bylo statisticky mnohem větší anomálií, kdyby se nikdo nikdy netrefil. Problém ale je, že prostě neexistuje statistický model, který by byl schopen předpovídat zemětřesení s takovou přesností, jež je ekonomicky a společensky užitečná. Momentálně lze (podle mých znalostí, zdůrazňuji, že nejsem expert) možná pouze předpověď pravděpodobnostní, a ta je pro tuto konkrétní záležitost k ničemu.

Co taková pravděpodobnostní předpověď říká? Je to podobné jako u rulety. U rulety mohu předpovědět, že mnou rozebíraný a e-mailem mi neustále vnucovaný systém martingale nefunguje a v průměru to není spolehlivá cesta k výdělku, ani dlouhodobému, ani krátkodobému. Kdybych si dal hodně práce s tím znovu se naučit, co jsem zapomněl, mohl bych k tomu spočítat i fúru čísílek na štosy papíru popsané řeckými písmenky a kudrnatými znaky. Mohl bych spočítat, jaká je pravděpodobnost, že s vkladem X při rychlosti spinu Y budete mít pravděpodobnost Z, že přežijete první hodinu, pak druhou, pak třetí atd. To všechno lze udělat.

Co ale udělat nelze, je říct, jak konkrétně se bude dařit Pavlu Rákosovi z Mokré Lhoty, když se rozhodne tento systém využít a na ruletě vydělávat. Nelze ani vyloučit možnost, že se tak skutečně někdo někde na světě živí a zatím mu to vychází. Lze pouze říct (například. popisuji princip a skutečné pravděpodobnosti jsem nepočítal), že 50% lidí zkrachuje první den, 25% druhý den, 13% třetí den atd. atp.

V podstatě jediná správná rada, již jsou vědci schopni s ohledem na zemětřesení (a povodně, a uragány, a vznik smrtícího kmene chřipky) je, že pokud žijete v geologicky aktivní oblasti, máte si buď postavit dům, který to vydrží (což jde do určité míry ovšem levné to není) a nebo se odstěhovat jinam. Jenže nenexistuje oblast, která by byla rizika prostá, a život je prostě takový, že náhody se dějí a dít budou a kdo chce hrát na jistotu, tak ať si prostřelí hlavu vstoje na zábradlí mostu s kamenem na nohou a oprátkou na krku (a ani to nemá výsledek jistý).

Nicméně podstatné je, že o vědeckých záležitostech mají rozhodovat vědci. Je-li vědeckým konsenzem (a podle mně dostupných informací tomu tak je), že dotyčné zemětřesení nebylo možné předpovědět přesněji, než jak tomu bylo učiněno, nemůže žádný vědecky gramotný a zodpovědný soudce dotyčné vědce odsoudit na základě emocionálních svědectví pozůstalých, kteří v onom přírodním neštěstí ztratili blízké. Žádná míra smutku, s nímž plně soucítím, neospravedlňuje házení viny za přírodní katastrofu na bedra vědců. A kdo hledá úlevu od smutku tím, že se snaží za každou cenu najít viníka, ten moje sympatie rychle ztratí. Argumentum ad misericordiam by nemělo mít větší váhu než informovaný, byť ex post facto nesprávný, vědecký výrok. Což mi připomíná, že na ex post facto soudy máme hezké přísloví - "Po bitvě je každý generálem".

Zdroje:

pátek 19. října 2012

Nekonečný příběh

Tak mi zase přišla reklama na internetové kasino rovnou do e-mailu. Tentokráte na stránku www(tecka)mujpasivniprijem(tecka)com

Ani jsem se nenamáhal se čtením. Jedná se pořád o to samé. Všiml jsem si akorát jedné drobnosti, autor tentokráte píše dobu trvání jednoho "cyklu" se čtyřim sázkami - minuta (čili ca 15 sekund na spin) - a doporučuje počáteční vklad 200 €. Super! To značně usnadňuje vyvrácení tohoto paskvilu.

Protože 200 € limit při zdvojnásobování sázky dosáhne člověk už když spadne 8x za sebou tatáž barva. Čehož pravděpodobnost je ca. 1/256. Pokud to někomu připadá jako "málo" pravděpodobné, tak vězte, že při rychlosti spinu 15 sekund to znamená 240 spinů za hodinu, čili 234 příležitostí pro tuto "nepravděpodobnou" náhodu stát se skutečností. A o pouhé čtyři minuty dále už dokonce 256 příležitostí. A dál už se mi s matematikou nechce patlat, protože je to zbytečné. Každopádně kdo by měl tendenci té podvodné reklamě snad věřit, nechť si zkusí zadat uvedené parametry do mnou vytvořených excelových tabulek a přesvědčí se na vlastní oči. Občas sice na konci osmihodinového "pracovního" dne skončíte s hezkým ziskem, ale většinou přijdete o všechny peníze dříve, než den skončí.

sobota 4. srpna 2012

Inflace! No že mě to nenapadlo!

Nejnovější článek na novinkách o církevních restitucích je zajímavý a možná i vysvětluje, proč je onen diagram v novinách, jejž jsem rozebíral v sobotu, udělán tak, jak je - při malování diagramu byla možná započítána budoucí inflace. V článku na novinkách uváděná suma 96 miliard velmi dobře odpovídá přibližnému odhadu plochy pod modrou křivkou a konstantní inflace by mohla vysvětlovat i pomalý exponenciální růst červené křivky. Mění to něco na mém článku? Měl bych se omluvit TOP09? Ani omylem, naopak!

Stále totiž platí, že data uvedená v grafu neodpovídají datům uvedeným v textu, protože v textu není o inflaci ani tečka ani čárka. Nyní je to tím horší, že text naznačuje manipulativně záměrně výrazně nižší částku, než jaká má být podle tohoto odhadu ve skutečnosti vyplacena, a do očí bijící diskrepance mezi diagramem a textem tak dostává rozměr už ne pouhého omylu či nekompetence, ale zřejmě otevřené a vědomé lži. A navíc, nejde si jen tak započítat do grafu prognózu do budoucnosti a vydávat to za svatou a neotřesitelnou pravdu!

Nejsem sice ekonom, ale předpovědět inflaci na padesát let dopředu je nepochybně stejně obtížné, jako předpovědět cokoliv jiného. Inflace není vždy stejná a nebude. Troufnu si říct, že klimatologové jsou se svými extrapolacemi globálního oteplování do budoucna mnohem přesnější, než jsou ekonomové s extrapolacemi inflace. Graf extrapolující do budoucna data upravená o inflaci by měl tedy obsahovat v nějaké formě křivky pro tzv. interval věrohodnosti. Nebo, pokud chtějí data držet přehledná a jednoduchá pro obyčejné lidi (jak já tohle slovní spojení nenávidím, nemělo by vůbec existovat), měl by u grafu být odkaz na zdroj, který spočtené intervaly věrohodnosti obsahuje, a nejlépe i na data, z nichž se vycházelo.

Tvrzení, že se jedná o reklamu, a ne o publikaci ve vědeckém žurnálu, neobstojí. Bez uvedení zdroje pro křivky a bez uvedení intervalu věrohodnosti se jedná o čistou manipulaci a namalovat podobných grafů si jde s Open Office milión, zaplatit si milión protichůdných reklam a každý "si může věřit čemu chce, máme demokracii". Argumenty, že data si jde "najít přes google", "najít na stránkách TOP09", nebo dokonce "kdo problematiku sleduje, ten ví" a podobně, rovněž neobstojí. Všechny totiž přesouvají důkazní břemeno na toho, kdo má být přesvědčen, s toho, kdo přesvědčuje, a jedná se tudíž o debatní falše.

Když už TOP09 u toho diagramu vytiskla odkaz na internetovou stránku, měl tento odkaz být na konkrétní stránku, jež měla obsahovat podrobnější informace a ne jenom přesměrovávat na jejich obecné webové stránky.

Čili opakuji - styďtě se, pane ministře Kalousku, napsat svoje jméno pod takovýhle cár! A to zejména, pokud si myslíte, že stojí na realitě a stačilo vytisknout jeden řádek trochu jiného textu a nechat udělat jednu webovou stránku s daty pro skeptiky a zvědavce. Pokud někdo tvrdí, že je morální pravda na jeho straně, používání otevřených lží a zatajování míry nejistoty ohledně rozsahu důsledků toto morální stanovisko značně zpochybňuje.

čtvrtek 5. července 2012

Povstaň národe Moravský? Ehm... Ne.

Zajímavý dotázek. Přes Google Scholar jsem se dostal na stránku "Genetic Structure of Europeans: A View from the North–East " (jako vyhledávací frázi jsem použil "Milan Macek Moravia"). Takže odpověď na otázku v knize přání je ano, existuje studie poukazující na genetickou odlišnost populace na Moravě a v Čechách.

Klíčové slovo je ovšem "populace", jak se v onom interview (zjevně neúspěšně) snaží pan Macek zdůraznit, pročež tvrdit na základě této studie, že Moravané jsou natutesjasnápákaouplnějinejnárodwoenežnějakýčecháčcizprahe je bez prominutí pouze ukázkou toho, jak statisticky nekompetentní je youtube uživatel moravan.

Nečetl jsem článek dopodrobna, protože na to nemám ani chuť ani čas. Stačilo mi ale pět minut najít si to podstatné, nebo alespoň část toho podstatného. Jedná se konkrétně o Figure 3, kde je krásný diagram. Snad se nedopustím ničeho špatného, když ho zde reprodukuji.

Takže zlé Pražáce jsou zelené trojúhelníčky a zelené kolečko je medián. Hrdí Moravané jsou červené čárečky a červené kolečko je medián. Mediány se nepřekrývají, čili populace se v průměru liší. Přesto i laik z tohoto diagramu vidí, že většina zelených trojúhelníčků je promícháno s červenými čárečkami. Takže mezi oběma populacemi je značný, zdůrazňuji značný překryv. Takže odhadem 90% Moravanů je s ohledem na tyto genetické markery identických s 90% Pražáků. Na základě této genetické analýzy tudíž Moravana od Čecha určitě rozlišit nejde ani omylem s nějakou rozumnou mírou přesnosti a tvrdit na jejím podkladě, že Moravané jsou jiný národ, je, opakuji, zcestné.

Zdoje:

Nelis M, Esko T, Mägi R, Zimprich F, Zimprich A, et al. (2009) Genetic Structure of Europeans: A View from the North–East. PLoS ONE 4(5): e5472. doi:10.1371/journal.pone.0005472

neděle 13. května 2012

Pověste ho vejš...

Byl jsem minulý víkend na výletě. Moc krásném výletě s lidmi, které mám rád. Ale bohužel jsem se opět přesvědčil, že vysoká inteligence a vzdělání nejsou žádnou garancí schopnosti sesumírovat koherentní a logicky konzistentní argument, je-li dotyčný zapálen pro nějakou myšlenku na základě čistě emočního zaujetí. A není pak schopen rozlišit mezi argumentem stojícím na emočním, ryze subjektivním úsudku, a argumentem stojícím na objektivních, ověřitelných datech. Šlo konkrétně o debatu o trestu smrti. Tvrzení "po třech vraždách trest smrti, protože tak se mi to líbí" je sice striktně vzato argumentem podle definice toho slova, ale není to platným argumentem - je to petitio principii ve své nejzákladnější podobě, kdy se existence zcela arbitrární osobní preference používá k validaci této preference. "Tak to má být, protože to říkám, protože tak to má být" je nejmenší možný argumentační kruh a fascinuje mne, že ho vůbec někdo je schopen použít a očekávat, že bude akceptován a brán vážně. Já takovéto argumenty rozhodně brát vážně nemohu - nejsem toho schopen.

Původně bych o tom nepsal vůbec, nebýt dnešního článku na novinkách jménem "Věznice praskají ve švech, po prázdninách jim navíc dojdou peníze". V komentářích se objevuje totiž další z "argumentů" pro zavedení trestu smrti, který zazněl i v mé neplodné debatě na výletě, totiž argument "živení vrahů". Podívejme se na to, jak argument formulují "intelektuálové" na novinkách:

Oba komentátoři se snaží naznačovat, že udělením trestu smrti za vraždy by došlo k významné úspoře financí ve vězeňství. Postuluje tak napohled racionální analýzu výdajů/zisků. Podívejme se tedy na to, jak si tato analýza stojí ve skutečnosti.

Podle ročenky z roku 2010 Vězeňské služby České Republiky bylo v tomto roce u nás celkem 21 655 vězňů, s průměrným výdajem na vězně 848 Korun na den. Počet vražd v tomtéž roce byl 173 podle statistiky policie ČR. Nepodařilo se mi najít počet odsouzených vrahů za mřížemi ani průměrný trest za vraždu, ale vyjdeme-li z pro můj závěr nevýhodných premis, že za každou vraždou je v průměru jeden člověk, že za každou vraždu je jeden člověk odsouzen, a že všichni tito mají doživotí a tak stráví v průměru 25 let ve vězení (odhadnuto na základě skutečnosti, že zastoupení vězňů podle věku má přibližně normální rozložení mezi 20-70 lety s vrcholem u 35 let) , vyjde nám, že by ve vězeních při současném stavu mělo být maximálně 4 325 vrahů, čili necelých 24% z celkového počtu (a toto číslo je takřka jistě velmi, velmi nadhodnoceno).

Odkráglovat tyto lidi by tedy podle selské logiky ušetřilo circa čtvrtinu rozpočtu. Ejchuchů? Hovno, zlatý soude. Po tomto jednorázovém masakru bychom totiž zůstali u oněch ca. 173 lidí ročně a není důvod předpokládat, že počet zbývajících uvězněných - 17 330 - by byl tímto nějak změněn. A tak po tomto jednorázovém masakru by rázem "finanční benefit" trestu smrti pro naše vězeňství klesl z 24% na ubohé jedno procento meziročně. Dlouhodobě to sice vypadá stále jako lepší než kriminálníky živit, ale není tomu tak - to jedno procento by bylo jen za předpokladu, že bychom ignorovali výdaje na zadržení v průběhu soudu a v průběhu čekání na popravu, výdaje na popravu samotnou atd. Odhadl bych, že po odečtení těchto ostatních výdajů by zbyla úspora necelá třetina procenta z meziročních výdajů na vězeňství. Dosti malá úspora na 173 mrtvých. Ale je i takto malá úspora společensky akceptovatelná? Přeci jen, pořád je to úspora a dlouhodobě je to lepší než je živit? Pořád ještě je při popravě 173 lidí ročně ušetřeno jejich potenciální živení dalších 25 let?

Z morálního hlediska ani z bezpečnostního to není racionálně obhajitelné, alespoň ne podle dat, jež jsem našel k této problematice já.

Tento argument totiž předpokládá dvě věci - neomylnost soudů a to, že analýza "výdaje versus zisk" se odehrává pouze na straně státu/společnosti.

Neomylné soudnictví neexistuje a je projevem extraordinerní naivity domnívat se, že lze prokázat něčí vinu se 100% jistotou a neomylně. I pokud garantujeme 99% úspěšnost soudů (což je dosti velkorysé), tak nevratnost trestu smrti je 100%. To by znamenalo ve světle výše uvedených čísel jednorázově popravu ~43 nevinných lidí a následně meziročně v průměru ~2 osoby. Vypadá to jako malé číslo, ale opravdu je možné ospravedlnit jej úsporou peněz? Znamená to totiž, že smrtí těchto 43 nevinných a do budoucna dvou nevinných ročně, ušetříme 150 korun na hlavu ročně. Z morálního hlediska se pro mne jedná o příliš malou úsporu za to, abych jí dosáhl s vědomím, že ji ročně vykoupíme ukončením dvou nevinných lidských životů - a zničením životů všech jejich blízkých a příbuzných! Je na svědomí jednoho každého z nás, zda jsme ochotni smířit se se ztrátou 150 korun ročně výměnou za jistotu, že nebudeme díky nešťastné shodě náhod popraveni státem, nebo zda radši ušetříme oněch 150 korun výměnou za riziko 1/100 000, že někdy v průběhu života takto omylem popraveni budeme. Mě svědomí ale nedovoluje hrát ruskou ruletu se životy jiných kvůli takto mizerné úspoře, a tak radši dám těch 150 korun ročně. I objektivně vzato, prakticky neznatelné finanční nepohodlí deseti milionů lidí bychom vyvažovali doživotním nevratným traumatem celých stovek lidí ročně (průměrný počet blízkých osob je, co si vybavuji z hlavy, kolem 150), čili z tohoto hlediska je trest smrti rozhodně cestou dolů na pomyslném morálním terénu.

Tím se oklikou dostávám k druhé části toho, co již jsem říkal, že ona analýza "výdej / zisk" neprobíhá jen na straně státu. Probíhá totiž i na straně zločince. Má-li zločinec, který zabil jednoho člověka (nebo dva, nebo tři, nebo jiné, libovolné, arbitrární číslo vycucané z palce argumentujícího), jistotu trestu smrti, byl pro něj dosažen maximální možný trest, jaký může očekávat. Co ale nebylo dosaženo, je maximální počet lidí, jež může zabít. A tak zločinec, který se dopustí jedné (dvou, tří ...) vraždy, ať už z jakýchkoliv důvodů, je tímto de facto nucen snažit se už jen minimalizovat riziko svého dopadení - čili eliminovat všechny možné svědky svého činu a všechny policisty, kteří se ho snaží dopadnout, všemi dostupnými prostředky. Likvidací většího počtu lidí zločinec v tomto případě už nijak nezvyšuje svůj potenciální trest, ale může značně zvýšit své šance se trestu vyhnout, když bude bojovat do posledního dechu. Možná proto země s trestem smrti dlouhodobě nemají nižší kriminalitu, než země bez něj. Kriminalita jím je dlouhodobě a globálně neovlivněná, jak ukazuje mimojiné příklad Kanady (ten jsem vybral z více možných). Takže trest smrti coby prevence kriminality zřejmě nefunguje. Možná se jedná o pouhou náhodu, každopádně ale nejsou k nalezení žádná přesvědčivá data naznačující, že by trest smrti fungoval coby prevence, čili s trestem smrti či bez něj, pravděpodobnost, že někdo z nás bude zavražděn, je nejspíše stejná. To je další objektivní faktor - riziko zbytečné smrti kohokoliv z nás v důsledku justičního omylu (byť se to zvýšení zdá malilinkaté), není vyváženo zřejmě vůbec žádným nárůstem bezpečnosti, čili snížením rizika smrti v důsledku vraždy. Čili celková bezpečnost jednoho každého z nás by trestem smrti byla vlastně nejspíše snížena.

Myslím, že kdo dočetl až sem, už si dokáže domyslet řadu dalších rizik sám - např. možnost zneužití trestu státním aparátem i jednotlivci.

Za úsporu 150 korun ročně na hlavu si vybudujeme méně bezpečný stát? Huh. Jasně. Logika, woe.

Zdroje:

neděle 29. dubna 2012

Destilace páté esence

Pro dnešní příspěvek jsem si opatřil pro zpestření reálná data přímo z práce. Šlo o jednoduchou záležitost, ovšem výsledky velmi dobře poslouží účelu článku.

Zákazník pochyboval o výsledcích testu jedné externí certifikované laboratoře - byla měřena teplota plastových dílů několik minut po vyjmutí z klimatické komory, kde byly předtím dlouhodobě zamrazeny na -20°C. A pánům manažerům se nezdálo, že by se ony plastové díly mohly ohřát tak rychle na teploty nad bodem mrazu a přesto pak zůstat v průběhu testů stále relativně chladné. Požadovalo se proto po nás, abychom zdokumentovali průběh ohřívání příslušných dílů po vyjmutí z -20°C do pokojové teploty.

Když mi byl problém předestřen, měl jsem chvíli pocit, že si ze mne někdo dělá legraci (ten mám bohužel často). Nejsem tedy žádný fyzikální génius, ale přesto jsem si v tomto konkrétním případě dovolil zahrát na vědátora a před provedením požadovaného testu jsem před zadavatelem učinil předpověď - teplota dílu bude růst zpočátku velmi rychle a toto tempo bude postupně zpomalovat, jak se teplota dílu bude blížit teplotě okolí. Ale jako už mnohokrát jsem se opět přesvědčil, že tak jako já spektakulárně selhávám v případech středoškolského učiva českého jazyka či historie, tak jiní selhávají v případě stejné úrovně poznatků věd přírodních. Mé predikci nebylo uvěřeno a byl vznesen vehementní požadavek tento banální, ale časžeroucí test provést.

S ohledem na to, že všechny kalibrované klimatické komory byly obsazené, byl jsem nucen použít nekalibrovaný mrazák, čili jsem díly mohl zmrazit pouze s přesností plus minus 5°C, což je dost široké rozhraní. Po stabilizaci pár hodin byly díly po jednom vyjmuty a položeny před bezkontaktní kalibrovaný IR teploměr a teplota byla kontinuálně měřena čtvrt hodiny se zápisem měřené hodnoty každou sekundu. A tady je výsledek pro první měřený díl (každopádně doporučuji kliknout pro zvětšení).

Zajímavé ale není to, že jsem měl pravdu já i certifikovaná laboratoř. Zajímavé je, že při pohledu zdálky to vypadá, že moje predikce byla splněna, avšak při pohledu zblízka je vidět, že je křivka značně zubatá. A chvílemi to dokonce vypadá, jako by díl měl teplotu několik sekund konstantní, nebo dokonce jakoby se pár sekund ochlazoval! Což, jak by každý měl vědět, není možné, odporuje to druhému zákonu termodynamiky. Coto? Inu, ruchy. I když jsem se snažil minimalizovat vliv prostředí - díl i teploměr byly po celou dobu pevně fixované, ve stínu, okno bylo zavřené a na každého, kdo kolem byť i jen prošel, jsem házel krajně nevrlé pohledy.

Co když si ale trochu statisticky pomůžeme, například tzv. klouzavým průměrem? Graf bude vypadat mnohem lépe, zuby se vyhladí a všecko bude eňo ňůňo (skoro).

Klouzavý průměr spočítaný vždy z pěti po sobě jdoucích hodnot (čili každých pěti sekund měření) křivku trochu vyhladí, ale pořád ještě jsou vidět jasně nerovnosti a krátkodobé trendy odchylující se od hlavního směru křivky.

Klouzavý průměr spočítaný z jedenácti po sobě jdoucích hodnot křivku vyhladí ještě lépe, ovšem rovněž ne dokonale. Šlo by pokračovat, ale článek by zbytečně kynul, takže jen konstatuji, že čím více hodnot je zahrnuto do klouzavého průměru, tím je křivka hladší. Lineární křivku by šlo s pomocí této metody vyhladit kompletně, pokud by nebyla moc zubatá, ale u nelineárních křivek (a tudíž i u této) po dosažení určité úrovně vždy dochází ke zkreslení skutečného trendu. Je třeba najít kompromis mezi přesností a hezkostí.

V případě, kdy je možné očekávat, že data lze vysvětlit nějakou závislostí popsatelnou matematickou funkcí, je samozřejmě nejlepší najít tuto funkci. To ovšem není nijak snadné a pro demonstrování toho, co mám v úmyslu, naštěstí ani nezbytné.

Již zde padlo slovo ruch. Ruch, čili náhodná složka obsažená v měření. Náhodná, tudíž nevyzpytatelná a nepředvídatelná? Správně. Špatně. Zkusme se podívat na to, jak se příslušný ruch chová, nejjednodušeji tak, že spočítáme rozdíl mezi klouzavým průměrem a přináležící skutečně naměřenou hodnotou. Po vynesení na bodový graf vzniknou tyto dva hezounké obrázky.

Vidíte už, kam tím mířím? Asi ne. Vypadá to jako totální chaos, a nezkušený laik (= i Charly před pár lety) by z čučení na tu změť teček začal asi leda tak šilhat a dostal ještě škytavku. Ale přesto je v tom zdánlivém chaosu určitý řád, který zkušené oko uvidí. Asi už tušíte, kam tahle trnitá cesta vede, nebudu vás tedy dále trápit (tedy ty, co dočetli až sem). Pohleďte na histogramy těchto odchylek po jejich zaokrouhlení na celá desetinná místa - na ose y je vynesena četnost dané odchylky v daných datech, čili například 163 krát je skutečně naměřená hodnota o 0,1 °C vyšší než přináležící klouzavý průměr z pěti hodnot.

Ano, rozložení ruchu odpovídá skutečně velmi přesně Gaussově křivce. Dokonce přesněji, než jsem čekal, když jsem si příslušná měření vzal domů ke zpracování pro účely článku. Při ještě lepší eliminaci vnějších vlivů a proměnných (žádný průvan, promenádující se kolegové a podlaha rozvibrovaná od náklaďáků, měření něčeho s konstantní teplotou a ne něčeho, co ji postupně mění) bychom takto získali Gaussovo rozložení vlastní použitému teploměru, ruchy, které budou při použití tohoto zařízení přítomny vždy dělej co dělej. Mám důvod se domnívat, že by víceméně odpovídalo tomu, jež vyšlo pro klouzavý průměr z 11 hodnot, vezměme to tedy coby poznatek pro závěr článku.

A co nám to říká? K čemu tenhle poznatek je? Říká nám, že když příslušným teploměrem změřím teplotu nějakého předmětu, je naměřená hodnota s 50% pravděpodobností přesná na plusminus jednu desetinu. Na 95% je přesná na plusminus dvě desetiny. A prakticky (nerovná se zcela) jistě je přesná na plusminus tři desetiny. A čím vícekráte něco tímto teploměrem změřím, tím více se kumulativní výsledek blíží realitě - ale nikdy není absolutně přesný.

A údajně právě takto Carl Friedrich Gauss normální rozložení, jež od té doby nese jeho jméno, objevil. Zpracovával geodetická měření a zjistil, že totéž měření dá pokaždé lehce jiné hodnoty - a že tyto hodnoty, byť na pohled náhodné, lze popsat matematickou funkcí. A ta matematická funkce nám umožňuje najít řád tam, kde byl zdánlivý chaos, a tak přiřadit míru přesnosti něčemu, co už ze samotné povahy reality úplně přesně zjistit nelze.

Ale proč se realita chová takhle blbě? Proč není možné prostě změřit například vzdálenost x přesně ale jen "přesně plusminus"? K tomu se ještě vrátím.

Zdroje pro případ, že by si snad někdo chtěl také hrát s čísílky:

tabulka dat ve formátu OpenOffice
tabulka dat ve formátu Excel (nezaručuji funkčnost grafů)

neděle 22. dubna 2012

Skutečný kámen mudrců

Legendární kámen mudrců byl vysněným cílem středověkých alchymistů. Měl produkovat elixír života a být schopen transmutace neušlechtilých prvků na zlato. Nebyl nikdy objeven a i kdyby existovat mohl a byl vyroben, znamenal by okamžitou devalvaci zlata na cenu konvergující k nule a k poklesu kvality lidského života tímtéž směrem.

Skutečný kámen mudrců byl však objeven v roce 1809 a od té doby je využíván ve vědě neustále. Nedělá nic tak banálního jako je výroba zlata, i když už se významně podepsal na délce života všech, kdo čtou tento článek a víceméně celého lidstva. Ale nejedná se o žádnou magickou substanci, nýbrž o koncept popisující realitu takovým způsobem, jež jediný umožňuje realitu skutečně měřit, chápat a předvídat - i když ne tak, jak by se většině lidí líbilo.

Pohleďte na bez nadsázky jeden z nejvýznamnějších objevů v historii lidstva.

Ano, je to Gaussova křivka. Statistický koncept, jehož explanační síla a vliv jsou takové, že bez jejího pochopení je prakticky nemožné chápat moderní vědu. Bez jeho pochopení není možné chápat nic, co stojí za pochopení. Bez jeho pochopení realita prostě nedává smysl. A bez jeho pochopení není možné chápat tento blog a vůbec většinu toho, co říkám a to zdůrazňuji.

Setkal jsem se už s celou řadou lidí, kteří si myslí, že "chápou statistiku", včetně Gaussovy křivky, a pak z nich stejně vypadla nějaká perla blbosti dokazující přesný opak. Jsou mezi mými známými, jsou mezi mými kolegy v práci, jsou dokonce i mezi mými nadřízenými tamtéž, jsou na internetu, jsou všude. Jsou i na tomto blogu, jak je evidentní z některých komentářů, a tudíž asi vznik tohoto článku je poněkud opožděný. Respektive tímto článkem a články navazujícími, jsem měl začít.

Nejprve se podívejme, co ten obrázek vlastně říká. Jedná s o lineární graf, kde na ose y je procentuální zastoupení nějaké vlastnosti vynesené na ose x. Plocha tohoto grafu pod křivkou pak dá dohromady 100%. Byla-li by tedy například na ose x výška stromu v lese a tento graf by popisoval výšku stromů v lese v metrech, pak by to znamenalo, že v dotyčném lese je 2,66% stromů s výškou 50m, 2,65% stromů o metr vyšších a 2,65% metrů o metr nižších atd atp.

Stromy samozřejmě nemají výšky v diskrétních metrech, takže jsme-li spokojeni s výškami zaokrouhlenými na celé metry, můžeme místo lineárního grafu použít graf sloupcový, kde výška jednotlivých sloupců ukazuje zastoupení jednotlivých výšek.

To je ovšem trochu nepraktické a nepřehledné, v praxi se většinou rozděluje na co nejméně kategorií, podle potřeby, většinou 3-5. Chilli nějak takto.

Tomuto grafu se říká histogram. Obsahuje tytéž informace, co předchozí grafy, akorát s hrubším rozlišením, ale to je principielně jediný rozdíl oproti prvnímu grafu. Každý sloupec zde svou výškou odpovídá ploše pod křivkou grafu pro daný interval v prvním obrázku.

A proč považuji tento poznatek za tak strašně důležitý? Protože bez něj skutečně nelze vědět a chápat nic a protože je úplně všude. Neexistuje oblast, v níž by se Gaussovo normální distribuce vlastností nebo nějaká její derivace neprojevila, a odpovídá na velmi dlouhou řadu "proč". Uveďme jen pár příkladů.

Ve vědě:

Proč to, že nevíme všechno, neznamená, že nevíme nic.
Proč nemožnost něco předvídat na úrovni prvků neznamená, že nelze předvídat chování celku.
Proč evoluce může fungovat na mikro i makro úrovni.
Proč nic nelze změřit úplně přesně, a přesto lze odvodit přesné závěry.
Proč se někdy nadějný objev ukáže jako chyba.
Proč je někdy důležitý objev přehlédnut.
Proč skutečný vědecký poznatek musí být v principu falsifikovatelný.
Proč věda nefunguje na základě snahy něco potvrdit, ale vyvrátit.
Proč minulé neúspěchy a omyly vědy nejsou argumentem proti platnosti moderních poznatků.
Proč i nejmodernější vědecké poznatky nejsou dokonalé a obsahují míru chyby.

V lékařství:

Proč kouření není zdravé, i když něčí dědeček hulil jak fabrika a dožil se stovky.
Proč neexistují absolutně bezpečné léky a vakcíny a přesto je projev blbosti odmítat a priori jedno a/nebo druhé.
Proč neexistuje žádný univerzální lék na všechno, dokonce ani na něco ne.
Proč nexistuje žádný zaručený recept na dlouhověkost či zdravé zuby.
Proč i sebelepší léčba/lékař někdy selže.
Proč i sebehorší nemoc někdy skončí dobře.
Proč i banální operace může skončit tragicky.
Proč alternativní medicína je obecně nebezpečné bunkum, i když občas někomu "funguje".
Proč domácí porody a jejich propagace jsou projevem mdlého rozumu.

V průmyslu:

Proč něco takového jako nulová zmetkovitost neexistuje.
Proč něco takového, jako absolutní přesnost neexistuje a jakákoliv přsnost je funkcí stanovených tolerancí.
Proč i když všechny součástky jsou v pořádku, jejich komplet může být zmetek.
Proč počítání norem podle nejlepšího pracovníka vede k nespokojenosti.
Proč počítat systematicky termíny podle 100% výrobní kapacity skončí fiaskem.
Proč diskriminace na základě rasy/pohlaví je kontraproduktivní i v případech, kdy je mezi pohlavími/rasami měřitelný rozdíl.

V politice:

Proč politická strana se skutečně rozumným programem nemá v demokracii prakticky šanci.
Proč vyhraněné politické názory a programy dlouhodobě vždy napáchají škodu.

V argumentaci a logice:

Proč je "a dicto simpliciter" logickým klamem.
Proč jsou "post hoc ergo propter hoc" a "cum hoc ergo propter hoc" logické klamy.
Proč sebelepší argument nepřesvědčí každého.
Proč vždy někdo bude věřit i úplným blbostem.

V psychologii:

Proč i inteligentní lidé mohou zastávat úplně pitomé názory.
Proč je koncept IQ problematický.

V každodenním životě:

Proč stejné šance neznamenají stejný úspěch.
Proč neúspěch není automaticky známkou neschopnosti - a naopak.
Proč "podle sebe, soudím tebe" přístup k lidem je krajně pitomý.

I následující přísloví naznačují, že na určité úrovni byl tento koncept obsažen i v lidové moudrosti:

Jedna vlaštovka jaro nedělá.
I mistr tesař se utne.
Dvakrát měř, jednou řež.
Není na světě člověk ten, jež zavděčil by se lidem všem.
Výjimka potvrzuje pravidlo.

Zkuste se zamyslet nad jedním každým proč. Byl jsem stručný, a přesto je jich celkem slušná řádka. V příštím článku zkusím vysvětlit princip, proč všechna tato proč vysvětluje právě Gaussova křivka.

neděle 18. března 2012

...testovaný řádsky.

Dnes ráno jsem říkal, že se použiji příklad zahrnující zažívací potíže a bolesti žaludku. Tady je (znovu zdůrazňuji, že čísla jsou nepřesná, z hlavy, a mají sloužit pouze orientačně pro demonstrování principu, kauzální provázanost by ale měla odpovídat realitě).

Řekněme, že 100 lidí má občasné mírné bolesti žaludku, občas ostřejší, nechuť k jídlu a cítí ubytek na váze. Dosti nespecifické příznaky, které bohužel mohou znamenat několik diametrálně odlišných věcí. Protože zatímco 33 z těchto lidí má dejme tomu "jen" neurózu a jejich fyzické potíže jsou psychosomatického rázu, 40 z nich už má vážnější gastritidu, 25 z nich ještě vážnější počáteční vřed a dva nešťastníci mají rakovinu žaludku.

V situaci, kdy vše bude probíhat jak má, u 11 lidí příznaky odezní a oni nikdy lékaře nenavštíví - nemají důvod, jejich onemocnění bylo psychosomatického rázu a jim se podařilo se s tím vyrovnat - změnou povolání, dovolenou atd. atp. Zbývající navštíví svého lékaře a ten je preventivně pošle na gastroenterologické vyšetření. U toho se už pochopitelně zjistí, kdo co má, velice přesně. Bohužel jeden případ s rakovinou už je mimo dosah pomoci a umře. Nemocní vředem a gastritidou dostanou antibiotika a další léky adekvátní jejich situaci. A lidé s psychosomatickými potížemi budou posláni k psychoterapeutovi, aby jim pomohl vyškrábnout toho brouka z hlavy, který je hlodá až v břiše.

A ten, protože ví, že má co dělat s problémem psychickým, použije psychologické fígle, včetně lhaní (=placeba), bude-li to nutné pro to, aby dosáhl svého cíle. Ale on i pacient po celou dobu ví, kde je problém, a oba se snaží k jádru onoho problému dostat. A i když je třebas psychoanalýza jenom placebem, nebo i když předepisovaný lék je jenom placebem, už i onen sociální kontakt s pacientem a vědomí, že někdo jeho problém bere vážně a snaží se mu pomoci, mohou mít dohromady v těchto případech nezastupitelný léčebný efekt a psychoterapeut si tudíž zaslouží svou odměnu, i kdyby fungoval ve skutečnosti jenom jako lidská vykecávací vrba.

Jakou máme v tomto hypotetickém případě bilanci? 1 mrtvý, 99 zdravých.

Půjde-li oněch 22 lidí s psychosomatickými potížemi k homeopatovi (senzibilovi, kartářce, astrologovi, léčiteli silou krystalů, woo-doo šamanovi, novému vtělení Krišny), dostane se jim rovněž pozornosti, sociálního kontaktu a tudíž se taky uzdraví. Vypadá to eňo ňúňo a Charly by měl držet zobák a nekvákat ty svoje pitomosti proti krásným new age věcičkám, vždyť je to totéž ne?

Ne.

Protože oproti psychoterapeutovi, je tu jeden podstatný rozdíl. Tito lidé neříkají, že léči psychický problém, ani oni sami to namnoze neví, a jejich pacienti to také neví. Tito lidé říkají, že léčí fyzický problém (někdy sice jakoby "prostřednictvím" psychiky, ale to je jedno). Tito lidé říkají, že moderní medicíně konkurují, ne že jsou alternativou k psychoterapii. Tito lidé staví svou terapii na lži sami sami sobě i pacientům, nejdená se o "milosrdnou lež" jako v případě psychoterapeuta, ale o čistokrevný blud. A pokud jejich bludům propůjčována věrohodnost jakoukoliv formou, je nevyhnutelným následkem, že k nim někteří lidé půjdou rovnou a nebudou se namáhat s návštěvou u lékaře vůbec. Příklady následků občas problesknou internetem a médii.

A jak by to vypadalo, kdyby naši pacienti navštívili nějakého alternativního šarlatána rovnou? Každý si spočte, že ti s rakovinou by zemřeli oba, ale tím to neskončí. V případě neléčené gastritidy by se u jednoho z našich čtyřiceti pacientů objevila rakovina a u deseti vřed, takže bychom skončili se třemi mrtvými na rakovinu. A neléčený vřed sám o sobě by zabil dalších devět lidi, když by konečně prasknul. A rázem skončíme s bilancí 12 mrtvých na 88 živých, plus ta "drobná" skutečnost, že těm živým se dostane jen placebo efektu, čili se skutečně uleví jen třetině z nich a jen na omezenou dobu. V břiše jim zůstane tikající bomba, která může kdykoliv vybuchnout, a jim není a nikdy nebude zdaleka tak dobře, jak by být mohlo.

Tyto poměry 1/99 versus 12/88 se nezmění, ani v případě, že by lidí, co navštíví šarlatána dříve než lékaře, bylo naprosté minimum. Proto vyjde při sčítání celkového blaha ve společnosti vždy méně, než kdyby všichni využívali jen a pouze prověřené metody a hádat se dá tak maximálně o to, jak velký rozdíl je v reálném světě (právě dodáním přesnějších čísílek), ale ten rozdíl zůstane vždy, ten odkecat nejde.

A tak se vracím opět k tomu, co jsem zmínil už v původní sérii článků - konsekvencí prosté užívání alternativní medicíny neexistuje. I kdyby nic jiného, podporuje tím myšlenkový proud stojící na klamu a sebeklamu a to nevyhnutelně někdy, někde povede ke škodě, protože to neobsahuje žádný mechanismus sebekorekce.

Dívat se jenom na "úspěchy" alternativní medicíny znamená zavírat oči před komplexní a povahou reality a s tím si u mně nikdo nešplhne. Je to stejné jako argumentovat proti mířené střelbě tím, že i s nemířenou se lze občas strefit do černého.

A tatínek prášky...

V pátek mne skolila nějaká menší chřipka či větší nachlazení, takže jsem nemohl jet kamarádovi na svatbu a místo toho jsem se pokoušel doma o klid a mír duše a kýbl potu. Ideální konstelace nálady na zpracování restů z tématu "placebo" - jsem nevrlý (víc, než obvykle), pšíkám (víc, než obvykle) a mám chuť se na všechno vykašlat (víc, než obvykle).

Nejprve malá rekapitulace: V sérii článků "Placi placi placičky, máma koupí čajíčky." jsem se snažil shrnout své morální argumenty proti terapeutickému použití placeba. Bohužel, jak vyplynulo v komentářích, jsem se nevypořádal s jedním specifickým fenoménem - psychosomatická (a eventuelně psychická) onemocnění.

Připouštím v těchto případech jako morálně ospravedlnitelné terapeutické použití placeba (ať ve formě pilule či procedury) psychiatrem/psychoterapeutem/či lékařem, ale ne jeho použití homeopatem či jiným šarlatánem, byť by vedly ke stejnému výsledku. A ve svých závěrečných článcích na toto téma se tedy budu soustředit především na toto.

Předem předesílám dvě věci:

Nejsem morální filosof. Ani nemorální ne. Nefilozofuji, pouze logicky uvažuji a snažím se při tom na problém nazírat nejen z pohledu detailů, ale i z co nejširšího rámce. Nemyslím si, že jsem dospěl k nějak super originálním závěrům a pokud tedy někdo má načteno tuny textu na dané téma, těžko si tu počte.
Budu uvádět fiktivní příklady z hlavy, pro ilustrování principů. Tyto příklady si nenárokují v žádném případě přesnost, nicméně měly by v principu odpovídat realitě poměrně dobře. Na hnidopišskou kritiku ve stylu "ve skutečnosti tak onemocní o x procent lidí míň" a podobně budu reagovat velmi nevrle. Bude-li někde principielní chyba, a vy ji najdete a prokážete, budu nevrlý taky, ale na sebe.

A teď už k lámání chleba.

Psychosomatické, jak už napovídá jméno, jsou nemoci, u nichž se stav psychiky nějakým způsobem promítá do stavu těla. Lze si tedy představit, že se budou příznaky sčítat - některé nemoci začnou drobnými fyzickými potížemi a špatný psychický stav pacienta tyto potíže exaltuje, některé začnou psychickými potížemi a z nich vzniknou potíže fyzické. A někteří senzitivnější lidé se dostanou do samoposilující zpětné vazby, kdy zhoršení psychického stavu vede ke zhoršení fyzického a to ke zhoršení psychického... Podívejme se tedy například na bolesti žaludku a zažívací potíže, protože zde je existence psychosomatické složky v obecném podvědomí. Kukytykuk na příklad, jak by to mohlo fungovat.

Pokud máte pocit, že už jste podobný diagram viděli, máte správně.

Zde jde o příklad, kde iniciátorem jsou skutečné fyzické potíže (červená křivka) které vedou ke zhoršenému psychickému stavu (modrá křivka), a to se sečte (žlutá křivka).

Na levém konci žluté křivky jsou ti, kteří sice mají nějaké fyzické potíže, ale nic si z toho nedělají. Mozkoškrab ani šarlatán jim nepomůžou, nemají s čím.

Uprostřed žluté křivky je pak směska těch, kdo mají malé fyzické potíže, ale už to trochu přehánějí a těch, kdo mají velké fyzické potíže, ale nenadělají kolem toho tolik cirkusu. Z této skupiny se pak rekrutují příznivci různých pseudoléčeb, protože zde lze najít lidi, kterým pseudoléčba přinese úlevu až na úplně dolní hranici fyzických potíží.

Na pravém konci žluté křivky se pak nachází ti nešťastníci, kteří mají velké fyzické potíže, ale neunesli to a vzniklé psychické potíže jejich zdravotní stav vyšroubovaly až na samou hranici snesitelnosti. Tito lidem nepomůže ani sám mozkoškrab či šarlatán, ani sám lékař, potřebují obojí.

Ale jak již jsem řekl, iniciátorem v tomto příkladě byly skutečné fyzické potíže. Lze si samozřejmě představit i případy, kdy fyzické potíže jsou důsledkem psychických a lidé se liší pouze v tom, jak daleko je vytočí zpětná vazba. V těchto případech by stačil mozkoškrab a i šarlatán má šanci tyto lidi dovést ke stavu totálního ozdravení. Proč tedy považuji za morálně nepřípustné používání a propagaci šarlatánství i pro tyto případy, ale mozkoškraby s jejich pochybnou psychoanalýhou a placebo prášky ano?

Abych pravdu řekl, myslel jsem si, že jsem to de facto řekl v původní sérii článků a proto se mi do toho ani moc nechce. Ale zjevně je potřeba to říct polopatičtěji, bohužel. Tak se k tomu tedy ještě vrátím v druhém, definitivním závěru minisérie. Snad dnes večer.

sobota 18. února 2012

Placi, placi...

Je hezké vidět, že Kniha přání funguje a někdo i našel odvahu tam napsat. A protože, jak vidí každý, jsem egomaiakální krvelačný šílenec, tak dotyčného teď pokoušu a utrhnu mu hlavu. Je to jen logické, ne?

Ale než se do toho vrhnu, je třeba ujasnit pár věcí - totiž to, co je to placebo a jaké jeho použití je dle mého neetické a jaké ne. Až pak se lze vůbec bavit o tom, proč ten názor zastávám. Protože ani tato záležitost není černobílá.

Placebo efekt

Placebo je definováno jako látka/procedura, která už z principu nemůže mít žádný přímý vliv na léčenou nemoc či její syndrom. Placebo efekt je pak (zdánlivá či skutečná) úleva či míra uzdravení, způsobená pouze reakcí organismu pacienta na to, co je vnímáno jako léčba. Nemocný se cítí lépe, protože má pocit, že je o něj postaráno. Duševní pohoda má zcela zjevně vliv na zdraví (coby člověk trpící zřejmě doživotně nemocí vyvolanou pravděpodobně stresem mám bohužel zkušenost z první ruky) a tak toto může vést k rychlejšímu uzdravení v případech, kdy lékař stejně nemůže nic moc dělat a nezbývá než čekat, až se si tělo s nemocí poradí samo (virózy, vyčerpání atp.).

I když i podle wiki se stále ještě brousí kordy ohledně toho, kde a jak moc placebo efekt funguje a jestli vůbec funguje, pro účely tohoto a následujících článků vycházejme z premisy, že placebo efekt funguje. Protože pokud nefunguje, a je pouze statistickým vyjádřením lidského subjektivního vnímání přirozeného šumu na pozadí (viz. efekt kouzelné lentilky), většina keců by byla zbytečná.

Lze si tedy představit, že by se v realitě mohl placebo efekt projevovat nějak takto:

Placebo samo o sobě má v tomto fiktivním případě měřitelný vliv, s normálním rozložením u maxima 20% úlevy. Účinný lék má stejné rozložení, s maximem u 40%. Kombinace obou pak dá mnohem nižší a širší Gaussovu křivku, kde vlevo - okolo 30% úlevy - jsou ti nešťastníci, u kterých se lék i placebo projevily minimálně a vpravo - okolo 90% úlevy - jsou ti šťastní, co jim obojí zabralo maximálně. Při klinickém testu, kde jsou lidé rozděleni na skupinu dostávající placebo a skupinu dostávající lék, lze běžně vyprodukovat jen dvě z těchto křivek, totiž modrou a žlutou, protože nelze někoho léčit, aniž by o tom věděl.

Všimněte si, že mezi mírou úlevy 25% až 35% se všechny tři křivky překrývají. Nachází se zde přibližně 15% lidí z placebo skupiny a 0,6% lidí ze skupiny se skutečným lékem. Proto by v tomto fiktivním případě, stejně tak jako řadě případů ve skutečnosti, nešlo jenom vybrat náhodně pár jedinců z populace, aplikovat placebo nebo kurativum, zaznamenat izolovaný výsledek a z něj vyvodit závěr. Pro posouzení funkčnosti léku/procedury je nutné vyhodnotit více jedinců, čím více, tím lépe, a spočítat statistickou významnost rozdílu průměrného účinku mezi placebo skupinou a skupinou beroucí léky.

A proto by v tomto fiktivním případě, stejně tak jako v řadě případů ve skutečnosti, nešlo vyvozovat obecný závěr z toho, jak dotyčný lék či léčba zapůsobily na vás. To jsem zdůraznil, protože přesně tohle dělá obrovské množství lidí v obou směrech (tj. v plivání na vědecky ověřené léky a v propagování šarlatánských pseudoléčeb).

Nicméně tímto se konečně oklikou dostávám k první etické otázce, a to k použití placeba v případě posuzování nových léků. Ať už placebo efekt má kurativní účinky nebo je jenom subjektivní záležitost, vzhledem ke statistické nečernobílé povaze reality nelze adekvátně posoudit účinnost nového léku bez jeho srovnání s placebem. Proto v případě klinických testů nových léků použití placeba pro pro referenční skupinu neoddiskutovatelně etické je, protože je to prostě nezbytné (není-li k dispozici žádná, již dříve proti placebu zkoušená léčba). V tomto případě se nejedná o zlo, protože i když může eventuelně vést k tomu, že vážně nemocný člověk nedostane účinný lék, je to jediný způsob, jak zjistit, zda se skutečně jedná o účinný lék.

Za jednoznačně neetické ovšem považuji terapeutické použití placeba, a to ať už je podáváno lékařem, šarlatánem, či samoaplikováno. Ale k tomu až v dalším článku, snad ještě dnes večer či zítra.

neděle 29. ledna 2012

Konec náboženství v Čechách?

Už předtím, než vyšly výsledky dotazníků Eurobarometr 2005, se mluvilo o Češích jako o neznabozích. Nové sčítání lidu se zdá tento poznatek potvrzovat - 34% lidí přímo řeklo, že jsou bez náboženské víry, (0,01% uvedlo jako svou víru a církev ateismus, což je samozřejmě blbost a při zpracování statistiky měl statistický úřad tuto blbost kompenzovat) a 0,14% lidí se přihlásilo k náboženství rytířů Jedi, přičemž je veřejným tajemstvím, že toto jsou minimálně z části ateističtí recesisté.

Každopádně to, že přibližně třetina obyvatel ČR je bez víry je neoddiskutovatelný fakt, a to ještě toto číslo téměř určitě bude o něco vyšší, protože 45% lidí na otázku o své víře odmítlo odpovědět, ať už z jakýchkoliv důvodů. Co mne ale zaráželo - a zaráží - je, jak často v diskuzích člověk narazí na házení "viny" za tento stav na komunisty, na katolickou církev, na českou bezpáteřnost a málem snad i na erekce na slunci. Záleží na pozici argumentujícího, zda považuje ateismus za špatnou nebo za dobrou věc, a na základě toho se snaží následně racionalizovat - ať už za hodně volné interpretace vybraných historických událostí, či i jenom vlastních názorů a pocitů, většinou za použití jejich kombinace - své stanovisko a hledání jasného viníka.

Přičemž jsem při zadání fráze "ateismus v Čechách" do Google nenarazil na prakticky žádný článek, který by měl hlavu a patu. Kdybych se pokoušel odkazovat na všechny blbosti, na něž jsem v této souvislosti narazil, asi bych se zbláznil zoufalstvím nad stupiditou některých lidí (jeden článek si dokonce předefinoval slovo ateista jako výlučné a absolutistické přesvědčení neexistenci boha - jak blbý a v elementární logice nekompetentní může ještě člověk být a být schopen číst?). Tak jsem si řekl, že se za použití dat z Eurobarometru 2005 podívám alespoň na tvrzení, že za absenci víry u nás může komunismus, protože s tím jsem se nejméně ve dvou internetových a jedné osobní debatě setkal i já sám, i jsem byl automaticky označen za komunistu, protože nevěřím v Boha.

Tyto debaty někdy vypadají jako turnaj v mariáši - jeden vynese ateismus v Čechách, oponent kontruje náboženskostí Slováků, to je přebito rozdílem v pobožnosti mezi východním a západním Německem, následuje trumfování vysokou pobožností Rumunů a Poláků. A nikam to nevede, protože pokud obě strany po sobě místo prezentování faktů a jejich koherentní interpretace akorát háží pomyslné přebrané třešně, debata se může táhnout do nekonečna.

Udělal jsem si tedy - jak je mým zvykem - malilinkatou statistickou analýzu. Vyšel jsem z dat z Eurobarometru (tabulku dat jsem opsal z Wiki, ale ověřoval jsem si kdysi její správnost s původním zdrojem). Pro praktičnost jsem si označil tři tam uvedené kategorie údernějšími a výstižnějšími termíny:

Belief in a God = věřící v Boha/boha/bohy = Teismus
Belief in a spiritor life force = věřící v nějakého ducha či životní sílu = Deismus
Belief in neither a spirit, God, nor life force = nevěřící ani jednomu z výše uvedených = Ateismus

Vím, že termín 2 není přesný, používám jej pouze proto, že z těchto tří kategorií je to jediný jednoslovný termín, který alespoň přibližně významově odpovídá obsahu této kategorie.

První, co mohu poměrně jednoduše udělat, je rozdělit data do dvou tabulek - západní demokracie a postkomunistické země. A takhle to vypadá (a pevně doufám, že tam nemám chybu):

Západní demokracie				Postkomunistické země
	Ateismus	Deismus	Teismus		Ateismus	Deismus	Teismus
Austria	8%	34%	54%	Bulgaria	13%	40%	40%
Belgium	27%	29%	43%	Croatia	7%	25%	67%
Cyprus	2%	7%	90%	Czech Rep.	30%	50%	19%
Denmark	19%	49%	31%	Estonia	26%	54%	16%
Finland	16%	41%	41%	Germany(E)	57%	20%	19%
France	33%	27%	34%	Hungary	19%	31%	44%
Germany(W)	16%	26%	54%	Latvia	10%	49%	37%
Greece	3%	16%	81%	Lithuania	12%	36%	49%
Iceland	11%	48%	38%	Poland	1%	15%	80%
Ireland	4%	22%	73%	Romania	1%	8%	90%
Italy	6%	16%	74%	Slovakia	11%	26%	61%
Luxembourg	22%	28%	44%	Slovenia	16%	46%	37%
Malta	1%	3%	95%
Netherlands	27%	37%	34%
Norway	17%	47%	32%
Portugal	6%	12%	81%
Spain	18%	21%	59%
Sweden	23%	53%	23%
Switzerland	9%	39%	48%
U. Kingdom	20%	40%	38%

Samozřejmě, že z čučení na takovouhle změť čísel dostane každý normální člověk leda vzteklinu, je třeba je taky nějak smysluplně zpracovat. Jenže vliv komunismu nelze kvantifikovat, nemohu nyní spočítat žádnou jednoduchou korelaci. Tudíž jsem se vykašlal na nějaké složitější statistické analýzy - za prvé to ani moc neumím, za druhé na to nemám čas, za třetí na to data beztak nestačí a za poslední nejsme ve vědeckém žurnálu. Proto jsem si udělal jen jednoduché box ploty (kdo neví, co to znamená, nechť koukne sem) a na nich nyní provedeme analýzu "kouknu a vidím".

Jak je vidno, ateismus má sice v post komunistických zemích mnohem širší rozpětí než v západních demokraciích - od 1% až po téměř 60% - ale například medián je u postkomunistických zemí pro ateismus nižší než u západních demokracií. Vypadá to spíše, že ČR se svým vysokým podílem bezvěrců je ve vztahu ke komunismu statistickou anomálií, nežli výsledkem pravidla.*

U deismu a teismu to vypadá trochu jinak. Podíl deistů je v postkomunistických zemích celkově vyšší a podíl teistů celkově nižší. To by možná mohlo naznačovat, že pokud snad komunismus vůbec měl na populaci s ohledem na víru nějaký vliv, tak to bylo obecně ve smyslu úbytku nikoliv věřících obecně, ale od věřících hlásících se ke konkrétní církvi směrem k věřícím typu "něcista". Což je v poslední době nesmírně populární stanovisko, i když v konečném důsledku je faktograficky na stejné úrovni s vírou v těhotné panny a po vodě chodící, z mrtvých vstávající čaroděje.

Samozřejmě má tato "analýza" hned několik problémů, a jsem si jich vědom. Počet respondentů v Eurobarometru byl poměrně malý. Země zde uvedené jsou různě velké, od malých po hodně velké. Některé postkomunistické země chybí úplně. Atd. atp. Nepochybně je tedy celá tato statistika zatížená velkou mírou chyby (a k tématu statistických chyb se ještě někdy vrátím).

Nicméně i v této podobě mi postačuje k jednomu tvrzení - za úbytkem víry v Čechách nestojí komunismus, ani rozumnost Čechů (jakkoliv bych si tohle přál), ani amorálnost církve, ani žádný další jiný, jednoduchý, černobílý faktor. Může se jednat, a zřejmě se i jedná, o pouhou statistickou anomálii, jež je jenom výsledkem souhry náhod a ničeho jiného.

*Statistickou anomálií je bývalé východní Německo. ČR se svým sotva třetinovým podílem ateistů je sice rovněž v posledním kvartilu, ale není to zase až tak výjimečné.

Zdroje:

Stránky