sobota 22. června 2013

Náhoda je vůl

Někdy v  budoucnu se vrhnu nikoliv z okna, ale na vyhodnocení svého blobového experimentu. A když už si hraju na vědátora, udělám to pořádně. Tzn. ještě před tím, než se podívám na sebraná data a začnu s nimi dělat nějaká vyhodnocení, formuluji hypotézu, již chci testovat, a předpověď, jíž by měla data podle této hypotézy odpovídat. A pak se podíváme, zda data hypotézu falzifikují či nikoliv.

Nejprve hypotéza:
  • Lidé obecně, a to většinou bez ohledu na vzdělání a inteligenci, jsou tak maximálně ještě dobří v posuzování krátkých sledů náhod, ale nejsou schopni správně posuzovat náhodnosti rozsáhlé či dlouhodobé trendy.
 Zadání, jež jsem rozeslal pokusným morčatům:
  • Potřebuji od Vás řadu dlouhou tisíc čísel - náhodně na střídačku jedniček a nul. Napsaných z hlavy za sebou, nejlépe v jednom sloupci excelové tabulky, ale klidně i jednoduše řada čísel napsaná v notepadu, tak jak vás náhodně napadnou. Zdůrazňuji - tak, jak vás napadnou, když se pokusíte ta náhodná čísla vygenerovat z hlavy, žádné dlouhé dumání, prostě jen nadatlujte náhodnou řadu jedniček a nul. Bez použití pomůcek pro generování skutečně náhodných řad čísel.
 Předpověď, jak data budou přibližně vypadat. Pokud tak vypadat nebudou, bude hypotéza falzifikována a budu muset formulovat jinou, možná drasticky:
  • Takto získané řady čísel budou vykazovat významnou zátěž jedním směrem, k jedničkám či nulám.
  • Rozdělím-li řady na kratší, stejně dlouhé úseky, řekněme 5-10 čísel dlouhé, budou tyto úseky samy o sobě poměrně dobře odpovídat tomu, co by bylo k očekávání od skutečně náhodného systému. Jejich celková distribuce ale bude více uniformní, než by tomu bylo u skutečně náhodného systému.
  • Rozdělím-li tyto řady na delší stejně dlouhé úseky, nad 20 čísel, už ani tyto úseky samy o sobě nebudou odpovídat tomu, co by se dalo čekat od náhodného systému. a jejich distribuce se bude hodně lišit od té u skutečně náhodného systému.
  • Rozdělím-li tyto řady na úseky vždy jenom stejných čísel jdoucí za sebou, nebude délka a distribuce těchto úseků odpovídat tomu, co by se dalo čekat od náhodného systému.
Očekávám, že ať budou výsledky jakékoliv, umožní mi demonstrovat důvody, proč lidé tak často podléhají některým chybám v úvaze a některým logickým klamům.

Všem, kdo se přihlásili do experimentu a dodali data děkuji. Nešel jsem do toho s přehnanými představami, už dávno vím, že kritizovat - mnohdy bez dat - je připravený kdekdo, ale pomoci málokdo. O to více si toho cením.

Žádné komentáře:

Okomentovat