neděle 20. července 2014

Experimenten statistikoš - část 2

Po více než měsíci prakticky non-stop fyzické práce a absolutně minimalistického používání počítače jsem se rozhodl jeden víkend hodit na všechno bobek a nářadí jsem nechal odpočinout, zaslouží si to. Stejně bylo takové horko, že se nic dělat nedalo. Takže jsem mohl věnovat nějakou tu hodinku dalšímu vyhodnocení svého statistického experimentu. Konkrétně druhé části své předpovědi:
Rozdělím-li řady na kratší, stejně dlouhé úseky, řekněme 5-10 čísel dlouhé, budou tyto úseky samy o sobě poměrně dobře odpovídat tomu, co by bylo k očekávání od skutečně náhodného systému. Jejich celková distribuce ale bude více uniformní, než by tomu bylo u skutečně náhodného systému.
Nejprve je třeba upozornit na to, že je při absolutně doslovné interpretaci je to nesmysl, což jsem si uvědomil až dodatečně, když už bylo pozdě to reformulovat. Za prvé předpověď první se vylučuje s doslovnou interpretací této druhé předpovědi v případě, že by byla správná (což byla). Za druhé je omezený počet kombinací nul a jedniček, a žádné kombinace obsažené v číselných řadách jakýmkoliv způsobem nemohou nebýt možné v řadě generované náhodně. Takže, ačkoliv se mi to moc nelíbí, musím přiznat chybu a nejdříve trochu vysvětlit, co jsem myslel tím, co jsem napsal.
Měl jsem na mysli, že tvar distribuce u pěti - desetimístných řad bude přibližně stejný, jako u očekávaná distribuce u skutečně náhodných řad, ale "konce" této distribuce budou trochu přizvednuté a vrchol trochu nižší (současně v návaznosti na první předpověď je nevyhnutelné, že vrchol této distribuce bude trochu vystředěný oproti ideálu, což jsem si původně neuvědomil vůbec). Čili že budou správně převažovat řady oscilující kolem středu, ale řady na extrémech budou více než je zdrávo. Nejlépe to asi vysvětlí příklad.


Červená čára zobrazuje ideální distribuci sledované veličiny. V tomto případě jaké by bylo zastoupení pětimístných řad obsahujících 0 až 5 jedniček v nekonečně dlouhé řadě  náhodně generovaných čísel. Histogram zobrazuje jejich zastoupení v jedné řadě dodané čtenáři. Toto jsem tak nějak očekával. Ovšem toto není to, co jsem obdržel.

 To je opět nejlépe zobrazeno obrázkem, tentokráte větším:

 
Zde  už je vidět, že mému očekávání jakžtakž odpovídaly jenom tři z devíti dodaných řad (Řady 4, 5, 7). Zbývající vykazují poněkud slabší odchylky, než jsem očekával. Až na řadu 1 všechny vykazují zátěž k více jedničkám, jinak ale nic extra. Pro vizuální srovnání jeden diagram skutečně (pseudo)náhodné řady.

I když se jednalo o řady značně dlouhé, nemohu s klidným svědomím bez statistického testu a počítání p-hodnoty říci na základě pouhého "kouknu a vidím", zda se tyto distribuce značně významně liší od ideální binominální distribuce. Doma postrádám potřebný software a nemám tolik času se s tím pižlat ručně. Mírná zatíženost směrem k jedničkám ovšem statisticky významná je, to vyplynulo už z prvního vyhodnocení.

Teď jak to vypadá u desetimístných řad:
Víceméně by se k tomu dalo říci totéž, co k řadám pětimístným.

Závěrem by se tedy dalo na základě dostupných dat říci, že má předpověď platí pro přibližně polovinu lidí, ale polovina lidí vygenerovala poměrně věrohodné vzorce náhodných pětimístných řad. Věrohodné z pozice této jedné veličiny. Zda skutečně odpovídala alespoň nějaká ta řada tomu, co by se dalo očekávat od skutečně náhodného systému definitivně rozlousknu (snad) někdy příště.

pondělí 30. června 2014

Čas vandalů

Ještěže nemám pole. Protože kdyby mi nějaký vandal zlikvidoval porci úrody za 20 kapříků, asi by mi praskla žilka v mozku.

Zajímavá je diskuze pod článkem. Není tedy moc dlouhá, ale teď, v tuto chvíli, je tam k vidění zajímavý fenomén. Všechny příspěvky zmiňující, že se jedná o dílo jednoho nebo více lidských vandalů, jsou mínusovány. Všechny příspěvky bublající bláboly o záhadách, mikrovlnách a mimozemšťanech jsou plusovány.

Vidíme-li graffiti na zdi, kde včera večer nebylo, usoudíme, že to udělal vandal. A to bez ohledu na to, jak krásné či jak geometricky přesné je. Prakticky nikoho ani nenapadne tvrdit, že to udělali mimozemšťani. Víme, že graffiti dělají lidé. Jsou i chtěná graffiti, velmi krásná, dělaná na objednávku. Jsou graffiti, u kterých byl dotyčný vandal přistižen, nebo sám vystoupil z anonymity. Proto vidíme-li graffiti, na základě předchozí zkušenosti automaticky usoudíme, že je to práce lidských rukou.

Tomu se říká indukce - zobecňování závěrů.

Začne-li někdo tvrdit, že nějaké konkrétní graffiti vyrobili mimozemšťani, zpozorníme. Nic v naší každodenní zkušenosti nenapovídá, že by mimozemšťani malovali na zdi. Nikdo je u toho nikdy neviděl, nevyfotil, nenafilmoval. Obecně lidé moc nemají tendenci věřit blábolům o mimozemšťanech, když se jimi někdo snaží vysvětlit něco, co znají.

Tomu se říká skepticismus - opatrnost při posuzování výjimečných výroků.

Samozřejmě je, čistě hypoteticky, možné, že nějaké graffiti skutečně namalovali mimozemšťani. Ovšem toto tvrzení komplikuje vysvětlení daného fenoménu nad nezbytné minimum. Když něco mohou vyrobit lidé (byť jen hypoteticky), není nutné si přimýšlet jiné feonomény, jako mimozešťany, láry, zmoky, elfy, víly zubničky a transdimenzionální blorky.

To je princip Occamovy břitvy - minimalizace předpokladů potřebných pro vysvětlení jevu.

Z nějakého mně naprosto záhadného důvodu ale u kruhů v obilí to plno lidí, možná dokonce i většina, aplikuje úplně na ruby. Pro banální, minimalistické vysvětlení "udělali to lidi" se dožadují demonstrací a důkazů, a když jim jsou demonstrace dodány, začnou hýbat terčem. Odmítají zjevnou indukci "některé, i velmi komplikované, kruhy v obilí evidentně udělali lidé, proto není důvod předpokládat cokoliv jiného, než že všechny kruhy v obilí udělali lidé" a čím lepší a detailnější vysvětlení a důkazy jsou jim dodány, tím lepších a detailnějších důkazů se dožadují. Odmítají jednoduché vysvětlení zahrnující ovšem dovednosti, které oni osobně neznají (tj. lidi, kteří umí něco speciálního), ale složité vysvětlení, zahrnující neidentifikovatelné nevysvětlené cosi považují za hodné úvahy. Tak jako věřící se chytají dosud nevysvětlených a možná nevysvětlitelných  fenoménů v přírodních vědách a cpou do těchto mezer v poznáních svého absurdního boha, tak řada lidí se chytá toho mála kruhů v obilích, u nichž chybí jednoznačné důkazy o lidské činnosti, a cpou tam svoje mimozemšťany, mikrovlny a podobné blbosti.

Smiřte se s tím lidi. Kruhy v obilí jsou dílem lidí. I ty enormně přesné a komplikované. A pokud to tito lidé dělají bez souhlasu majitele pole, jsou to vandalové a přísluší jim trest, ne obdiv.

pátek 13. června 2014

Experimenten statistikoš - část 1

 Bouchněmež společně šampus. Konečně jsem se dostal k tomu, abych se alespoň trochu mohl podívat na statistický experiment, k němuž mi někteří z vás v loni mlaskavě dodali data.

Nejprve kratililinká rekapitulace:
Před více než rokem jsem ve článku "Sháním morčata" požádal čtenáře o spolupráci. Sedm se jich přihlásilo a společně mi opatřili devět číselných řad podle zadání, zaslaného mailem. O pár měsíců později jsem sběr dat definitivně ukončil a učinil určité předpovědi ve článku "Náhoda je vůl".

Dnes se budu věnovat první předpovědi, totiž této:
Takto získané řady čísel budou vykazovat významnou zátěž jedním směrem, k jedničkám či nulám.
Pokusné řady, jež jsem obdržel, si vedly v sumáři jak můžete vidět na přiložené minitabulce. Samozřejmě pokud nejste skutečně enormně talentovaný matematik, tak vám tato čísla sama osobě řeknou totéž, co mě. Všechny řady se liší od ideálního stavu 500 jedniček a 500 nul, ale jak moc je tato odchylka významná? Na první pohled to nevypadá až tak hrozně a analýza "kouknu a vidím" toho moc neřekne. Na první pohled, přiznám se bez mučení, jsem si už myslel, že moje první předpověď padla.

Ovšem statistika už nám říká něco jiného a pro názornost jsem výsledky vizualizoval. Černá, šrafovaná křivka zobrazuje jakou distribuci v počtu jedniček (nebo nul, to je phuck) by mělo nekonečno náhodných řad jedniček a nul, dlouhých tisíc čísel. Dlouhodobí čtenáři blogu by měli zpozornět, protože v tom grafu vidí Gaussovu křivku normálního roznložení, o níž už jsem psal. To je správně, ovšem Gaussova křivka to není. Zde vyobrazená distribuce není normální, nýbrž binomická, což je ovšem na této úrovni už jedno, liší se od distribuce normální tak málo, že to nestojí za řeč (toto je velmi důležitý statistický poznatek, k němuž se ještě vrátím - prozatím nechť vám to vrtá hlavou). Červeně označená plocha zahrnuje 95%, což je (není-li důvod pro něco jiného) považováno obecně za hranici, při níž jest vhodné minimálně zpozornět. Modré trojúhelníčky zobrazují, jak si vedly čtenáři dodané "náhodné" řady.

Zde už je zcela jasně vidět, že čtyři z devíti řad se pohybovaly mimo interval 95%,  dvě dokonce jsou už v oblastech, kde je pravděpodobnost generování takové řady skutečně náhodně pro všechny praktické účely nula (byť má určitou teoretickou, spočitatelnou hodnotu) a pouze dvě se jakžtakž blíží středu. Pravděpodobnost, že 44% z náhodně generovaných řad bude mimo 95% interval je 0,06%.

Takže závěrem lze říct, že tato předpověď byla potvrzena - lidmi vygenerované řady jedniček a nul obecně vykazují tendenci preferovat jedno nebo druhé číslo.

neděle 1. června 2014

A země se zachvěla...

Doslova. Užíval jsem si včera křásné počasí - ani moc horko, ani zima, dost sluníčka aby to bylo příjemné, ale ne tolik, abych se pekl. I usedl jsem ven, podělal nějakou práci a na ohniště jsem hodil nějakou starou trávu, staré chrastí a zpráchnivělý pařízek a zapálil to. Do uší jsem si pustil audioknihu, na drát napíchl klobásu a začal si ji opékat k obědu, když to přišlo.

BrrrrooumBUMBUMBrouuumBUMBUMBroooooooooum. Cítil jsem, jak se mi země zachvěla pod nohama. Takže když otec vyběhl z domu celý vyjukaný, vůbec mě to nepřekvapilo. Právě jsme zažili nejsilnější zemětřesení posledních let. Pro obyvatele Japonska či Kalifornie by to patrně nebyl vůbec důvod ke znepokojení, ale my jsme tady zvyklí, že dům neposkakuje.

Poslední takovéhle zemětřesení jsem zažil jako dítě a moc si toho nepamatuji. Údajně jsem popadl matku za ruku a táhl jí z domu, "Maminko, pojď rychle ven!". Doufejme, že teď bude nějakou dobu zase klid. Nerad bych, aby mi dům spadl na hlavu dřív, než ho zrenovuji a užiji si ho trošku v ne-havarijním stavu. No, na rozdíl od devaosmdesátých let minulého století nám tentokráte omítka nikde nepraskla a dům se zdá držet pořád ještě pohromadě. Asi ale přeci jenom vyztužím perlinkou všechny zdi, ona i prasklina neohrožující statiku domu je k nasrání.

Mým snem je, že nějaké takové zemětřesení zase hne trošku s podložím a ten pramen, co po řadě otřesů v devaosmdesátých letech vyrazil ve sklepě zase půjde jinam. Musím ale říct, že následující prakticky celý den menších i větších otřesů (tentokráte už jenom takové povahy, které člověk cítí/slyší uvnitř budov, kde je rezonance) moc uklidňující nebyly. To radši vodu ve sklepě.

Ne že by nedaleký zlom v zemské kůře moje přání nějak zajímala.

sobota 24. května 2014

Deskriptivní popis kvantitativního počítání humidní vlhkosti v reflektujícím zrcadle...

Používání cizích termitů neníz zcela bez rizota a může v některých konkávních případech vést až ke katastrálnímu fiakru.

Ne že by jejich užívání bylo jenom ukázkou inelekutálního sobismu, to není v žádném případě komplementární pravda. Jejich užití v určitém komunálním pretextu je skutečně relativní, neboť může deprimovat infiltrační obsah výroku či odstranit redakci a tím zkrátit dobu/objem textu potřebné pro transgresi potřebné deformace. Rovněž nelze inaugurovat nutnost rozšiřování národních laxativů v důsledku emigrace nových technofobií a dříve nevídaného globulárního kontraktu mezi národy.

Ovšem jsou i simulace, kdy se používání cizích či cize znějících slovíček zvrhne ve vertikální ekvidistant mastikace - hodně námahy a v konečném důsledku nic z toho, kromě osobního uspokojení (ne že by osobní uspokojení bylo nějak inhibitně zavrženíhodné, ale společenský komunismus je, že tato forma gravitace se neprovádí na veřejnosti, a před/s ostatními lidmi se revitalizuje pouze po vzájemném souhlasu).

Extra grácie jsou podle mého neskromného názoru například případy "zaslepování vědou", kdy jsou infiltračně impaktní logaritmické klamy druhu ignatio elena "okořeněný" obecně nepříliš používanými cizími slovy. Někdy dokonce i správně použitými, nicméně tato skutečnost je až sekulární k primátnímu účelu takovéhoto debetního obfuskantismu, jímž je fornikace lega argotujícího a zastrašení jeho oponenta, popřípadě prostá difrakce - odvedení pozornosti od validnosti argentu a vyvolání inkluze expedice. Měli jsme premiéra/prezidenta, který v tomto exkomunikoval (ani kuguár ani pretorium nejsou v tomto případě bohužel zcela na místě).

Příchod infernetu naštětí takovéto postmorbidistické eskalátory ztěžuje jak armatůrům, tak profesorionálům. Je ovšem nezbytné neztrácet prospektivu a nezapomínat, že Google univerzita z nikoho odborníka neudělá. Může z něj ale udělat velmi snadno Hobble Franka.   

pátek 16. května 2014

Páteční pidivěc: tohle nebouchá

Byl jsem na výletě v Orlických horách, bohužel ale krajina, i když nebyla nudná, neskýtala ani nic, co by extra lákalo k fotografování. Ovšem měl jsem ssebou v kapse svůj pidihled, pro všechny případy, a jeden případ se připadnul.

Chata, v níž naše už poměrně rozsáhlá banda byla ubytována, měla částečně neomítnuté zdi. Použitý materiál byl místní - metamorfované krystalické břidlice, fylity a svory. A některé kameny měly naprosto jasně viditelné stopy po neštovicích...

čtvrtek 1. května 2014

Čtvrteční čmáranice: takhle se nic nenaučíte!

Tradiční jarní nával práce s sebou přinesl neméně tradiční jarní zánět šlach v obou zápěstích. Kupodivu ale nikoliv z práce na zahradě, ale z práce na počítači. Takže zatímco mohu stále bez problémů mávat vidlemi, klikání myší či psaní na klávesnici jsou utrpením. Proto jsem obé v posledních týdnech omezil na absohlušní možné minimum a v příštích nejméně dvou týdnech asi ještě omezovat budu. Chilli na blogu se nic   moc  dít nebude a tohle je jenom taková upomínka toho, že jsem žiff.

Obrázek vznikl předloni v práci, při každoročním školení bezpečnosti práce. Tehdejší zástupkyně šéfa fabriky se mi naklonila přes rameno a nakvašeně řekla: "Wenn Sie Bäumchen malen werden, werden Sie Nichts lernen!" (Když si budete malovat stromečky, nic se nenaučíte!).

Sice jsem i ke svým nadřízeným občas mírně přidrzlý, zejména když jsem pořádně rozpumpovaný a/nebo mám hlad, ale tentokráte mne naštěstí zastavil pud sebezáchovy a odpověď "Za prvé už jsem to viděl šestkrát a znám to zpaměti, a za druhé mi kreslení si při přednáškách nikterak nepřekáželo v získání vysokoškolského diplomu." jsem spolkl.

Nemůžu říct, že bych oplakal její nedobrovolný odchod o pár měsíců později. Zajímavá věc tohlecto. Pracuji v laboratoři sedm let. Večer nám tam uklízí pořád stejná uklízečka, ve výrobě je pořád plno stejných lidí, kteří tam byli předtím, ale mí přímí nadřízení a jejich nadřízení se za tu dobu na svých polstrovaných manažerských židlích vystřídali tři-čtyřikrát.