neděle 29. dubna 2012

Destilace páté esence

Pro dnešní příspěvek jsem si opatřil pro zpestření reálná data přímo z práce. Šlo o jednoduchou záležitost, ovšem výsledky velmi dobře poslouží účelu článku.

Zákazník pochyboval o výsledcích testu jedné externí certifikované laboratoře - byla měřena teplota plastových dílů několik minut po vyjmutí z klimatické komory, kde byly předtím dlouhodobě zamrazeny na -20°C. A pánům manažerům se nezdálo, že by se ony plastové díly mohly ohřát tak rychle na teploty nad bodem mrazu a přesto pak zůstat v průběhu testů stále relativně chladné. Požadovalo se proto po nás, abychom zdokumentovali průběh ohřívání příslušných dílů po vyjmutí z -20°C do pokojové teploty.

Když mi byl problém předestřen, měl jsem chvíli pocit, že si ze mne někdo dělá legraci (ten mám bohužel často). Nejsem tedy žádný fyzikální génius, ale přesto jsem si v tomto konkrétním případě dovolil zahrát na vědátora a před provedením požadovaného testu jsem před zadavatelem učinil předpověď - teplota dílu bude růst zpočátku velmi rychle a toto tempo bude postupně zpomalovat, jak se teplota dílu bude blížit teplotě okolí. Ale jako už mnohokrát jsem se opět přesvědčil, že tak jako já spektakulárně selhávám v případech středoškolského učiva českého jazyka či historie, tak jiní selhávají v případě stejné úrovně poznatků věd přírodních. Mé predikci nebylo uvěřeno a byl vznesen vehementní požadavek tento banální, ale časžeroucí test provést.

S ohledem na to, že všechny kalibrované klimatické komory byly obsazené, byl jsem nucen použít nekalibrovaný mrazák, čili jsem díly mohl zmrazit pouze s přesností plus minus 5°C, což je dost široké rozhraní. Po stabilizaci pár hodin byly díly po jednom vyjmuty a položeny před bezkontaktní kalibrovaný IR teploměr a teplota byla kontinuálně měřena čtvrt hodiny se zápisem měřené hodnoty každou sekundu. A tady je výsledek pro první měřený díl (každopádně doporučuji kliknout pro zvětšení).

Zajímavé ale není to, že jsem měl pravdu já i certifikovaná laboratoř. Zajímavé je, že při pohledu zdálky to vypadá, že moje predikce byla splněna, avšak při pohledu zblízka je vidět, že je křivka značně zubatá. A chvílemi to dokonce vypadá, jako by díl měl teplotu několik sekund konstantní, nebo dokonce jakoby se pár sekund ochlazoval! Což, jak by každý měl vědět, není možné, odporuje to druhému zákonu termodynamiky. Coto? Inu, ruchy. I když jsem se snažil minimalizovat vliv prostředí - díl i teploměr byly po celou dobu pevně fixované, ve stínu, okno bylo zavřené a na každého, kdo kolem byť i jen prošel, jsem házel krajně nevrlé pohledy.

Co když si ale trochu statisticky pomůžeme, například tzv. klouzavým průměrem? Graf bude vypadat mnohem lépe, zuby se vyhladí a všecko bude eňo ňůňo (skoro).

Klouzavý průměr spočítaný vždy z pěti po sobě jdoucích hodnot (čili každých pěti sekund měření) křivku trochu vyhladí, ale pořád ještě jsou vidět jasně nerovnosti a krátkodobé trendy odchylující se od hlavního směru křivky.
Klouzavý průměr spočítaný z jedenácti po sobě jdoucích hodnot křivku vyhladí ještě lépe, ovšem rovněž ne dokonale. Šlo by pokračovat, ale článek by zbytečně kynul, takže jen konstatuji, že čím více hodnot je zahrnuto do klouzavého průměru, tím je křivka hladší. Lineární křivku by šlo s pomocí této metody vyhladit kompletně, pokud by nebyla moc zubatá, ale u nelineárních křivek (a tudíž i u této) po dosažení určité úrovně vždy dochází ke zkreslení skutečného trendu. Je třeba najít kompromis mezi přesností a hezkostí.

V případě, kdy je možné očekávat, že data lze vysvětlit nějakou závislostí popsatelnou matematickou funkcí, je samozřejmě nejlepší najít tuto funkci. To ovšem není nijak snadné a pro demonstrování toho, co mám v úmyslu, naštěstí ani nezbytné.

Již zde padlo slovo ruch. Ruch, čili náhodná složka obsažená v měření. Náhodná, tudíž nevyzpytatelná a nepředvídatelná? Správně. Špatně. Zkusme se podívat na to, jak se příslušný ruch chová, nejjednodušeji tak, že spočítáme rozdíl mezi klouzavým průměrem a přináležící skutečně naměřenou hodnotou. Po vynesení na bodový graf vzniknou tyto dva hezounké obrázky.


Vidíte už, kam tím mířím? Asi ne. Vypadá to jako totální chaos, a nezkušený laik (= i Charly před pár lety) by z čučení na tu změť teček začal asi leda tak šilhat a dostal ještě škytavku. Ale přesto je v tom zdánlivém chaosu určitý řád, který zkušené oko uvidí. Asi už tušíte, kam tahle trnitá cesta vede, nebudu vás tedy dále trápit (tedy ty, co dočetli až sem). Pohleďte na histogramy těchto odchylek po jejich zaokrouhlení na celá desetinná místa - na ose y je vynesena četnost dané odchylky v daných datech, čili například 163 krát je skutečně naměřená hodnota o 0,1 °C vyšší než přináležící klouzavý průměr z pěti hodnot.
Ano, rozložení ruchu odpovídá skutečně velmi přesně Gaussově křivce. Dokonce přesněji, než jsem čekal, když jsem si příslušná měření vzal domů ke zpracování pro účely článku. Při ještě lepší eliminaci vnějších vlivů a proměnných (žádný průvan, promenádující se kolegové a podlaha rozvibrovaná od náklaďáků, měření něčeho s konstantní teplotou a ne něčeho, co ji postupně mění) bychom takto získali Gaussovo rozložení vlastní použitému teploměru, ruchy, které budou při použití tohoto zařízení přítomny vždy dělej co dělej. Mám důvod se domnívat, že by víceméně odpovídalo tomu, jež vyšlo pro klouzavý průměr z 11 hodnot, vezměme to tedy coby poznatek pro závěr článku.

A co nám to říká? K čemu tenhle poznatek je? Říká nám, že když příslušným teploměrem změřím teplotu nějakého předmětu, je naměřená hodnota s 50% pravděpodobností přesná na plusminus jednu desetinu. Na 95% je přesná na plusminus dvě desetiny. A prakticky (nerovná se zcela) jistě je přesná na plusminus tři desetiny. A čím vícekráte něco tímto teploměrem změřím, tím více se kumulativní výsledek blíží realitě - ale nikdy není absolutně přesný.

A údajně právě takto Carl Friedrich Gauss normální rozložení, jež od té doby nese jeho jméno, objevil. Zpracovával geodetická měření a zjistil, že totéž měření dá pokaždé lehce jiné hodnoty - a že tyto hodnoty, byť na pohled náhodné, lze popsat matematickou funkcí. A ta matematická funkce nám umožňuje najít řád tam, kde byl zdánlivý chaos, a tak přiřadit míru přesnosti něčemu, co už ze samotné povahy reality úplně přesně zjistit nelze.

Ale proč se realita chová takhle blbě? Proč není možné prostě změřit například vzdálenost x přesně ale jen "přesně plusminus"? K tomu se ještě vrátím.

Zdroje pro případ, že by si snad někdo chtěl také hrát s čísílky:

Žádné komentáře:

Okomentovat