Adam Cebula „Niepewność pomiarowa, czyli cztery dziurki w guziku z pętelką”

Para-Nauka Adam Cebula - 8 sierpnia 2018

Z czego się bierze zjawisko, że raz wychodzi tak, potem wręcz przeciwnie? A choćby z naiwnej wiary w statystykę. Gdy zrobimy prosty eksperyment – weźmiemy sobie dwoje ochotników i jednego będziemy karmić na przykład glutenowo, a drugiego bezglutenowo – to nam wyjdzie wedle rzutu monetą. Może lepiej, może gorzej, bozia raczy wiedzieć. Możemy robić sobie szczegółowe badania, co się dzieje w organizmie jednego i drugiego, ale z dużym prawdopodobieństwem wyjdzie z tego kiszka, bo dostaniemy multum niemożliwych do zinterpretowania danych. Nie będziemy mieli żadnych rozsądnych wniosków. Zmienność organizmu przykryje efekty wywołane odmienną dietą. Jeden wstaje rano, drugi się wysypia, jeden kocha bigos, inny ciastka, na obserwacje nakładają się dziesiątki, setki efektów silniejszych od tego, jaki może wywołać dieta. Przychodzi więc do głowy prosty i (można powiedzieć) genialny pomysł: weźmy tysiąc ochotników. Intuicja mówi, że zmienności organizmów powinny się jakoś uśrednić, a jeśli coś w tym dajmy na to glutenie jest na rzeczy, statystyka powinna to wyłapać.

Jeśli prawdą są opowieści na temat glutenu, to szkodzi on osobom z celiakią. Jeśli prawdą jest, że choruje na nią mniej niż 1% ludzi, to w 1000 ochotników może się znaleźć mniej niż 10 takich nieszczęśników. O ile nie wiemy o celiakii i jej związku z glutenem, to jak ich potraktujemy? Mniej więcej tak, jak lilię w rzutach monetą. Albo „cztery dziurki” – ktoś rąbnął pieniążek, a podrzucił guzik. Jeśli na 1000 osób znajdzie się kilku nieszczęśników, którzy zareagują na dietę wyjątkowo, to będziemy podejrzewać różne niecne rzeczy: nażarli się gdzieś zepsutego bigosu czy fasolki po bretońsku i teraz udają poszkodowanych.

To jest zespół oszukanej kostki do gry. Owszem możemy nią rzucać i domniemywać, że coś z nią nie tak, ale aby zrozumieć, co się dzieje, i wykluczyć przypadek typu że z rzutu monetą wyszły cztery dziurki albo lilia, że ten 1% uczestników eksperymentu nie podjada gdzieś na boku w taniej spelunie – to ochotnika, tak jak kostkę, musimy rozebrać na czynniki pierwsze. Kostkę trzeba obmierzyć suwmiarką, a ochotnika przebadać na celiakię. Wówczas dopiero wiemy, na czym stoimy.

Tymczasem większość takich programów badawczych, których rezultatem ma być konkretne zalecenie (jeść, pić albo unikać jak zarazy) stoi statystyką. Słówko się rzekło: człowiek (ba, zwierzę doświadczalne, choćby było muszką owocówką, a nawet jednokomórkowym pierwotniakiem) jest diabelnie skomplikowanym układem i nie panujemy nad nim.

Mam szczere podejrzenia, że sprawa ma silny związek z tym, co już kiedyś poruszałem – nieszczęsnym big data. W tym przypadku w znaczeniu dostępności masowych danych, które zdają się przydatne do wyciągnięcia z nich wniosków na temat zdrowia. Mamy na przykład skomputeryzowane rejestry pacjentów, być może da się do nich przykleić dane o popycie na różne produkty spożywcze z supermarketów i… I praca gotowa.

Powiedzmy jeszcze raz: i owszem, za pomocą statystyki da się nawet przekroczyć dokładność pomiarową przyrządu. Powiedzmy, że mierzymy długość ołówka miarką milimetrową. Przykładamy i dostajemy wynik 10 cm i coś pomiędzy 5 i 6 mm. Rysik znajduje się pomiędzy kreskami. Owszem, możemy na oko próbować dzielić miarkę, ale jak wiadomo, na oko to chłop w szpitalu itd. Weźmy z pozoru trochę wariacką metodę. Przy końcu ołówka kładziemy ziarnko piasku. Raz dokładamy do końca rysika, raz kładziemy tak, aby krawędź ziarnka nie wystawała za koniec rysika. Notujemy, ile razy ziarnko wystało nam poza kreskę oznaczającą 6 lub 5 milimetr. Po każdym pomiarze bierzemy nowe ziarno (ważna reguła!). W ten sposób zmieniamy losowo wynik pomiaru. I jeśli się uprzemy, możemy dostać wynik, zwyczajnie licząc średnią, że długość ołówka wynosi na przykład 105,3 mm z prawdopodobieństwem lepszym niż 90%. Cokolwiek już to znaczy, ale mamy dowód, że statystyka ma wielkie możliwości. Tak, jeśli się dobrze zrobi taki pomiar, potem możemy sprawdzić suwmiarką i okaże się, że jest bardzo blisko.

Aliści przypomnę: gdy dojdzie do badania statystyką kostki do gry, zatrzymamy się tylko na domniemaniach. Taki układ okazuje się już zbyt skomplikowanym, żeby badać go tak (w rzeczy samej) topornymi metodami.

Tymczasem w próbach dowiedzenia, że ten czy inny związek chemiczny na przykład działa rakotwórczo, jest ta sama filozofia, co w dokładnym mierzeniu ołówka za pomocą ziaren piasku. Lecz mamy problem taki jak w przypadku kostki do gry: naprawdę nie wiemy, co się dzieje.

Zaś w oszacowaniu niepewności pomiarowej jest paskudne zagadnienie, które psuje całkowicie przyjemność mieszania matematyką. To kwestia, czy pomiary są skorelowane, czy też nie. To dla przykładu. Znajdą się inne podobne. Niestety, bez znajomości i to dokumentnej, układu mierzącego, nie ruszymy jej skutecznie. Zaś z niej wynika istotny dla całości problem: czy możliwe jest, by wszystkie zebrane dane mogły się przesunąć w najbardziej niekorzystną stronę? Banalny przykład, mierzymy prąd i napięcie jednocześnie. Mierniki są elektroniczne, zasilane z sieci. W pewnym momencie zmienia się napięcie zasilające. No i oczywiście – choć stajemy na głowie, żeby wyświetlane wielkości nie zależały od zasilania, to zawsze trochę zależą. Są niestety powiązane ze sobą. Odjadą od rzeczywistej wartości zawsze w tę samą stronę. To już mniejsza, czy oba w górę, czy w dół, czy jeden tak, drugi przeciwnie, ważne, że jak się coś w sieci stanie, efekt zawsze się powtórzy tak samo. Wynik nie będzie statystyczny, będzie oszukany. Wyliczanie wartości średniej nie pomoże.

Przy opracowywaniu danych z eksperymentów, takich, gdzie mamy dziesiątki tysięcy osób, które na coś chorują albo nie, aby wyliczać średnią, musimy zakładać, że statystyka działa. Warto jeszcze przypomnieć: cały czas jest to próba zmierzenia ołówka z dokładnością, jaką daje suwmiarka, za pomocą szkolnej linijki. Prawie zawsze przy takich badaniach pracuje się na poziomie szumów. Jeśli weźmiemy pojedynczego osobnika, obadamy go i obmierzymy, niewiele nam wyjdzie – tyle że jest zdrów lub na coś narzeka. Lecz żadnych konkretnych relacji z tego nie wyciągniemy.

W każdym konkretnym przypadku liczba możliwych czynników, które dadzą w sumie taki czy inny wynik, jest za wielka, aby cokolwiek wykombinować. Mamy tylko tę nadzieję, że w masie wielkiej liczby przypadków jakimś cudem się uśrednią i zostaną nam tylko te, o które nam chodzi. Lecz trzeba mieć w głowie to ostrzeżenie, że wcale tak być nie musi.

Generalnie te zawiłe dywagacje można sprowadzić do jednego spostrzeżenia: jest milion powodów, by wyniki pomiarów opartych głównie o statystykę kompletnie zawiodły. Jeśli chcesz zmierzyć długość ołówka z dokładnością do 0,1 mm, to zdecydowanie lepiej wziąć suwmiarkę niż kombinować z jakimiś średnimi. A jeśli nie możesz wziąć suwmiarki, licz się z tym, że zamiast wyniku dostaniesz figę. W przypadku naszego eksperymentu z ziarnami piasku w pomiarze długości ważne jest, aby piasek miał losowe rozmiary ziaren. Jeśli nie ma, będzie prawdopodobnie kicha.

Ściągnij tekst:
Strony: 1234

Powiązane wpisy

Adam Cebula „Na początek pewna nudna przypowieść techniczna”
Felietony - 15 czerwca 2016

Wbrew pozorom wcale nie chodzi o akumulatorki. Ani o bateryjki. Oto Adam Cebula i jego poszukiwanie…

Adam Cebula „Ósme przykazanie na rok 2019”
Felietony - 25 marca 2019

Dawno temu wyczytałem, czemuż to poważny czytelnik nie sięga po fantastykę naukową.…

Red-Akcje nr 15
451 Fahrenheita - 8 lutego 2019

Giętkość dziennikarskiego języka niezmiennie zadziwia RedAkcję F-ta. Na portalu TVN24 czytamy w…

Do NOT follow this link or you will be banned from the site!