Statystyka z Sigmą — nauka na ostatnią chwilę

Po co to w ogóle?

Do tej pory pracowałeś z danymi, które już są. Masz listę ocen, liczysz średnią i rozrzut. Wszystko wiadomo, bo wszystko się już wydarzyło.

Teraz zmiana perspektywy. Rzucasz monetą — i jeszcze nie wiesz, co wypadnie. Nie ma listy wyników do policzenia. Jest tylko niepewność i jedna informacja: szansa na orła to mniej więcej pół na pół.

Jak opisać liczbą coś, co jeszcze się nie wydarzyło?

Tu wchodzi zmienna losowa. To po prostu sposób, żeby losowym wynikom przypisać liczby: orzeł = 1, reszka = 0. Zamiast mówić „wypadł orzeł", mówisz „ $X = 1$ ". I nagle da się z tym liczyć — można pytać o średni wynik, o rozrzut, o prawdopodobieństwo.

Mini quiz

Umawiamy się: orzeł = 1, reszka = 0. Ile wynosi X, zanim rzucisz monetą?

To jest cichy fundament całej reszty kursu. Bo wynik z próby — średnia z wylosowanych 100 osób — też jest zmienną losową. Za każdym losowaniem trochę inną. Kiedy zrozumiesz, że ma swój rozkład, swoją średnią i swój rozrzut, testy i przedziały ufności przestaną wyglądać jak czary.

Najpierw rozróżnimy zmienne skokowe i ciągłe, potem schemat Bernoulliego i rozkład dwumianowy.