Wzory

Cały zestaw wzorów ze statystyki — od podstawowych miar po regresję i indeksy. Pod każdym wzorem znajdziesz krótkie wyjaśnienie, skąd się bierze, oraz legendę symboli.

Szereg rozdzielczy

Pierwszy krok analizy: porządkujemy surowe dane i opisujemy, jak często pojawiają się poszczególne wartości.

Częstość względna

relative frequency
Skąd to się bierze

Częstość względna to udział danej wartości (lub klasy) w całej zbiorowości — liczebność cząstkową dzielimy przez liczebność całości. Suma wszystkich udziałów zawsze daje 1 (czyli 100%).

częstość względna i-tej wartości
liczebność i-tej wartości (klasy)
liczebność całej zbiorowości
liczba wartości (klas)

Dystrybuanta empiryczna

empirical CDF
Skąd to się bierze

Dystrybuanta mówi, jaki ułamek obserwacji jest mniejszy lub równy danej wartości. Powstaje przez narastające sumowanie częstości względnych (skumulowane udziały), więc rośnie od 0 do 1.

skumulowana częstość do wartości x
częstość względna s-tej wartości
najmniejsza i największa wartość cechy

Miary położenia (tendencji centralnej)

Liczby, które wskazują „środek” rozkładu — typową, przeciętną wartość cechy.

Średnia arytmetyczna

arithmetic mean
a) dane indywidualne
b) szereg rozdzielczy punktowy (ważona)
c) szereg rozdzielczy przedziałowy
Skąd to się bierze

Suma wszystkich wartości podzielona przez ich liczbę. Dla danych pogrupowanych każdą wartość „ważymy” jej liczebnością. W szeregu przedziałowym nie znamy dokładnych wartości, więc bierzemy środek przedziału — stąd przybliżenie.

średnia arytmetyczna
i-ta wartość cechy
środek i-tego przedziału
liczebność i częstość i-tej klasy

Średnia harmoniczna

harmonic mean
Skąd to się bierze

Odwrotność średniej arytmetycznej z odwrotności. Stosowana, gdy uśredniamy wielkości względne (np. prędkości, wydajności) — tam zwykła średnia zawyżałaby wynik.

średnia harmoniczna
i-ta wartość cechy (dodatnia)

Średnia geometryczna

geometric mean
Skąd to się bierze

Pierwiastek n-tego stopnia z iloczynu wartości. Naturalna miara przeciętnego tempa zmian (procesy mnożące się, np. stopy wzrostu w kolejnych okresach).

średnia geometryczna
i-ta wartość cechy (dodatnia)

Mediana

median
a) dane indywidualne
b) szereg rozdzielczy punktowy
c) szereg rozdzielczy przedziałowy
Skąd to się bierze

Wartość dzieląca uporządkowaną zbiorowość na dwie równe połowy — 50% obserwacji jest poniżej, 50% powyżej. Dla danych przedziałowych interpolujemy liniowo wewnątrz przedziału, w którym dystrybuanta przekracza 0,5.

mediana (kwartyl drugi)
dolna granica przedziału mediany
rozpiętość przedziału mediany
częstość względna przedziału mediany
dystrybuanta przedziału poprzedzającego

Kwantyl rzędu p

p-th quantile
Skąd to się bierze

Uogólnienie mediany: wartość, poniżej której leży udział p obserwacji. Wzór to liniowa interpolacja w przedziale, w którym skumulowana częstość po raz pierwszy osiąga p.

rząd kwantyla: 0,25 → Q₁, 0,5 → m_e, 0,75 → Q₃
dolna granica przedziału kwantyla
rozpiętość przedziału kwantyla
częstość względna przedziału kwantyla
dystrybuanta przedziału poprzedzającego

Dominanta (moda)

mode
Skąd to się bierze

Wartość, która występuje najczęściej. W szeregu przedziałowym leży w klasie o największej liczebności; wzór koryguje jej położenie względem sąsiednich (bardziej lub mniej licznych) klas.

dominanta
dolna granica przedziału dominanty
liczebność przedziału dominanty
liczebności przedziału poprzedniego i następnego
rozpiętość przedziału dominanty

Momenty

Wspólny „budulec” wielu miar — średnie potęg wartości (zwykłe) lub odchyleń od średniej (centralne).

Moment zwykły rzędu k

raw moment
Skąd to się bierze

Średnia z k-tych potęg wartości. Dla k=1 daje zwykłą średnią, a M₂ jest składnikiem wariancji (wzór skrócony).

moment zwykły rzędu k
i-ta wartość cechy
liczebność zbiorowości

Moment centralny rzędu k

central moment
Skąd to się bierze

Średnia z k-tych potęg odchyleń od średniej. M₂′ to wariancja (rozproszenie), M₃′ mierzy asymetrię, a M₄′ — spłaszczenie rozkładu.

moment centralny rzędu k
odchylenie od średniej

Miary zmienności — klasyczne

Jak bardzo wartości różnią się od średniej. Miary klasyczne korzystają ze wszystkich obserwacji.

Rozstęp

range
Skąd to się bierze

Najprostsza miara rozproszenia — odległość między skrajnymi wartościami. Bardzo wrażliwa na wartości odstające.

rozstęp
wartość największa i najmniejsza

Wariancja (obciążona)

variance
a) dane indywidualne
b) szereg rozdzielczy punktowy
c) szereg rozdzielczy przedziałowy
Skąd to się bierze

Średnia z kwadratów odchyleń od średniej. Kwadrat sprawia, że odchylenia nie znoszą się (suma zwykłych odchyleń = 0) i mocniej karze duże odstępstwa. Wzór skrócony „średnia kwadratów minus kwadrat średniej” bywa wygodniejszy w rachunkach.

wariancja (obciążona)
odchylenie od średniej
środek przedziału

Wariancja nieobciążona

sample variance (unbiased)
Skąd to się bierze

Wersja stosowana, gdy z próby wnioskujemy o populacji. Dzielimy przez n−1 (a nie n), bo średnia z próby „zużywa” jeden stopień swobody — bez tej poprawki wariancję systematycznie zaniżalibyśmy.

wariancja nieobciążona
liczba stopni swobody

Odchylenie standardowe

standard deviation
Skąd to się bierze

Pierwiastek z wariancji — sprowadza miarę rozproszenia z powrotem do jednostek cechy, więc jest łatwiej interpretowalne niż wariancja.

odchylenie standardowe
wariancja

Klasyczny współczynnik zmienności

coefficient of variation
Skąd to się bierze

Względna miara rozproszenia — odchylenie standardowe odniesione do średniej. Bezwymiarowa, więc pozwala porównać zmienność cech wyrażonych w różnych jednostkach lub o różnych poziomach.

współczynnik zmienności
odchylenie standardowe
średnia arytmetyczna

Miary zmienności — pozycyjne

Oparte na kwartylach, a nie na średniej — dlatego odporne na wartości odstające.

Rozstęp ćwiartkowy (międzykwartylowy)

interquartile range, IQR
Skąd to się bierze

Szerokość przedziału, w którym mieści się środkowe 50% obserwacji. Pomija skrajne 25% z dołu i z góry, więc nie reaguje na wartości odstające.

kwartyl pierwszy i trzeci

Odchylenie ćwiartkowe

quartile deviation
Skąd to się bierze

Połowa rozstępu ćwiartkowego — przeciętne odchylenie kwartyli skrajnych od mediany. Pozycyjny odpowiednik odchylenia standardowego.

odchylenie ćwiartkowe
rozstęp ćwiartkowy

Pozycyjny współczynnik zmienności

quartile coefficient of variation
Skąd to się bierze

Względna miara rozproszenia w wersji pozycyjnej — odchylenie ćwiartkowe odniesione do mediany. Używamy go, gdy w danych są wartości odstające.

pozycyjny współczynnik zmienności
odchylenie ćwiartkowe
mediana

Miary asymetrii

Czy rozkład jest symetryczny, czy „przechylony” w jedną stronę.

Trzeci moment centralny

third central moment
Skąd to się bierze

Średnia z sześcianów odchyleń. Nieparzysta potęga zachowuje znak: dodatnie odchylenia (długi ogon w prawo) dają wynik dodatni, ujemne — ujemny. Stąd mierzy kierunek asymetrii.

trzeci moment centralny
sześcian odchylenia od średniej

Klasyczny współczynnik asymetrii

skewness
Skąd to się bierze

Trzeci moment centralny standaryzujemy przez sześcian odchylenia standardowego, by uzyskać miarę bezwymiarową. A>0 → ogon w prawo (prawostronna), A<0 → ogon w lewo, A≈0 → symetria.

współczynnik asymetrii (skośność)
trzeci moment centralny
sześcian odchylenia standardowego

Współzależność dwóch cech

Mierzymy, czy i jak silnie dwie cechy zmieniają się razem.

Kowariancja

covariance
Skąd to się bierze

Średnia z iloczynów odchyleń obu cech. Gdy wartości powyżej średniej w X idą w parze z wartościami powyżej średniej w Y, iloczyny są dodatnie → dodatnia kowariancja (cechy rosną razem). Jej wadą jest zależność od jednostek.

kowariancja cech X i Y
odchylenie X od średniej
odchylenie Y od średniej

Współczynnik korelacji liniowej Pearsona

Pearson correlation
Skąd to się bierze

Kowariancja podzielona przez iloczyn odchyleń standardowych — standaryzacja, która usuwa wpływ jednostek i zamyka wynik w przedziale [−1, 1]. |r| bliskie 1 oznacza silną zależność liniową, r≈0 — jej brak.

współczynnik korelacji Pearsona, r ∈ [−1, 1]
kowariancja
odchylenia standardowe cech X i Y

Współczynnik korelacji rang Spearmana

Spearman rank correlation
Skąd to się bierze

Korelacja Pearsona policzona na rangach (pozycjach) zamiast surowych wartości. Mierzy zależność monotoniczną (niekoniecznie liniową) i jest odporna na wartości odstające. d_i to różnica rang danej obserwacji.

współczynnik korelacji rang, r_S ∈ [−1, 1]
różnica rang i-tej obserwacji w obu cechach
liczba obserwacji

Zmienna losowa

Przejście od opisu danych do rachunku prawdopodobieństwa — model losowy zjawiska.

Funkcja prawdopodobieństwa (zmienna skokowa)

probability mass function
Skąd to się bierze

Dla zmiennej skokowej przypisuje każdej możliwej wartości jej prawdopodobieństwo. Ponieważ któraś z wartości na pewno wystąpi, prawdopodobieństwa muszą sumować się do 1.

prawdopodobieństwo wartości x_i
zmienna losowa

Dystrybuanta zmiennej losowej

cumulative distribution function
Skąd to się bierze

Prawdopodobieństwo, że zmienna przyjmie wartość nie większą niż x. Dla zmiennej skokowej sumujemy prawdopodobieństwa wszystkich wartości do x włącznie — funkcja rośnie schodkowo od 0 do 1.

dystrybuanta
prawdopodobieństwo wartości x_i

Funkcja gęstości (zmienna ciągła)

probability density function
Skąd to się bierze

Dla zmiennej ciągłej prawdopodobieństwo pojedynczego punktu wynosi 0, więc opisujemy je gęstością. Prawdopodobieństwo to pole pod wykresem gęstości na danym przedziale; całe pole pod krzywą równa się 1.

funkcja gęstości
prawdopodobieństwo trafienia w przedział

Wartość oczekiwana

expected value
zmienna skokowa
zmienna ciągła
Skąd to się bierze

Średnia ważona możliwych wartości, gdzie wagami są prawdopodobieństwa — „przeciętny” wynik w długiej serii powtórzeń. To odpowiednik średniej arytmetycznej dla modelu losowego.

wartość oczekiwana
prawdopodobieństwo wartości x_i
gęstość (przypadek ciągły)

Wariancja zmiennej losowej

variance of a random variable
Skąd to się bierze

Oczekiwany kwadrat odchylenia od wartości oczekiwanej — miara rozproszenia rozkładu. Druga postać (moment drugi minus kwadrat średniej) jest wygodniejsza do liczenia.

wariancja zmiennej losowej
wartość oczekiwana
odchylenie standardowe ZL

Standaryzacja

standardization
Skąd to się bierze

Przesuwamy rozkład o wartość oczekiwaną i skalujemy przez odchylenie standardowe. Powstała zmienna U ma E(U)=0 i D(U)=1 — to pozwala korzystać z jednej tablicy rozkładu standardowego dla dowolnego rozkładu normalnego.

zmienna standaryzowana
wartość oczekiwana i odchylenie standardowe X

Wybrane rozkłady

Gotowe modele najczęstszych sytuacji losowych.

Rozkład zero-jedynkowy (dwupunktowy)

Bernoulli distribution
Skąd to się bierze

Model pojedynczej próby z dwoma wynikami: sukces (1) z prawdopodobieństwem p lub porażka (0). Podstawowy klocek rozkładu dwumianowego.

prawdopodobieństwo sukcesu
1 = sukces, 0 = porażka

Rozkład dwumianowy

binomial distribution
Skąd to się bierze

Liczba sukcesów w n niezależnych próbach o stałym p. Składnik p^k(1−p)^{n−k} to prawdopodobieństwo konkretnego układu, a symbol Newtona liczy, na ile sposobów k sukcesów może się rozłożyć.

liczba sukcesów, k = 0,1,…,n
liczba prób
prawdopodobieństwo sukcesu
symbol Newtona (liczba kombinacji)

Rozkład Poissona

Poisson distribution
Skąd to się bierze

Liczba rzadkich zdarzeń w ustalonym czasie lub obszarze (np. zgłoszenia na infolinię). Przybliża rozkład dwumianowy, gdy n jest duże, a p małe, przy λ = np.

średnia liczba zdarzeń (intensywność)
liczba zdarzeń, k = 0,1,2,…
podstawa logarytmu naturalnego

Rozkład normalny N(m, σ)

normal distribution
Skąd to się bierze

Symetryczny rozkład „dzwonowy”, do którego dąży suma wielu drobnych, niezależnych wpływów (twierdzenie graniczne). Opisany dwoma parametrami: położeniem m i rozproszeniem σ.

wartość oczekiwana (środek)
odchylenie standardowe

Rozkład normalny standardowy N(0, 1)

standard normal distribution
Skąd to się bierze

Rozkład normalny po standaryzacji (m=0, σ=1). Stablicowany raz na zawsze — każdy inny rozkład normalny sprowadzamy do niego przez standaryzację U = (X−m)/σ.

gęstość rozkładu standardowego
zmienna standaryzowana

Rozkłady statystyk z próby i twierdzenia graniczne

Most między próbą a populacją: jak zachowuje się średnia z próby i kiedy działa rozkład normalny.

Rozkład średniej — σ znane

Skąd to się bierze

Gdy populacja jest normalna i znamy σ, średnia z próby ma rozkład normalny o odchyleniu σ/√n (błąd standardowy). Po standaryzacji otrzymujemy rozkład N(0,1).

średnia z próby
średnia w populacji
odchylenie standardowe populacji
liczebność próby

Rozkład średniej — σ nieznane

Skąd to się bierze

Gdy σ jest nieznane, zastępujemy je odchyleniem z próby s. Dodatkowa niepewność szacunku sprawia, że statystyka ma rozkład t-Studenta (cięższe ogony niż normalny), zbiegający do N(0,1) przy dużym n.

odchylenie standardowe z próby (nieobciążone)
liczba stopni swobody

Centralne twierdzenie graniczne (Lindeberg–Lévy)

central limit theorem
Skąd to się bierze

Dla dużej próby (n≥100) średnia ma w przybliżeniu rozkład normalny — niezależnie od kształtu rozkładu populacji. To dlatego rozkład normalny pojawia się w testach i przedziałach ufności tak często.

rozkład asymptotyczny (graniczny)
warunek dużej próby

Rozkład częstości (de Moivre–Laplace)

Skąd to się bierze

Szczególny przypadek CTG dla rozkładu zero-jedynkowego: udział sukcesów w dużej próbie ma w przybliżeniu rozkład normalny wokół prawdziwego p. Podstawa testów i przedziałów ufności dla proporcji.

częstość (udział) sukcesów w próbie
prawdopodobieństwo sukcesu w populacji

Estymacja przedziałowa

Zamiast jednej liczby podajemy przedział, który z zadanym prawdopodobieństwem (1−α) zawiera nieznany parametr.

Przedział ufności dla średniej — σ znane

Skąd to się bierze

Wokół średniej z próby budujemy przedział o połowie szerokości równej błędowi standardowemu pomnożonemu przez wartość krytyczną u_α z rozkładu normalnego. Im większa próba, tym węższy przedział.

wartość krytyczna N(0,1), P(|U|≥u_α)=α
współczynnik ufności
znane odchylenie populacji

Przedział ufności dla średniej — σ nieznane

Skąd to się bierze

Jak wyżej, ale σ zastępujemy przez s z próby, a wartość krytyczną bierzemy z rozkładu t-Studenta o n−1 stopniach swobody (szerszy przedział odzwierciedla dodatkową niepewność). Dla dużej próby zamiast t można użyć u_α.

wartość krytyczna rozkładu t, v=n−1
odchylenie standardowe z próby

Przedział ufności dla proporcji p

Skąd to się bierze

Dla dużej próby (n≥100) częstość ma w przybliżeniu rozkład normalny (de Moivre–Laplace), więc przedział budujemy analogicznie jak dla średniej, używając błędu standardowego proporcji.

częstość sukcesów z próby
wartość krytyczna N(0,1)

Minimalna liczebność próby — szacowanie m

Skąd to się bierze

Wynika z przekształcenia połowy szerokości przedziału ufności (d = u_α·σ/√n) względem n. Mówi, ilu obserwacji potrzeba, by błąd szacunku nie przekroczył d przy ufności 1−α.

dopuszczalny (maksymalny) błąd szacunku
wartość krytyczna N(0,1)
wariancja populacji (lub jej oszacowanie)

Minimalna liczebność próby — szacowanie p

Skąd to się bierze

Analogicznie do średniej, dla proporcji. Gdy p nie jest znane, w bezpiecznym wariancie przyjmuje się p=0,5 (maksymalizuje p(1−p), a więc i wymaganą liczebność).

dopuszczalny błąd szacunku
proporcja (lub 0,5 w wariancie ostrożnym)

Weryfikacja hipotez — jedna próba

Sprawdzamy, czy dane są zgodne z założeniem o parametrze populacji. Liczymy statystykę testową i porównujemy z wartością krytyczną.

Test dla średniej — σ znane

Skąd to się bierze

Mierzymy, o ile błędów standardowych średnia z próby odbiega od wartości m₀ z hipotezy H₀. Duże |U| (powyżej u_α) oznacza, że taka różnica jest mało prawdopodobna przy prawdziwym H₀ — odrzucamy hipotezę.

wartość średniej z hipotezy H₀
statystyka testowa

Test dla średniej — σ nieznane

Skąd to się bierze

Wariant z nieznanym σ (zastąpionym przez s). Statystyka ma rozkład t-Studenta o n−1 stopniach swobody. Dla dużej próby rozkład t praktycznie pokrywa się z N(0,1).

odchylenie z próby (nieobciążone)
stopnie swobody

Test dla proporcji p

Skąd to się bierze

Dla dużej próby (n≥100) standaryzujemy częstość z próby względem p₀ z hipotezy, używając błędu standardowego liczonego przy założeniu prawdziwości H₀.

wartość proporcji z hipotezy H₀
częstość z próby

Test dla wariancji

Skąd to się bierze

Porównuje wariancję z próby z hipotetyczną σ₀². Suma kwadratów standaryzowanych odchyleń ma rozkład chi-kwadrat o n−1 stopniach swobody (rozkład niesymetryczny, więc obszary krytyczne odczytujemy oddzielnie).

wartość wariancji z hipotezy H₀
wariancja nieobciążona z próby
stopnie swobody

Weryfikacja hipotez — dwie próby

Porównujemy dwie zbiorowości: czy różnią się średnimi, proporcjami lub zmiennością.

Różnica średnich — σ znane (próby niezależne)

Skąd to się bierze

Różnicę średnich standaryzujemy przez błąd standardowy różnicy (wariancje obu prób się sumują, bo próby są niezależne). H₀ zwykle mówi, że m₁=m₂, czyli oczekiwana różnica = 0.

średnie z dwóch prób
znane odchylenia populacji
liczebności prób

Różnica średnich — σ nieznane, równe (próby niezależne)

Skąd to się bierze

Gdy σ są nieznane, ale jednakowe, łączymy informację o zmienności z obu prób w jedną wariancję połączoną s_p² (średnia ważona stopniami swobody). Statystyka ma rozkład t o v = n₁+n₂−2 stopniach swobody.

wariancja połączona (pooled)
wariancje z prób
stopnie swobody

Różnica średnich — duże próby

Skąd to się bierze

Przy dużych próbach z CTG korzystamy z rozkładu normalnego, a nieznane σ zastępujemy odchyleniami z prób — bez konieczności zakładania równości wariancji.

wariancje z prób

Różnica średnich — próby zależne

Skąd to się bierze

Dla par powiązanych (np. pomiar przed i po) analizujemy różnice R_i wewnątrz par. Sprowadza to problem do testu jednej próby dla średniej różnic — zwykle H₀: m_R = 0.

różnica w i-tej parze
średnia różnic
odchylenie standardowe różnic

Różnica proporcji

Skąd to się bierze

Pod H₀ (p₁=p₂) najlepszym oszacowaniem wspólnej proporcji jest częstość łączna p̂ z obu prób. Używamy jej do policzenia błędu standardowego różnicy. Wymaga dużych prób.

częstości z obu prób
częstość łączna (pooled)

Równość wariancji (test F)

Skąd to się bierze

Iloraz wariancji dwóch prób. W liczniku umieszczamy większą wariancję, więc F≥1; jeśli próby pochodzą z populacji o równych wariancjach, iloraz powinien być bliski 1. Duże F (powyżej F_α) odrzuca H₀.

wariancje z prób (s₁²≥s₂²)
stopnie swobody licznika i mianownika

Analiza wariancji (ANOVA)

Porównanie średnich w wielu grupach naraz — przez rozłożenie całkowitej zmienności na część międzygrupową i wewnątrzgrupową.

Rozkład sumy kwadratów

Skąd to się bierze

Całkowite zróżnicowanie wyników (SKC) rozkłada się na zróżnicowanie między grupami (SKM — efekt podziału) i wewnątrz grup (SKW — zmienność losowa). Na tym podziale opiera się cały test.

suma kwadratów całkowita (SST)
suma kwadratów międzygrupowa (SSB)
suma kwadratów wewnątrzgrupowa (SSE)

Statystyka F

Skąd to się bierze

Porównujemy przeciętną zmienność między grupami z przeciętną zmiennością wewnątrz grup (obie podzielone przez stopnie swobody → wariancje). Gdy grupy różnią się średnimi, licznik rośnie i F jest duże — odrzucamy H₀: m₁=…=m_r.

wariancja międzygrupowa
wariancja wewnątrzgrupowa (resztowa)
liczba grup
łączna liczebność

Regresja liniowa

Dopasowujemy prostą opisującą zależność Y od X metodą najmniejszych kwadratów (MNK).

Model i funkcja regresji

Skąd to się bierze

Zakładamy liniową zależność Y od X z losowym składnikiem ε (czynniki nieuwzględnione). Z danych szacujemy współczynniki α i β, otrzymując prostą teoretyczną ŷ.

współczynnik kierunkowy (nachylenie)
wyraz wolny (przecięcie)
składnik losowy

Oceny parametrów (MNK)

Skąd to się bierze

MNK dobiera prostą tak, by suma kwadratów reszt była najmniejsza. Nachylenie wychodzi jako kowariancja podzielona przez wariancję X, a prosta zawsze przechodzi przez punkt (x̄, ȳ) — stąd wzór na β̂.

ocena nachylenia
ocena wyrazu wolnego
kowariancja X i Y
wariancja X

Wariancja resztowa

Skąd to się bierze

Średni kwadrat reszt (różnic między wartością empiryczną a teoretyczną). Dzielimy przez n−2, bo model „zużył” dwa stopnie swobody na oszacowanie α i β. Mierzy, jak mocno punkty odstają od prostej.

reszta (błąd) i-tej obserwacji
wartość teoretyczna z modelu
odchylenie standardowe składnika resztowego

Współczynnik determinacji R²

Skąd to się bierze

Udział zmienności Y wyjaśnionej przez model w całkowitej zmienności Y. R²∈[0,1]: im bliżej 1, tym lepiej prosta opisuje dane. Dla regresji prostej R² = r² (kwadrat korelacji).

współczynnik determinacji
odchylenie wyjaśnione przez model
odchylenie całkowite

Indeksy statystyczne

Mierzą zmiany zjawisk w czasie — pojedynczych (indywidualne) i złożonych z wielu składników (agregatowe).

Indeksy indywidualne

Skąd to się bierze

Stosunek wielkości z okresu badanego (1) do podstawowego (0). Indeks wartości rozkłada się na iloczyn indeksu cen i indeksu ilości, bo wartość = cena × ilość.

cena w okresie podstawowym i badanym
ilość w okresie podstawowym i badanym
wartość

Przyrosty (łańcuchowe i jednopodstawowe)

absolutny
względny
Skąd to się bierze

Przyrost absolutny to zwykła różnica poziomów, względny — ta różnica odniesiona do poziomu odniesienia (daje tempo zmian). Łańcuchowe porównują z okresem poprzednim, jednopodstawowe — ze stałą bazą.

poziom zjawiska w okresie t
poziom w okresie poprzednim
poziom w stałym okresie podstawowym

Średnie tempo zmian

Skąd to się bierze

Średnia geometryczna indeksów łańcuchowych — bo zmiany w czasie kumulują się mnożąco. Iloczyn indeksów łańcuchowych „teleskopuje się” do ilorazu poziomu końcowego i początkowego.

średnie tempo (przeciętny indeks łańcuchowy)
poziom początkowy i końcowy

Agregatowy indeks wartości

Skąd to się bierze

Stosunek łącznej wartości całego koszyka w okresie badanym do podstawowego. Zmieniają się jednocześnie ceny i ilości — dlatego dalej rozdziela się go na indeksy cen i ilości.

cena i ilość j-tego dobra
sumowanie po składnikach agregatu

Agregatowy indeks cen

Laspeyresa (ilości z okresu 0)
Paaschego (ilości z okresu 1)
Fishera (średnia geom.)
Skąd to się bierze

Żeby zmierzyć „czysty” wpływ cen, trzeba ustalić ilości (wagi). Laspeyres bierze ilości z okresu bazowego, Paasche — z badanego, a Fisher godzi oba podejścia ich średnią geometryczną.

indeks cen Laspeyresa
indeks cen Paaschego
indeks cen Fishera

Agregatowy indeks ilości

Laspeyresa (ceny z okresu 0)
Paaschego (ceny z okresu 1)
Fishera (średnia geom.)
Skąd to się bierze

Analogicznie do indeksu cen, lecz teraz „zamrażamy” ceny, by wyizolować wpływ zmian ilości. Wybór okresu cen (0 lub 1) odróżnia formułę Laspeyresa od Paaschego.

indeksy ilości: Laspeyresa, Paaschego, Fishera

Równość indeksowa

Skąd to się bierze

Indeks wartości zawsze daje się rozłożyć na indeks cen i indeks ilości — pod warunkiem dopasowania formuł (Laspeyres cen z Paaschem ilości i odwrotnie; Fisher z Fisherem). To spójnościowa kontrola obliczeń.

agregatowy indeks wartości

Jak korzystać z tablic statystycznych

Tablice podają wartości rozkładów, których nie liczy się ręcznie. Kluczowe: poprawnie dobrać tablicę, wiersz (stopnie swobody) i kolumnę (poziom α).

Tablica 1 — dystrybuanta N(0,1)

Skąd to się bierze

Dla danego u (≥0) odczytujemy pole pod krzywą normalną na lewo od u — czyli prawdopodobieństwo, że U≤u. Wiersz wskazuje u do jednego miejsca po przecinku, kolumna dodaje drugą cyfrę (np. u=1,96 → wiersz 1,9, kolumna 0,06). Dla wartości ujemnych: Φ(−u) = 1 − Φ(u).

wartość dystrybuanty (prawdopodobieństwo)
wartość standaryzowana

Tablica 2 — wartości krytyczne N(0,1)

Skąd to się bierze

Działa „odwrotnie” do Tablicy 1: dla zadanego poziomu α odczytujemy wartość krytyczną u_α (np. α=0,05 → u_α=1,96). Używana w testach dwustronnych i przy budowie przedziałów ufności.

wartość krytyczna rozkładu normalnego
poziom istotności (pole w obu ogonach)

Tablica 3 — rozkład t-Studenta

Skąd to się bierze

Wartość krytyczną t_{α,v} znajdujemy na przecięciu wiersza ze stopniami swobody v i kolumny z poziomem α. Im mniejsze v, tym większa wartość krytyczna (cięższe ogony). Ostatni wiersz (v=∞) pokrywa się z u_α z Tablicy 2.

wartość krytyczna rozkładu t
liczba stopni swobody (np. n−1)

Tablica 4 — rozkład chi-kwadrat

Skąd to się bierze

Rozkład χ² jest niesymetryczny i dotyczy wartości dodatnich, dlatego tablica podaje wartości krytyczne osobno dla różnych α (także bliskich 1 — do lewego ogona). Wiersz to stopnie swobody v, kolumna to α.

wartość krytyczna rozkładu chi-kwadrat
stopnie swobody

Tablice 5–8 — rozkład F (Snedecora)

Skąd to się bierze

Każda tablica odpowiada jednemu poziomowi α (stąd 4 oddzielne tablice). Wartość krytyczną odczytujemy na przecięciu kolumny v₁ (stopnie swobody licznika) i wiersza v₂ (mianownika). Stosowana w teście równości wariancji i w ANOVA.

wartość krytyczna rozkładu F
stopnie swobody licznika
stopnie swobody mianownika