Statystyka z Sigmą — nauka na ostatnią chwilę

Po co to w ogóle?

Masz cechę ilościową — powiedzmy BMI — i cechę jakościową z kilkoma kategoriami, np. wykształcenie: podstawowe, średnie, wyższe. Pytanie brzmi: czy średnie BMI w tych grupach się różnią?

Znasz już test różnicy dwóch średnich. Problem w tym, że on obsługuje dokładnie dwie grupy. A tu masz trzy, cztery, czasem więcej.

Mini quiz

Masz 5 grup do porównania. Czemu nie zrobić tego po prostu wieloma testami parami?

Pierwszy odruch: no to porównajmy je parami — podstawowe vs średnie, podstawowe vs wyższe, średnie vs wyższe. Niby działa, ale wpadasz w pułapkę. Każdy pojedynczy test ma jakieś ryzyko fałszywego alarmu ( $\alpha$ ). Im więcej testów odpalasz, tym większa szansa, że gdzieś przypadkiem coś „wyjdzie istotne" — choć naprawdę nic się nie dzieje. Mnożenie testów mnoży ryzyko błędu.

Dlatego potrzebny jest jeden test, który ogarnie wszystkie grupy naraz. To ANOVA (analiza wariancji). Zadaje jedno pytanie zamiast wielu: „czy przynajmniej jedna grupa ma inną średnią niż pozostałe?".