Po co to w ogóle?
Masz cechę ilościową — powiedzmy BMI — i cechę jakościową z kilkoma kategoriami, np. wykształcenie: podstawowe, średnie, wyższe. Pytanie brzmi: czy średnie BMI w tych grupach się różnią?
Znasz już test różnicy dwóch średnich. Problem w tym, że on obsługuje dokładnie dwie grupy. A tu masz trzy, cztery, czasem więcej.
Pierwszy odruch: no to porównajmy je parami — podstawowe vs średnie, podstawowe vs wyższe, średnie vs wyższe. Niby działa, ale wpadasz w pułapkę. Każdy pojedynczy test ma jakieś ryzyko fałszywego alarmu (). Im więcej testów odpalasz, tym większa szansa, że gdzieś przypadkiem coś „wyjdzie istotne" — choć naprawdę nic się nie dzieje. Mnożenie testów mnoży ryzyko błędu.
Dlatego potrzebny jest jeden test, który ogarnie wszystkie grupy naraz. To ANOVA (analiza wariancji). Zadaje jedno pytanie zamiast wielu: „czy przynajmniej jedna grupa ma inną średnią niż pozostałe?".