Korelacja i test niezależności
Krok 1 z 5

Po co to w ogóle?

Dwie cechy mogą iść ze sobą w parze — albo wcale. I to jest realne pytanie biznesowe, nie akademickie.

Czy większe zatrudnienie naprawdę przekłada się na większą produkcję? Czy płeć klienta wiąże się z wyborem rozrywki? Czy więcej reklam to więcej sprzedaży?

Gdybyś policzył tylko osobne średnie — średnie zatrudnienie, średnią produkcję — wciąż nie wiedziałbyś, czy te dwie rzeczy mają ze sobą cokolwiek wspólnego. Średnia każdej cechy z osobna milczy o ich związku.

Od tego jest analiza zależności: mówi, czy zmianom jednej cechy towarzyszą zmiany drugiej — i jak mocno oraz w którą stronę.

Mini quiz

Tam, gdzie jest więcej bocianów, rodzi się też więcej dzieci. Co z tego wynika?

Jedno ostrzeżenie od razu, bo to najczęstszy błąd interpretacyjny w całej statystyce: korelacja to nie przyczynowość. Tam, gdzie jest więcej bocianów, rodzi się więcej dzieci — korelacja potrafi być silna, ale bociany dzieci nie przynoszą. Obie rzeczy napędza coś trzeciego (więcej wsi, więcej ludzi). O tym trzeba pamiętać, zanim z liczby wyciągnie się wniosek.