Po co to w ogóle?
Dwie cechy mogą iść ze sobą w parze — albo wcale. I to jest realne pytanie biznesowe, nie akademickie.
Czy większe zatrudnienie naprawdę przekłada się na większą produkcję? Czy płeć klienta wiąże się z wyborem rozrywki? Czy więcej reklam to więcej sprzedaży?
Gdybyś policzył tylko osobne średnie — średnie zatrudnienie, średnią produkcję — wciąż nie wiedziałbyś, czy te dwie rzeczy mają ze sobą cokolwiek wspólnego. Średnia każdej cechy z osobna milczy o ich związku.
Od tego jest analiza zależności: mówi, czy zmianom jednej cechy towarzyszą zmiany drugiej — i jak mocno oraz w którą stronę.
Jedno ostrzeżenie od razu, bo to najczęstszy błąd interpretacyjny w całej statystyce: korelacja to nie przyczynowość. Tam, gdzie jest więcej bocianów, rodzi się więcej dzieci — korelacja potrafi być silna, ale bociany dzieci nie przynoszą. Obie rzeczy napędza coś trzeciego (więcej wsi, więcej ludzi). O tym trzeba pamiętać, zanim z liczby wyciągnie się wniosek.