Teste de corelație statistică

Testele de corelație analizează mărimea asociației dintre două variabile, luând în general valori între -1 și 1.  Cu cât valoarea este mai apropiată de aceste limite, cu atât corelația este mai puternică, cu precizarea că valorile pozitive sugerează o corelație directă (dacă a crește și b crește), pe când valorile negative sugerează o corelație inversă (dacă a crește, b scade). Cu cât valoarea este mai apropiată de 0 cu atât corelația este mai slabă.

În practică se utilizează cu precădere trei teste de corelație statistică: Pearson, Spearman și Kendall.

Pentru a evalua dacă testul este semnificativ statistic se utilizează valoarea lui p (standard sub 0,05, testul este considerat semnificativ statistic). Pentru a evalua intensitatea relației între cele două variabile se utilizează testul Cohen care:

  • dacă ia valori între 0,1 și 0,29 – sugerează o asociere slabă;
  • dacă ia valori între 0,3 și 0,49 – sugerează o asociere medie;
  • dacă ia valori de peste 0,5 – sugerează o asociere puternică.

Testul Pearson

Testul Pearson (Pearson r) – măsoară relația dintre variabile lineare, înrudite. De exemplu, dacă vrem să măsurăm corelația între valorile pulsului și ale tensiunii arteriale în situații de stres extrem vom putea utiliza acest test.

Pentru a putea realiza testul Pearson trebuie îndeplinite trei condiții:

  • distribuția variabilelor este una normală
  • distribuția este una lineară (relația între cele două variabile este una lineară – cuantificabilă printr-o ecuație de gradul I)
  • distribuția este homoscedasticică (datele obținute sunt normal distribuite raportat la linia ecuației de regresie)

Testul Spearman (rho)

Este un test non-parametric (deci nu necesită asumpțiile de la testul Pearson), utilizat pentu a măsura gradul de asociere dintre două variabile, a căror relație poate fi descrisă printr-o funcție monotonă1)funcție care este, pe tot intervalul, fie crescătoare, fie descrescătoare; alternativ – funcția monotonă este acea funcție care nu își schimbă sensul după derivare, indiferent dacă aceasta este liniară sau nu. Poate fi utilizată pentru variabile continui, discrete sau ordinale.

Testul Kendall

Este un test non-parametric (deci nu necesită asumpțiile de la testul Pearson), utilizat pentru testarea corelației între două variabile ordinale. Se poate utiliza și pentru variabile discrete dar nu pentru cele continui.

Exemplu de calcul SPSS

Să presupunem că avem un lot de studiu cu pacienți ce prezintă cancer pulmonar în diferite stadii și dorim să verificăm dacă o creștere a vârstei este asociată cu un cancer pulmonar mai avansat. În acest caz una dintre variabile este de tip discret (vârsta), iar cealaltă de tip ordinal (gradul tumoral).

Pentru a identifica existența unor posibile corelații între cele două variabile vom intra în baza de date și vom intra în meniul Analyze – Correlate – Bivariate.

Vom selecta variabilele de interes și vom selecta testul statistic – în cazul de față putem utiliza fie Spearman fie Kendall. Nu Pearson deoarece una dintre variabile este ordinală.

În fereastra de output vom obține rezultateleInterpretarea acestora: Între vârstă și gradul tumoral nu există o corelație statistic semnificativă (testul Kendall are o valoare de -0,263, nesemnificativă statistic – p=0,101, mai mare de 0,05). Testul de corelație având o valoare negativă, și numărul de cazuri fiind mic, putem presupune că, odată cu înaintarea în vârstă scade gradul tumoral al pacienților la momentul diagnosticului, dar această concluzie ar necesita, pentru verificare, un lot de studiu mai mare decât cel avut la dispoziție (25 cazuri)

Similar pentru Spearman.

 

References   [ + ]

1. funcție care este, pe tot intervalul, fie crescătoare, fie descrescătoare; alternativ – funcția monotonă este acea funcție care nu își schimbă sensul după derivare