Teste parametrice versus non-parametrice

Statistica este necesară ca domeniu de studiu deoarece ne permite realizarea unor estimări cu privire la o anumită populație, pe baza analizei unui subgrup reprezentativ din acea populație; în respectivul subgrup vom calcula o serie de parametri precum valoarea medie, deviația standard, varianța șamd.

Procedurile statistice parametrice se bazează pe o serie de presupuneri pe care le facem cu privire la distribuția acestor parametri (considerăm că distribuția valorilor este una gaussiană sau normală). În cazul în care nu se pot face asemenea asumpții cu privire la lotul de studiu suntem nevoiți să utilizăm statistici non-parametrice.

Există unele situații în care suntem nevoiți să utilizăm teste non-parametrice, cum ar fi:

  • dacă rezultatul este o variabilă de tip ordinal sau de tip rang. De exemplu, să presupunem că variabila analizată este gradul hipertensiunii arteriale (variabilă de tip nominal) în cazul pacienților cu hipertensiune renovasculară. În acest grup majoritatea pacienților vor avea tensiuni de grad înalt astfel că distribuția nu poate fi una normală. Un alt exemplu îl reprezintă distribuția scorului APGAR (variabilă de tip rang) – majoritatea copiilor vor avea un scor de peste 7 deși scale ia valori de la 0 la 10.
  • dacă există outlieri evidenți. De exemplul, să presupunem că vrem să evaluăm durata spitalizării pacienților cu traumatisme cranio cerebrale secundare unor căderi de la același nivel. Majoritatea cazurilor vor avea internări de sub 7 zile; cu toate acestea vom avea un număr de 5-10% care pot sta peste 30 zile (hemoragii cerebrale, infecții nosocomiale, etc.)
  • dacă rezultatul are limite evidente de detecție. De exemplu să presupunem că variabila de lucru este  alcoolemia, la care limita de detecție a aparatului este de 0,01g/dl. În acest caz, valorile alcoolemiei vor fi de la nedetectabil (sub 0,01), la, să zicem 5. Dar multe din valorile de sub 0,01 pot fi în intervalul 0,001-0,01, nedetectate prin tehnica utilizată de noi. Prin urmare, distribuția valorilor alcoolemiei nu va fi una normală (vor fi multe cazuri aglomerate în jurul limitei de detecție).
  • dacă  numărul de cazuri este extrem de mic și distribuția este evident non-normală (sub 20 cazuri în cazul testelor pe un singur grup sau sub 15 cazuri/grup în cazul testelor pe mai mult de 2 grupuri)

În alte situații selectarea tipului de analiză statistică nu este evidentă, caz în care trebuie să folosim analize statistice care să evalueze normalitatea distribuției, cum ar fi testul Kolmogorov-Smirnof, Shapiro-Wilk sau Anderson-Darling. Ipoteza de lucru în cazul acestor teste (H0) este că datele sunt distribuite normal. Dacă testul are o valoare statistic semnificativă (p<0,005) înseamnă că distribuția NU este normală și prin urmare trebuie utilizate teste non-parametrice.

Principalele deosebiri ale celor două tipuri de teste (modificat după aici) sunt prezentate în tabelul de mai jos:

Caracteristica Teste parametrice Teste neparametrice
Tipul de distribuție Normală Oricare
Tipul de varianță Omogenă Oricare
Tipul de variabile Continui Nominale sau ordinale
Măsura de tendință centrală Media Mediana
Avantaje Putere mai mare

Mai multe concluzii

Simplicitate

Mai puțin afectată de outlieri

Corelație Pearson Spearman
Măsurători independente, 2 grupuri testul t Mann-Whitney
Măsurători independente, mai mult de 2 grupuri ANOVA Kruskal-Wallis
Măsurători repetate, 2 condiții testul t dependent Wilcoxon
Măsurători repetate, >2 condiții ANOVA măsutători repetate Friedman