Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili.
In esse si riportano le frequenze congiunte delle variabili.
Il caso più semplice è quello delle tabelle tetracoriche, in cui ciascuna delle due variabili assume solo due possibili valori, per esempio:
Capelli Occhi |
biondi |
non biondi |
Totale
|
chiari
|
21 |
19 |
40
|
non chiari
|
9 |
51 |
60
|
Totale
|
30 |
70 |
100
|
in cui, tra le 100 persone esaminate, 30 hanno capelli biondi, 40 hanno occhi chiari, e 21 hanno capelli biondi e occhi chiari. Da questi dati è possibile ricavare i dati restanti della tabella.
Utilizzando le tabelle di contingenza e operando specifici calcoli su di esse, si può arrivare a determinare la dipendenza o indipendenza tra le due variabili considerate, ad esempio in base al valore assunto dall'indice di contingenza quadratico (di Pearson).
Le due variabili considerate sono di tipo quantitativo discreto o qualitativo. Indicando tali variabili con e , e rispettivamente con e le modalità rilevate per le due variabili, a ogni coppia si fa corrispondere nella tabella la sua frequenza associata , cioè il numero di elementi, tra gli della popolazione, che possiedono contemporaneamente la modalità di e di .
Y X |
|
|
|
|
|
|
Totale
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Totale
|
|
|
|
|
|
|
|
dove
- rappresenta le frequenze marginali assolute di ,
- rappresenta le frequenze marginali assolute di .
Sommando tutte le frequenze assolute presenti nella tabella, troveremo la numerosità della popolazione:
Dalle frequenze assolute si ottengono le frequenze relative calcolando
Y X |
|
|
|
|
|
|
Totale
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Totale
|
|
|
|
|
|
|
|