Test di McNemar

Niente fonti!
Questa voce o sezione sull'argomento matematica non cita le fonti necessarie o quelle presenti sono insufficienti.
Commento: voce totalmente priva di fonti

Il Test di McNemar è un test non parametrico che si applica a tabelle di frequenza 2 x 2. Viene generalmente impiegato per verificare l'esistenza di differenze in dati dicotomici (presenza/assenza; positivo/negativo) prima e dopo un certo cambio o evento o trattamento (ovvero per valutare l'efficacia di quel trattamento), qualora siano disponibili dati sotto forma di frequenze. Il test vuole determinare se le frequenze marginali di riga e colonna sono uguali.

Per la stessa analisi si può utilizzare il test binomiale, ma il Test di McNemar è più agevole e snello.

Descrizione del test

Consideriamo ad esempio il caso di n = 200 {\displaystyle n=200} persone che vengono classificate positive e negative prima di un trattamento, poi vengono trattate e successivamente ri-classificate in positive e negative (così da vedere quelle che sono passate da positive a negative, e viceversa.

Se prima del trattamento avevo:

  • 120 persone positive
  • 80 persone negative

e, dopo il trattamento:

  • 30 delle 120 persone positive sono diventate negative (hanno cambiato)
  • 20 delle 80 persone negative sono diventate positive (hanno cambiato)

allora posso costruire la seguente tabella 2 x 2:

dopo è + dopo è - TOT
prima del trattamento era positivo: 90 30 120
prima del trattamento era negativo: 20 60 80
TOT 110 90 200

Le celle possono essere identificate dalle lettere: a, b, c e d. I totali di riga e colonna vengono detti frequenze marginali. Il totale delle frequenze viene indicato con n {\displaystyle n} .

dopo è + dopo è - TOT
prima del trattamento era positivo: a b a+b
prima del trattamento era negativo: c d c+d
TOT a+c b+d n

Il Test di McNemar verifica l'ipotesi:

H 0 {\displaystyle H_{0}} : le frequenze marginali sono uguali.

Questo accade quando:

( a + b ) = ( a + c ) {\displaystyle (a+b)=(a+c)}
( c + d ) = ( b + d ) {\displaystyle (c+d)=(b+d)}

ovvero quando:

b = c {\displaystyle b=c}

La statistica test di McNemar è la seguente:

χ 2 = ( b c ) 2 ( b + c ) {\displaystyle \chi ^{2}={\frac {(b-c)^{2}}{(b+c)}}}

Sotto l'ipotesi H 0 {\displaystyle H_{0}} , χ 2 {\displaystyle \chi ^{2}} è una Chi quadrato con 1 grado di libertà. La formula è bene venga corretta con la correzione di continuità di Yates, in quanto il Chi quadrato è una distribuzione continua, mentre quella campionaria è discreta. E, soprattutto quando le frequenze sono piccole, l'approssimazione può essere scarsa.

χ 2 = ( | b c | 1 ) 2 ( b + c ) {\displaystyle \chi ^{2}={\frac {(|b-c|-1)^{2}}{(b+c)}}}

Si rifiuta l'ipotesi H 0 {\displaystyle H_{0}} (ovvero le frequenze marginali non sono omogenee), se il χ 2 {\displaystyle \chi ^{2}} è significativo (ovvero se il valore p è p < 0.05 {\displaystyle p<0.05} ).

Per frequenze basse b + c < 10 {\displaystyle b+c<10} è opportuno usare il test binomiale.

Esempio

Nei laboratori di microbiologia viene impiegato per confrontare due metodi qualitativi (generalmente un metodo di riferimento, ed un metodo nuovo) attraverso prove su campioni a valore noto (contaminati sperimentalmente in laboratorio).

Dapprima n {\displaystyle n} campioni vengono contaminati artificialmente, in modo che risultino positivi o negativi con il metodo di riferimento. Dopodiché vengono esaminati con il metodo nuovo. I casi discordanti sono i seguenti:

  • i campioni che con il metodo di riferimento erano classificati come positivi e con il metodo nuovo vengono classificati ancora come positivi indichiamoli con: PP.
  • i campioni che con il metodo di riferimento erano classificati come negativi e con il metodo nuovo vengono classificati ancora come negativi indichiamoli con: NN.
  • i campioni che con il metodo di riferimento erano classificati come negativi e con il metodo nuovo vengono classificati positivi vengono detti: Falsi Positivi, definiamoli pari a FP.
  • i campioni che con il metodo di riferimento erano classificati come positivi e con il metodo nuovo vengono classificati negativi vengono detti: Falsi Negativi, definiamoli pari a FN.

Possiamo allora scrivere i dati con la seguente tabella:

con metodo 2 è + con metodo 2 è - TOT
con il metodo vecchio era positivo: PP FN PP+FN
con il metodo vecchio era negativo: FP NN FP+NN
TOT PP+FP FN+NN N

dove N=PP+FP+FN+NN=numerosità dei campioni.

Il test di McNemar vuole testare l'ipotesi che:

  • il numero totale di positivi con il primo metodo = PP+FN sia pari al numero totale di positivi con il secondo metodo = PP+FP
ovvero PP+FN = PP+FP

e

  • il numero totale di negativi con il primo metodo = FP+NN sia pari al numero totale di negativi con il secondo metodo = FN+NN
ovvero FP+NN = FN+NN

entrambe le condizioni si riassumono con l'ipotesi:

H 0 {\displaystyle H_{0}} : FN=FP.

L'espressione per il test di McNemar è la seguente:

χ 2 = ( | F P F N | 1 ) 2 ( F P + F N ) {\displaystyle \chi ^{2}={\frac {(|FP-FN|-1)^{2}}{(FP+FN)}}}

Per valori alti di χ 2 {\displaystyle \chi ^{2}} il metodo nuovo non risulta idoneo, ovvero la differenza fra falsi positivi e falsi negativi è troppo pronunciata e dunque non è dovuta al caso.

N.b. nei laboratori di microbiologia viene applicato solo quando F P + F N > 22 {\displaystyle FP+FN>22} .

Voci correlate