Popolazione vs. Deviazione standard del campione
Nelle statistiche, vengono utilizzati diversi indici per descrivere un insieme di dati corrispondente alla sua tendenza centrale, dispersione e asimmetria. La deviazione standard è una delle misure più comuni di dispersione dei dati dal centro del set di dati.
A causa di difficoltà pratiche, non sarà possibile utilizzare i dati dell'intera popolazione quando viene verificata un'ipotesi. Pertanto, utilizziamo i valori dei dati dei campioni per fare inferenze sulla popolazione. In una tale situazione, questi sono chiamati stimatori poiché stimano i valori dei parametri della popolazione.
È estremamente importante utilizzare stimatori imparziali nell'inferenza. Uno stimatore si dice imparziale se il valore atteso di quello stimatore è uguale al parametro della popolazione. Ad esempio, utilizziamo la media campionaria come stimatore imparziale per la media della popolazione. (Matematicamente, si può dimostrare che il valore atteso della media campionaria è uguale alla media della popolazione). Nel caso della stima della deviazione standard della popolazione, anche la deviazione standard del campione è uno stimatore imparziale.
Che cos'è la deviazione standard della popolazione?
Quando si possono prendere in considerazione i dati dell'intera popolazione (ad esempio nel caso di un censimento) è possibile calcolare la deviazione standard della popolazione. Per calcolare la deviazione standard della popolazione, vengono prima calcolate le deviazioni dei valori dei dati dalla media della popolazione. La radice quadrata media (media quadratica) delle deviazioni è chiamata deviazione standard della popolazione.
In una classe di 10 studenti, i dati sugli studenti possono essere facilmente raccolti. Se viene verificata un'ipotesi su questa popolazione di studenti, non è necessario utilizzare valori campionari. Ad esempio, i pesi dei 10 studenti (in chilogrammi) sono misurati come 70, 62, 65, 72, 80, 70, 63, 72, 77 e 79. Quindi il peso medio delle dieci persone (in chilogrammi) è (70+62+65+72+80+70+63+72+77+79)/10, ovvero 71 (in chilogrammi). Questa è la media della popolazione.
Ora per calcolare la deviazione standard della popolazione, calcoliamo le deviazioni dalla media. Le rispettive deviazioni dalla media sono (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 e (79 – 71)=8. La somma dei quadrati di deviazione è (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. La deviazione standard della popolazione è √(366/10)=6,05 (in chilogrammi). 71 è il peso medio esatto degli studenti della classe e 6.05 è la deviazione standard esatta del peso da 71.
Che cos'è la deviazione standard campionaria?
Quando i dati di un campione (di dimensione n) vengono utilizzati per stimare i parametri della popolazione, viene calcolata la deviazione standard del campione. Per prima cosa vengono calcolate le deviazioni dei valori dei dati dalla media campionaria. Poiché la media campionaria viene utilizzata al posto della media della popolazione (che è sconosciuta), prendere la media quadratica non è appropriato. Per compensare l'uso della media campionaria, la somma dei quadrati delle deviazioni è divisa per (n-1) invece di n. La deviazione standard campionaria è la radice quadrata di questo. In simboli matematici, S=√{∑(xi-ẍ)2 / (n-1)}, dove S è la deviazione standard campionaria, ẍ è la media campionaria e xi sono i punti dati.
Ora supponiamo che, nell'esempio precedente, la popolazione sia costituita dagli studenti dell'intera scuola. Quindi, la classe sarà solo un campione. Se questo campione viene utilizzato nella stima, la deviazione standard del campione sarà √(366/9)=6.38 (in chilogrammi) poiché 366 è stato diviso per 9 anziché 10 (la dimensione del campione). Il fatto da osservare è che non è garantito che questo sia il valore esatto della deviazione standard della popolazione. È solo una stima.
Qual è la differenza tra la deviazione standard della popolazione e la deviazione standard del campione?
• La deviazione standard della popolazione è il valore esatto del parametro utilizzato per misurare la dispersione dal centro, mentre la deviazione standard del campione è uno stimatore imparziale.
• La deviazione standard della popolazione viene calcolata quando tutti i dati relativi a ciascun individuo della popolazione sono noti. In caso contrario, viene calcolata la deviazione standard del campione.
• La deviazione standard della popolazione è data da σ=√{ ∑(xi-µ)2/ n} dove µ è la media della popolazione e n è la dimensione della popolazione ma il la deviazione standard del campione è data da S=√{ ∑(xi-ẍ)2 / (n-1)} dove ẍ è la media campionaria e n è la dimensione del campione.