Media vs Mediana vs Mode
Media, mediana e moda sono le misure primarie della tendenza centrale utilizzate nelle statistiche descrittive. Sono completamente diversi l'uno dall' altro e anche i casi in cui vengono utilizzati per riassumere i dati sono diversi.
Media
La media aritmetica è la somma dei valori dei dati divisa per il numero dei valori dei dati, ovvero
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Se i dati provengono da uno spazio campionario, viene chiamata media campionaria ([latex]\bar{x} [/latex]), che è una statistica descrittiva del campione. Sebbene sia la misura descrittiva più comunemente usata per un campione, non è una statistica robusta. È molto sensibile ai valori anomali e alle oscillazioni.
Ad esempio, considera il reddito medio dei cittadini di una determinata città. Poiché tutti i valori dei dati vengono sommati e quindi divisi, il reddito di una persona estremamente ricca influisce in modo significativo sulla media. Pertanto, i valori medi non sono sempre una buona rappresentazione dei dati.
Inoltre, nel caso di un segnale alternato, la corrente che passa attraverso un elemento varia periodicamente dalla direzione positiva alla direzione negativa e viceversa. Se prendiamo la corrente media che passa attraverso l'elemento in un singolo periodo, darà uno 0, a significare che nessuna corrente è passata attraverso l'elemento, il che ovviamente non è vero. Quindi anche in questo caso la media aritmetica non è una buona misura.
La media aritmetica è un buon indicatore quando i dati sono distribuiti uniformemente. Per una distribuzione normale, la media è uguale alla moda e alla mediana. Ha anche i residui più bassi quando si considera l'errore quadratico medio della radice; quindi, la migliore misura descrittiva quando è necessario rappresentare un dataset con un singolo numero.
Mediana
I valori del punto dati intermedio dopo aver disposto tutti i valori dei dati in ordine crescente sono definiti come la mediana del set di dati. La mediana è il 2° quartile, 5° decile e 50° percentile.
• Se il numero di osservazioni (punti dati) è dispari, la mediana è l'osservazione esattamente al centro dell'elenco ordinato.
• Se il numero di osservazioni (punti dati) è pari, la mediana è la media delle due osservazioni centrali nell'elenco ordinato.
Mediana divide l'osservazione in due gruppi; ovvero un gruppo (50%) di valori superiori e un gruppo (50%) di valori inferiori alla mediana. Le mediane sono usate in modo specifico nelle distribuzioni asimmetriche e rappresentano i dati abbastanza meglio della media aritmetica.
Modalità
Modo è il numero più ricorrente in un insieme di osservazioni. La modalità di un set di dati viene calcolata trovando la frequenza di ciascun elemento all'interno del set.
• Se nessun valore compare più di una volta, il set di dati non ha modalità.
• Altrimenti, qualsiasi valore che si verifica con la frequenza maggiore è una modalità del set di dati.
Può esistere più di 1 modalità in un set; pertanto, la modalità non è una statistica univoca di un set di dati. In una distribuzione uniforme, c'è una modalità. La modalità di una distribuzione di probabilità discreta è il punto in cui la funzione massa di probabilità raggiunge il suo punto più alto. Dal rendering delle interpretazioni di cui sopra, possiamo dire che i massimi globali sono modi.
Considera l'applicazione di tutte e tre le misure al seguente set di dati.
DATI: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Media=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Mediana=9 (13° elemento)
Modalità=9 (frequenza di 9=5)
Qual è la differenza tra media, mediana e moda?
• La media aritmetica è la somma dei valori (osservazioni) divisa per il numero di osservazioni. Non è una statistica robusta e fortemente dipendente dalla natura della distribuzione normale all'interno della distribuzione considerata. Un singolo valore anomalo può causare uno spostamento significativo della media fornendo valori relativamente fuorvianti. Il concetto può essere esteso a media geometrica, media armonica, media ponderata e così via.
• La mediana è i valori medi dell'insieme di osservazioni ed è relativamente meno influenzata dai valori anomali. Può fornire una buona stima come statistica riassuntiva in casi molto distorti.
• La modalità è i valori di osservazione più comuni nel set di dati. Se la distribuzione è asimmetrica positiva, la moda si trova a sinistra della mediana e, se asimmetrica negativa, la moda si trova a destra della mediana.
• Se inclinata positivamente, la media corrisponde alla mediana; se negativamente la media è a sinistra della mediana.
• Nella distribuzione normale, tutti e tre, media, moda e mediana sono uguali.