Varianza vs Covarianza
Varianza e covarianza sono due misure utilizzate nelle statistiche. La varianza è una misura della dispersione dei dati e la covarianza indica il grado di cambiamento di due variabili casuali insieme. La varianza è piuttosto un concetto intuitivo, ma la covarianza è definita matematicamente in un primo momento non così intuitivo.
Ulteriori informazioni sulla varianza
La varianza è una misura della dispersione dei dati dal valore medio della distribuzione. Indica quanto si trovano i punti dati dalla media della distribuzione. È uno dei descrittori primari della distribuzione di probabilità e uno dei momenti della distribuzione. Inoltre, la varianza è un parametro della popolazione e la varianza di un campione rispetto alla popolazione funge da stimatore per la varianza della popolazione. Da una prospettiva, è definito come il quadrato della deviazione standard.
In parole povere, può essere descritto come la media dei quadrati della distanza tra ciascun punto dati e la media della distribuzione. La seguente formula viene utilizzata per calcolare la varianza.
Var(X)=E[(X-µ)2] per una popolazione e
Var(X)=E[(X-‾x)2] per un campione
Può essere ulteriormente semplificato per dare Var(X)=E[X2]-(E[X])2.
Variance ha alcune proprietà della firma e spesso viene utilizzata nelle statistiche per semplificare l'utilizzo. La varianza non è negativa perché è il quadrato delle distanze. Tuttavia, l'intervallo della varianza non è limitato e dipende dalla distribuzione particolare. La varianza di una variabile casuale costante è zero e la varianza non cambia rispetto a un parametro di posizione.
Ulteriori informazioni sulla covarianza
Nella teoria statistica, la covarianza è una misura di quanto due variabili casuali cambiano insieme. In altre parole, la covarianza è una misura della forza della correlazione tra due variabili casuali. Inoltre, può essere considerata come una generalizzazione del concetto di varianza di due variabili casuali.
La covarianza di due variabili casuali X e Y, che sono distribuite congiuntamente con momento finito al secondo, è nota come σXY=E[(X-E[X])(Y-E[Y])]. Da ciò, la varianza può essere vista come un caso speciale di covarianza, in cui due variabili sono uguali. Cov(X, X)=Var(X)
Normalizzando la covarianza si ottiene il coefficiente di correlazione lineare o il coefficiente di correlazione di Pearson, che è definito come ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Graficamente, la covarianza tra una coppia di punti dati può essere vista come l'area del rettangolo con i punti dati ai vertici opposti. Può essere interpretato come una misura della grandezza della separazione tra i due punti dati. Considerando i rettangoli per l'intera popolazione, la sovrapposizione dei rettangoli corrispondenti a tutti i punti dati può essere considerata come il punto di forza della separazione; varianza delle due variabili. La covarianza è in due dimensioni, a causa di due variabili, ma semplificandola a una variabile si ottiene la varianza di una singola come la separazione in una dimensione.
Qual è la differenza tra varianza e covarianza?
• La varianza è la misura della diffusione/dispersione in una popolazione mentre la covarianza è considerata come una misura della variazione di due variabili casuali o della forza della correlazione.
• La varianza può essere considerata un caso speciale di covarianza.
• La varianza e la covarianza dipendono dalla grandezza dei valori dei dati e non possono essere confrontate; pertanto, sono normalizzati. La covarianza viene normalizzata nel coefficiente di correlazione (dividendo per il prodotto delle deviazioni standard delle due variabili casuali) e la varianza nella deviazione standard (prendendo la radice quadrata)