Statistiche descrittive vs inferenziali
La statistica è la disciplina di raccolta, analisi e presentazione dei dati. La teoria della statistica si divide in due rami sulla base delle informazioni che producono analizzando i dati.
Che cos'è la statistica descrittiva?
Le statistiche descrittive sono il ramo delle statistiche che descrivono quantitativamente le principali proprietà di un set di dati. Per rappresentare le proprietà di un set di dati nel modo più accurato possibile, i dati vengono riepilogati utilizzando strumenti grafici o numerici.
Il riepilogo grafico viene effettuato tabulando, raggruppando e rappresentando graficamente i valori delle variabili di interesse. La distribuzione di frequenza e gli istogrammi di distribuzione di frequenza relativa sono tali rappresentazioni. Rappresentano la distribuzione dei valori nella popolazione.
Il riepilogo numerico implica il calcolo di misure descrittive come media, moda e media. Le misure descrittive sono ulteriormente classificate in due classi; sono misure di tendenza centrale e misure di dispersione/variazione. Le misure della tendenza centrale sono la media/media, la mediana e la moda. Ognuno ha il proprio livello di applicabilità e utilità. Laddove uno potrebbe fallire, l' altro potrebbe rappresentare meglio il set di dati.
Come suggerisce il nome, le misure di dispersione implicano la misurazione della distribuzione dei dati. L'intervallo, la deviazione standard, la varianza, gli intervalli percentili e quartili e il coefficiente di variazione sono misure di dispersione. Forniscono informazioni sulla diffusione dei dati.
Un semplice esempio di utilizzo di statistiche descrittive è il calcolo della media dei voti di uno studente. Il GPA in sostanza è la media ponderata dei risultati degli studenti ed è un riflesso del rendimento scolastico complessivo di quel particolare studente.
Che cos'è la statistica inferenziale?
La statistica inferenziale è la branca della statistica che trae conclusioni sulla popolazione interessata dal set di dati ottenuto da un campione soggetto a variazioni casuali, osservative e campionarie. In generale, i risultati sono ottenuti da un campione casuale della popolazione e le conclusioni derivate dal campione sono quindi generalizzate per rappresentare l'intera popolazione.
Il campione è un sottoinsieme della popolazione e le misure delle statistiche descrittive per i dati acquisiti dal campione sono semplicemente note come statistiche. Le misure della statistica descrittiva ottenute dall'analisi del campione sono note come parametri quando applicate alla popolazione e rappresentano l'intera popolazione.
Le statistiche inferenziali si concentrano su come generalizzare le statistiche ottenute da un campione nel modo più accurato possibile per rappresentare la popolazione. Un fattore di preoccupazione è la natura del campione. Se il campione è distorto, anche i risultati sono distorti e i parametri basati su questi non rappresentano correttamente l'intera popolazione. Pertanto, il campionamento è uno studio importante della statistica inferenziale. Assunzioni statistiche, teoria della decisione statistica e teoria della stima, verifica di ipotesi, progettazione di esperimenti, analisi della varianza e analisi della regressione sono argomenti di studio importanti nella teoria della statistica inferenziale.
Un buon esempio di statistica inferenziale in azione è la previsione dei risultati di un'elezione prima della votazione mediante sondaggi.
Qual è la differenza tra statistica descrittiva e statistica inferenziale?
• La statistica descrittiva si concentra sulla sintesi dei dati raccolti da un campione. La tecnica produce misure di tendenza centrale e dispersione che rappresentano come i valori delle variabili sono concentrati e dispersi.
• La statistica inferenziale generalizza le statistiche ottenute da un campione alla popolazione generale a cui appartiene il campione. Le misure della popolazione sono definite come parametri.
• Le statistiche descrittive fanno solo una sintesi delle proprietà del campione da cui sono stati acquisiti i dati, ma nelle statistiche inferenziali, la misura del campione viene utilizzata per dedurre le proprietà della popolazione.
• Nella statistica inferenziale, i parametri sono stati ottenuti da un campione, ma non dall'intera popolazione; quindi esiste sempre qualche incertezza rispetto ai valori reali.