Differenza tra data mining e OLAP

Differenza tra data mining e OLAP
Differenza tra data mining e OLAP

Video: Differenza tra data mining e OLAP

Video: Differenza tra data mining e OLAP
Video: Estate Vs. Antique Jewelry 2024, Luglio
Anonim

Data Mining vs OLAP

Sia il data mining che l'OLAP sono due delle comuni tecnologie di Business Intelligence (BI). La business intelligence si riferisce a metodi basati su computer per identificare ed estrarre informazioni utili dai dati aziendali. Il data mining è il campo dell'informatica che si occupa di estrarre modelli interessanti da grandi insiemi di dati. Combina molti metodi di intelligenza artificiale, statistica e gestione di database. OLAP (elaborazione analitica online), come suggerisce il nome, è una raccolta di modi per interrogare database multidimensionali.

Il data mining è anche noto come Knowledge Discovery in data (KDD). Come accennato in precedenza, è un campo dell'informatica, che si occupa dell'estrazione di informazioni precedentemente sconosciute e interessanti da dati grezzi. A causa della crescita esponenziale dei dati, soprattutto in aree come il business, il data mining è diventato uno strumento molto importante per convertire questa grande quantità di dati in business intelligence, poiché l'estrazione manuale dei modelli è diventata apparentemente impossibile negli ultimi decenni. Ad esempio, è attualmente utilizzato per varie applicazioni come l'analisi dei social network, il rilevamento delle frodi e il marketing. Il data mining di solito si occupa delle seguenti quattro attività: clustering, classificazione, regressione e associazione. Il clustering identifica gruppi simili da dati non strutturati. La classificazione è regole di apprendimento che possono essere applicate a nuovi dati e in genere includeranno i seguenti passaggi: preelaborazione dei dati, progettazione di modelli, apprendimento/selezione delle funzionalità e valutazione/convalida. La regressione sta trovando funzioni con un errore minimo per modellare i dati. E l'associazione cerca relazioni tra variabili. Il data mining viene solitamente utilizzato per rispondere a domande come quali sono i principali prodotti che potrebbero aiutare a ottenere profitti elevati il prossimo anno in Wal-Mart.

OLAP è una classe di sistemi che fornisce risposte a query multidimensionali. Tipicamente OLAP viene utilizzato per il marketing, il budgeting, le previsioni e applicazioni simili. Inutile dire che i database utilizzati per OLAP sono configurati per query complesse e ad hoc pensando a prestazioni rapide. In genere viene utilizzata una matrice per visualizzare l'output di un OLAP. Le righe e le colonne sono formate dalle dimensioni della query. Spesso usano metodi di aggregazione su più tabelle per ottenere riepiloghi. Ad esempio, può essere utilizzato per scoprire le vendite di quest'anno in Wal-Mart rispetto all'anno scorso? Qual è la previsione sulle vendite nel prossimo trimestre? Cosa si può dire della tendenza osservando la variazione percentuale?

Anche se è ovvio che il data mining e l'OLAP sono simili perché operano sui dati per ottenere informazioni, la differenza principale deriva dal modo in cui operano sui dati. Gli strumenti OLAP forniscono analisi dei dati multidimensionali e forniscono riepiloghi dei dati, ma al contrario, il data mining si concentra su rapporti, modelli e influenze nell'insieme di dati. Questo è un accordo OLAP con l'aggregazione, che si riduce al funzionamento dei dati tramite "addizione" ma il data mining corrisponde alla "divisione". Un' altra differenza notevole è che mentre gli strumenti di data mining modellano i dati e restituiscono regole attuabili, OLAP condurrà tecniche di confronto e contrasto lungo la dimensione aziendale in tempo reale.

Consigliato: