Differenza tra data mining e data warehousing

Differenza tra data mining e data warehousing
Differenza tra data mining e data warehousing

Video: Differenza tra data mining e data warehousing

Video: Differenza tra data mining e data warehousing
Video: Le DIFFERENZE tra Pokémon ROSSO/BLU e ROSSO FUOCO/VERDE FOGLIA 2024, Novembre
Anonim

Data mining vs Data Warehousing

Data Mining e Data Warehousing sono tecniche molto potenti e popolari per l'analisi dei dati. Gli utenti inclini alla statistica utilizzano il Data Mining. Utilizzano modelli statistici per cercare modelli nascosti nei dati. I data miner sono interessati a trovare relazioni utili tra diversi elementi di dati, il che è in definitiva redditizio per le aziende. Ma d' altra parte, gli esperti di dati in grado di analizzare direttamente le dimensioni dell'azienda tendono a utilizzare i data warehouse.

Il data mining è anche noto come Knowledge Discovery in data (KDD). Come accennato in precedenza, è un campo dell'informatica, che si occupa dell'estrazione di informazioni precedentemente sconosciute e interessanti da dati grezzi. A causa della crescita esponenziale dei dati, soprattutto in aree come il business, il data mining è diventato uno strumento molto importante per convertire questa grande quantità di dati in business intelligence, poiché l'estrazione manuale dei modelli è diventata apparentemente impossibile negli ultimi decenni. Ad esempio, è attualmente utilizzato per varie applicazioni come l'analisi dei social network, il rilevamento delle frodi e il marketing. Il data mining di solito si occupa delle seguenti quattro attività: clustering, classificazione, regressione e associazione. Il clustering identifica gruppi simili da dati non strutturati. La classificazione è regole di apprendimento che possono essere applicate a nuovi dati e in genere includeranno i seguenti passaggi: preelaborazione dei dati, progettazione di modelli, apprendimento/selezione delle funzionalità e valutazione/convalida. La regressione sta trovando funzioni con un errore minimo per modellare i dati. E l'associazione cerca relazioni tra variabili. Il data mining viene solitamente utilizzato per rispondere a domande come quali sono i principali prodotti che potrebbero aiutare a ottenere profitti elevati il prossimo anno in Wal-Mart?

Come accennato in precedenza, il data warehousing viene utilizzato anche per l'analisi dei dati, ma da gruppi di utenti diversi e con un obiettivo leggermente diverso in mente. Ad esempio, quando si tratta del settore della vendita al dettaglio, gli utenti del data warehousing sono più interessati a quali tipi di acquisti sono popolari tra i clienti, quindi i risultati dell'analisi possono aiutare il cliente migliorando l'esperienza del cliente. Ma i minatori di dati prima ipotizzano quali clienti acquistano un determinato tipo di prodotto e analizzano i dati per verificare l'ipotesi. Il data warehousing potrebbe essere effettuato da un importante rivenditore che inizialmente rifornisce i suoi negozi con prodotti delle stesse dimensioni per poi scoprire che i negozi di New York vendono scorte di dimensioni inferiori molto più velocemente rispetto ai negozi di Chicago. Quindi, osservando questo risultato, il rivenditore può rifornire il negozio di New York con dimensioni più piccole rispetto ai negozi di Chicago.

Quindi, come puoi vedere chiaramente, questi due tipi di analisi sembrano essere della stessa natura ad occhio nudo. Entrambi si preoccupano di aumentare i profitti in base ai dati storici. Ma ovviamente ci sono differenze fondamentali. In parole povere, Data Mining e Data Warehousing sono dedicati a fornire diversi tipi di analisi, ma sicuramente per diverse tipologie di utenti. In altre parole, il Data Mining cerca correlazioni, schemi per supportare un'ipotesi statistica. Tuttavia, Data Warehousing risponde a una domanda relativamente più ampia e da lì in poi affetta e taglia i dati per riconoscere le modalità di miglioramento in futuro.

Consigliato: