Differenza tra RDBMS e Hadoop

Sommario:

Differenza tra RDBMS e Hadoop
Differenza tra RDBMS e Hadoop

Video: Differenza tra RDBMS e Hadoop

Video: Differenza tra RDBMS e Hadoop
Video: Hadoop против РСУБД 2024, Novembre
Anonim

La differenza fondamentale tra RDBMS e Hadoop è che RDBMS memorizza dati strutturati mentre Hadoop archivia dati strutturati, semi-strutturati e non strutturati.

L'RDBMS è un sistema di gestione di database basato sul modello relazionale. Hadoop è un software per l'archiviazione di dati e l'esecuzione di applicazioni su cluster di hardware di base.

Immagine
Immagine

Cos'è RDBMS?

RDBMS sta per Relational Database Management System basato sul modello relazionale. Nell'RDBMS, le tabelle vengono utilizzate per archiviare i dati e le chiavi e gli indici aiutano a connettere le tabelle. Una tabella è una raccolta di elementi di dati e sono le entità. Contiene righe e colonne. Le righe rappresentano una singola voce nella tabella. Le colonne rappresentano gli attributi.

Ad esempio, il database delle vendite può avere entità cliente e prodotto. Il cliente può avere attributi come customer_id, name, address, phone_no. L'articolo può avere attributi come product_id, name ecc. La chiave primaria della tabella del cliente è customer_id mentre la chiave primaria della tabella del prodotto è product_id. L'inserimento di product_id nella tabella cliente come chiave esterna collega queste due entità. Allo stesso modo, anche le tabelle sono correlate tra loro. Forniscono l'integrità dei dati, la normalizzazione e molti altri. Pochi dei comuni RDBMS sono MySQL, MSSQL e Oracle. Usano SQL per le query.

Cos'è Hadoop?

The Hadoop è un framework open source Apache scritto in Java. Aiuta a memorizzare ed elaborare una grande quantità di dati su cluster di computer utilizzando semplici modelli di programmazione. L'obiettivo principale di Hadoop è archiviare ed elaborare Big Data, che si riferiscono a una grande quantità di dati complessi. Il throughput di Hadoop, che è la capacità di elaborare un volume di dati in un determinato periodo di tempo, è elevato.

Differenza tra RDBMS e Hadoop
Differenza tra RDBMS e Hadoop

Ci sono quattro moduli nell'architettura Hadoop. Sono Hadoop common, YARN, Hadoop Distributed File System (HDFS) e Hadoop MapReduce. Il modulo comune contiene le librerie e le utilità Java. Ha anche i file per avviare Hadoop. Hadoop YARN esegue la pianificazione dei lavori e la gestione delle risorse del cluster.

Inoltre, Hadoop Distributed File System (HDFS) è il sistema di archiviazione Hadoop. Utilizza l'architettura master-slave. Il nodo Master è il NameNode e gestisce i metadati del file system. Altri computer sono nodi slave o DataNode. Memorizzano i dati effettivi. D' altra parte, Hadoop MapReduce esegue il calcolo distribuito. Ha gli algoritmi per elaborare i dati. Nell'HDFS, il nodo Master ha un job tracker. Esegue i lavori di riduzione della mappa sui nodi slave. C'è un Task Tracker per ogni nodo slave per completare l'elaborazione dei dati e per inviare il risultato al nodo master. Nel complesso, Hadoop fornisce un'enorme archiviazione di dati con un'elevata potenza di elaborazione.

Qual è la differenza tra RDBMS e Hadoop?

RDBMS vs Hadoop

RDBMS è un software di sistema per la creazione e la gestione di database basato sul modello relazionale. Hadoop è una raccolta di software open source che collega molti computer per risolvere problemi che coinvolgono una grande quantità di dati e calcoli.
Varietà di dati
RDBMS memorizza i dati strutturati. Hadoop memorizza dati strutturati, semi-strutturati e non strutturati.
Archiviazione dati
RDBMS memorizza la quantità media di dati. Hadoop memorizza una grande quantità di dati rispetto a RDBMS.
Velocità
In RDBMS, le letture sono veloci. In Hadoop, la lettura e la scrittura sono veloci.
Scalabilità
RDBMS ha scalabilità verticale. Hadoop ha una scalabilità orizzontale.
Hardware
RDBMS utilizza server di fascia alta. Hadoop utilizza hardware di base.
Capacità
Il throughput RDBMS è maggiore. Il throughput di Hadoop è inferiore.

Riepilogo – RDBMS vs Hadoop

Questo articolo ha discusso la differenza tra RDBMS e Hadoop. La differenza fondamentale tra RDBMS e Hadoop è che RDBMS archivia dati strutturati mentre Hadoop archivia dati strutturati, semi-strutturati e non strutturati.

Consigliato: