Che cos'è un data lake in Hadoop?
Che cos'è un data lake in Hadoop?

Video: Che cos'è un data lake in Hadoop?

Video: Che cos'è un data lake in Hadoop?
Video: Cos'è il Data Lake ‐ Alessandro Rezzani - Dataskills 2024, Maggio
Anonim

UN Data Lake Hadoop è un dati piattaforma gestionale comprendente uno o più Hadoop cluster. Viene utilizzato principalmente per elaborare e memorizzare non relazionali dati , come file di registro, record di flussi di clic su Internet, sensore dati , oggetti JSON, immagini e post sui social media.

A tal proposito, qual è la differenza tra un data warehouse e un data lake?

Data lake e dati i magazzini sono entrambi ampiamente utilizzati per lo stoccaggio di grandi dati , ma non sono termini intercambiabili. UN data lake è un vasto bacino di materie prime dati , il cui scopo non è ancora definito. UN data warehouse è un repository per strutturato, filtrato dati che è già stato elaborato per uno scopo specifico.

Inoltre, cos'è un'architettura data lake? UN Data Lake è un repository di archiviazione in grado di archiviare grandi quantità di dati strutturati, semi-strutturati e non strutturati dati . A differenza di una casa Dataware gerarchica dove dati è memorizzato in File e cartelle, Data lake ha un appartamento architettura.

Rispetto a questo, cosa si intende per data lake?

UN data lake è un repository di archiviazione che contiene una grande quantità di raw dati nel suo formato nativo fino a quando non è necessario. Mentre un gerarchico dati negozi di magazzino dati in file o cartelle, a data lake utilizza un'architettura piatta per immagazzinare dati . Il termine data lake è spesso associato all'archiviazione di oggetti orientata ad Hadoop.

Elasticsearch è un data lake?

UN data lake è semplicemente un posto dove parcheggiare dati fino a quando non ne hai bisogno e potrebbe comprendere HDFS (più comune), archiviazione di oggetti, box NAS o qualsiasi altra cosa. Fondamentalmente, Ricerca elastica è uno strumento per l'indicizzazione dati , non per lo stoccaggio di dati si.

Consigliato: