Qual è il motore di elaborazione dei dati alla base di Amazon Elastic MapReduce?
Qual è il motore di elaborazione dei dati alla base di Amazon Elastic MapReduce?

Video: Qual è il motore di elaborazione dei dati alla base di Amazon Elastic MapReduce?

Video: Qual è il motore di elaborazione dei dati alla base di Amazon Elastic MapReduce?
Video: Mapreduce Tutorial: The Basic Concepts of Mapreduce 2024, Novembre
Anonim

Amazon EMR usa Apache Hadoop come distribuito motore di elaborazione dati . Hadoop è un framework software Java open source che supporta dati -applicazioni distribuite ad alta intensità in esecuzione su cluster di grandi dimensioni di hardware di base.

Inoltre, cos'è Amazon Elastic MapReduce?

Amazon Elastic MapReduce ( EMR ) è un Servizi Web Amazon ( AWS ) strumento per l'elaborazione e l'analisi dei big data. Amazon EMR elabora i big data attraverso un cluster Hadoop di server virtuali su Amazon elastico Cloud di calcolo ( EC2 ) e Amazon Servizio di archiviazione semplice ( S3 ).

Inoltre, Amazon EMR è completamente gestito? È un completamente gestito servizio data lake che può disaccoppiare l'archiviazione dei dati dalle risorse di calcolo e rende invece i cluster di calcolo scalabili, disponibili per l'utilizzo su richiesta e include la possibilità per più cluster di accedere agli stessi set di dati contemporaneamente.

Ci si potrebbe anche chiedere, come funziona AWS EMR?

In genere, quando si elaborano i dati in Amazon EMR , l'input sono dati memorizzati come file nel file system sottostante scelto, come Amazon S3 o HDFS. Questi dati passano da un passaggio al successivo nella sequenza di elaborazione. Il passaggio finale scrive i dati di output in una posizione specificata, ad esempio an Amazon secchio S3.

Qual è la differenza tra ec2 ed EMR?

a differenza di EMR , EC2 non classifica i nodi slave in nodi principali e nodi di attività. Ciò aumenta il rischio di perdere dati HDFS nel caso in cui un nodo venga rimosso/perso. EC2 utilizza le librerie Apache (s3a) per accedere ai dati su s3. D'altra parte, EMR utilizza il codice proprietario di AWS per avere un accesso più rapido a s3.

Consigliato: