Che cos'è AWS MapReduce?
Che cos'è AWS MapReduce?

Video: Che cos'è AWS MapReduce?

Video: Che cos'è AWS MapReduce?
Video: What is Amazon EMR and how can I use it for processing data? 2024, Novembre
Anonim

Amazon elastico Riduci mappa (EMR) è un Amazon Web Services ( AWS ) strumento per l'elaborazione e l'analisi dei big data. Amazon EMR elabora i big data in un cluster Hadoop di server virtuali su Amazon Elastic Compute Cloud (EC2) e Amazon Simple Storage Service (S3).

In questo modo, come funziona AWS EMR?

Il servizio avvia un numero specificato dal cliente di istanze Amazon EC2, composto da un master e più altri nodi. Amazon EMR esegue il software Hadoop su queste istanze. Il nodo master divide i dati di input in blocchi e distribuisce l'elaborazione dei blocchi agli altri nodi.

Oltre a sopra, qual è la differenza tra ec2 ed EMR? a differenza di EMR , EC2 non classifica i nodi slave in nodi principali e nodi di attività. Ciò aumenta il rischio di perdere dati HDFS nel caso in cui un nodo venga rimosso/perso. EC2 utilizza le librerie Apache (s3a) per accedere ai dati su s3. D'altra parte, EMR utilizza il codice proprietario di AWS per avere un accesso più rapido a s3.

Inoltre, AWS EMR è completamente gestito?

Amazon Elastic MapReduce ( EMR ) è un completamente gestito Piattaforma Hadoop e Spark da Amazon Servizio web ( AWS ). Insieme a EMR , AWS i clienti possono avviare rapidamente cluster Hadoop multi-nodo per elaborare carichi di lavoro di big data.

AWS utilizza Hadoop?

Amazon Servizi web usa l'open source Apache Hadoop tecnologia di elaborazione distribuita per facilitare l'accesso a grandi quantità di potenza di calcolo per eseguire attività ad alta intensità di dati. Hadoop , la versione open source di MapReduce di Google, è già utilizzata da aziende come Yahoo e Facebook.

Consigliato: