Cos'è la trasmissione Spark?
Cos'è la trasmissione Spark?

Video: Cos'è la trasmissione Spark?

Video: Cos'è la trasmissione Spark?
Video: Ecco cosa fa l’EGR nella tua auto Diesel ! ma è illegale toglierla ! 2024, Maggio
Anonim

Trasmissione variabili in Apache Scintilla è un meccanismo per condividere le variabili tra gli executor che dovrebbero essere di sola lettura. Privo di trasmissione variabili queste variabili verrebbero inviate a ciascun executor per ogni trasformazione e azione e ciò può causare un sovraccarico della rete.

Allo stesso modo, le persone chiedono, quando dovrei trasmettere Spark?

Trasmissione le variabili vengono utilizzate principalmente quando le attività in più fasi richiedono gli stessi dati o quando è richiesta la memorizzazione nella cache dei dati nel modulo deserializzato. Trasmissione le variabili vengono create utilizzando una variabile v chiamando SparkContext.

Inoltre, cosa sono gli accumulatori e le variabili broadcast in spark? Scintilla supporta due tipi di condivisione variabili : variabili di trasmissione , che può essere utilizzato per memorizzare nella cache un valore in memoria su tutti i nodi, e accumulatori , quali sono variabili che vengono solo “aggiunte”, come contatori e somme.

Considerando questo, cos'è l'accumulatore di scintilla?

accumulatori sono variabili che vengono “aggiunte” solo attraverso un'operazione associativa e possono quindi essere efficacemente supportate in parallelo. Possono essere usati per implementare contatori (come in MapReduce) o somme. Scintilla supporta nativamente accumulatori di tipi numerici e i programmatori possono aggiungere il supporto per nuovi tipi.

Come aggiorno la mia variabile di trasmissione in spark?

  1. Sposta la ricerca dei dati di riferimento in un forEachPartition o forEachRdd in modo che risieda interamente sui worker.
  2. Riavvia il contesto Spark ogni volta che i dati di riferimento cambiano, con una nuova variabile di trasmissione.

Consigliato: