Tutorial: Integrazione con Apache Spark per importare o esportare dati

Apache Spark è un motore open source per l'analisi dei dati su larga scala. Apache Spark ti consente di eseguire analisi sui dati archiviati in Amazon Keyspaces in modo più efficiente. Puoi anche utilizzare Amazon Keyspaces per fornire alle applicazioni un accesso di lettura coerente, a una cifra in millisecondi, ai dati di analisi di Spark. L'open source Spark Cassandra Connector semplifica la lettura e la scrittura di dati tra Amazon Keyspaces e Spark.

Il supporto di Amazon Keyspaces per Spark Cassandra Connector semplifica l'esecuzione dei carichi di lavoro Cassandra nelle pipeline di Spark-based analisi utilizzando un servizio di database completamente gestito e senza server. Con Amazon Keyspaces, non devi preoccuparti che Spark possa competere per le stesse risorse infrastrutturali sottostanti delle tue tabelle. Le tabelle di Amazon Keyspaces si ridimensionano automaticamente verso l'alto e verso il basso in base al traffico dell'applicazione.

Il seguente tutorial illustra i passaggi e le best practice necessari per leggere e scrivere dati su Amazon Keyspaces utilizzando il connettore Spark Cassandra. Il tutorial mostra come migrare i dati su Amazon Keyspaces caricando dati da un file con Spark Cassandra Connector e scrivendoli in una tabella Amazon Keyspaces. Quindi, il tutorial mostra come leggere i dati da Amazon Keyspaces utilizzando il connettore Spark Cassandra. Lo faresti per eseguire i carichi di lavoro di Cassandra nelle pipeline di analisi. Spark-based

Argomenti

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Fase 7: (Facoltativo) Pulizia

Prerequisiti