Tutorial: Integrazione con Apache Spark per importare o esportare dati - Amazon Keyspaces (per Apache Cassandra)

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Tutorial: Integrazione con Apache Spark per importare o esportare dati

Apache Spark è un motore open source per l'analisi dei dati su larga scala. Apache Spark ti consente di eseguire analisi sui dati archiviati in Amazon Keyspaces in modo più efficiente. Puoi anche utilizzare Amazon Keyspaces per fornire alle applicazioni un accesso coerente e in single-digit-millisecond lettura ai dati di analisi di Spark. L'open source Spark Cassandra Connector semplifica la lettura e la scrittura di dati tra Amazon Keyspaces e Spark.

Il supporto di Amazon Keyspaces per Spark Cassandra Connector semplifica l'esecuzione dei carichi di lavoro Cassandra nelle pipeline di analisi basate su Spark utilizzando un servizio di database completamente gestito e senza server. Con Amazon Keyspaces, non devi preoccuparti che Spark possa competere per le stesse risorse infrastrutturali sottostanti delle tue tabelle. Le tabelle di Amazon Keyspaces si ridimensionano automaticamente verso l'alto e verso il basso in base al traffico dell'applicazione.

Il seguente tutorial illustra i passaggi e le best practice necessari per leggere e scrivere dati su Amazon Keyspaces utilizzando il connettore Spark Cassandra. Il tutorial dimostra come migrare i dati su Amazon Keyspaces caricando dati da un file con Spark Cassandra Connector e scrivendoli in una tabella Amazon Keyspaces. Quindi, il tutorial mostra come leggere i dati da Amazon Keyspaces utilizzando il connettore Spark Cassandra. Lo faresti per eseguire i carichi di lavoro di Cassandra in pipeline di analisi basate su Spark.