Tutorial: Integre com o Apache Spark para importar ou exportar dados - Amazon Keyspaces (para Apache Cassandra)

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Tutorial: Integre com o Apache Spark para importar ou exportar dados

O Apache Spark é um mecanismo de código aberto para análise de dados em grande escala. O Apache Spark permite que você realize análises em dados armazenados no Amazon Keyspaces com mais eficiência. Você também pode usar o Amazon Keyspaces para fornecer aos aplicativos acesso consistente e de single-digit-millisecond leitura aos dados analíticos do Spark. O Spark Cassandra Connector de código aberto simplifica a leitura e gravação de dados entre o Amazon Keyspaces e o Spark.

O suporte do Amazon Keyspaces para o Spark Cassandra Connector simplifica a execução de workloads do Cassandra em pipelines de análise baseados em Spark usando um serviço de banco de dados totalmente gerenciado e de tecnologia sem servidor. Com o Amazon Keyspaces, você não precisa se preocupar com a concorrência do Spark pelos mesmos recursos de infraestrutura subjacente de suas tabelas. As tabelas do Amazon Keyspaces aumentam e diminuem a escala automaticamente com base no tráfego do seu aplicativo.

O tutorial a seguir mostra as etapas e as práticas recomendadas necessárias para ler e gravar dados no Amazon Keyspaces usando o Spark Cassandra Connector. O tutorial demonstra como migrar dados para o Amazon Keyspaces carregando dados de um arquivo com o Spark Cassandra Connector e gravando-os em uma tabela do Amazon Keyspaces. Em seguida, o tutorial mostra como ler os dados do Amazon Keyspaces usando o Spark Cassandra Connector. Você faria isso para executar workloads do Cassandra em pipelines de análise baseados em Spark.