Inicialização de uma aplicação do Spark com a integração do Amazon Redshift para Apache Spark

Para usar a integração com o EMR Sem Servidor 6.9.0, passe as dependências necessárias do Redshift para Spark com o trabalho do Spark. Use --jars para incluir as bibliotecas relacionadas ao conector do Redshift. Para acessar outros locais de arquivo com suporte pela opção --jars, consulte a seção Gerenciamento avançado de dependências na documentação do Apache Spark.

spark-redshift.jar
spark-avro.jar
RedshiftJDBC.jar
minimal-json.jar

As versões 6.10.0 e superiores do Amazon EMR não exigem a dependência minimal-json.jar e, por padrão, instalam automaticamente as outras dependências em cada cluster. Os exemplos a seguir demonstram como iniciar uma aplicação do Spark com a integração do Amazon Redshift para Apache Spark.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Usar o Spark no Amazon Redshift

Autenticação no Amazon Redshift