As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Considerações e limitações ao usar o conector do Spark
-
Sugerimos que você ative o SSL para a conexão JDBC do Spark no Amazon EMR com o Amazon Redshift.
-
Sugerimos que você gerencie as credenciais do cluster Amazon Redshift como uma AWS Secrets Manager prática recomendada. Consulte Usando AWS Secrets Manager para recuperar credenciais para se conectar ao Amazon Redshift para ver um exemplo.
-
Sugerimos que você transmita uma função do IAM com o parâmetro
aws_iam_rolepara o parâmetro de autenticação do Amazon Redshift. -
No momento, o parâmetro
tempformatnão é compatível com o formato Parquet. -
O URI
tempdiraponta para um local do Amazon S3. Esse diretório temporário não é limpo automaticamente e, portanto, pode incorrer em custos adicionais. -
Considere as seguintes recomendações para o Amazon Redshift:
-
Sugerimos que você bloqueie o acesso público ao cluster do Amazon Redshift.
-
Sugerimos que você ative o registro de auditoria do Amazon Redshift.
-
Sugerimos que você ative a criptografia em repouso do Amazon Redshift.
-
-
Considere as seguintes recomendações para o Amazon S3:
-
Sugerimos que você bloqueie o acesso público aos buckets do Amazon S3.
-
Sugerimos que você use a criptografia do lado do servidor do Amazon S3 para criptografar os buckets do Amazon S3 usados.
-
Sugerimos que você use as políticas de ciclo de vida do Amazon S3 para definir as regras de retenção para o bucket do Amazon S3.
-
O Amazon EMR sempre verifica o código importado do código aberto para a imagem. Por motivos de segurança, não oferecemos suporte aos seguintes métodos de autenticação do Spark para o Amazon S3:
-
Definindo chaves de AWS acesso na classificação
hadoop-envde configuração -
Codificando chaves de AWS acesso no URI
tempdir
-
-
Para obter mais informações sobre como usar o conector e os parâmetros compatíveis, consulte os seguintes recursos:
-
Integração do Amazon Redshift para Apache Spark no Guia de gerenciamento do Amazon Redshift.
-
O repositório da comunidade
spark-redshiftno GitHub.