Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Consideraciones y limitaciones al utilizar el conector de Spark
-
Le sugerimos que active SSL para la conexión JDBC de Spark en Amazon EMR a Amazon Redshift.
-
Le sugerimos que gestione las credenciales del clúster de Amazon Redshift AWS Secrets Manager como práctica recomendada. Consulte Uso AWS Secrets Manager para recuperar credenciales para conectarse a Amazon Redshift para ver un ejemplo.
-
Le sugerimos que asigne un rol de IAM con el parámetro
aws_iam_rolede autenticación de Amazon Redshift. -
Actualmente, el parámetro
tempformatno admite el formato Parquet. -
El URI
tempdirapunta a una ubicación de Amazon S3. Este directorio temporal no se limpia automáticamente y, por lo tanto, podría agregar costos adicionales. -
Tenga en cuenta las siguientes recomendaciones para Amazon Redshift:
-
Le sugerimos que bloquee el acceso público al clúster de Amazon Redshift.
-
Le sugerimos que active el registro de auditoría de Amazon Redshift.
-
Le sugerimos que active el cifrado en reposo de Amazon Redshift.
-
-
Tenga en cuenta las siguientes recomendaciones para Amazon S3:
-
Le sugerimos que bloquee el acceso público a los buckets de Amazon S3.
-
Le sugerimos que utilice el cifrado del lado del servidor de Amazon S3 para cifrar los buckets de Amazon S3 utilizados.
-
Le sugerimos que utilice las políticas de ciclo de vida de Amazon S3 para definir las reglas de retención del bucket de Amazon S3.
-
Amazon EMR siempre verifica el código importado desde el código abierto a la imagen. Por motivos de seguridad, no admitimos los siguientes métodos de autenticación de Spark a Amazon S3:
-
Establecer las claves de AWS acceso en la clasificación
hadoop-envde configuración -
Codificación de las claves de AWS acceso en el
tempdirURI
-
-
Para obtener más información sobre el uso del conector y sus parámetros compatibles, consulte los siguientes recursos:
-
Integración de Amazon Redshift para Apache Spark en la Guía de administración de Amazon Redshift