

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Leia, grave e faça upload de dados no Amazon S3 Express One Zone com o Amazon EMR no EKS
<a name="upload-data-s3-express"></a>

Com as versões 7.2.0 e superiores do Amazon EMR, você pode usar o Amazon EMR no EKS com a classe de armazenamento [Amazon S3 Express One Zone](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-express-one-zone.html) para melhorar a performance ao executar trabalhos e workloads. O S3 Express One Zone é uma classe de armazenamento de zona única e alta performance do Amazon S3 que oferece acesso consistente a dados de milissegundos de um dígito para a maioria das aplicações sensíveis à latência. Na hora da execução, o S3 Express One Zone oferece o armazenamento de objetos na nuvem com a menor latência e a maior performance do Amazon S3.

## Pré-requisitos
<a name="upload-data-s3-express-prereqs"></a>

Antes de usar o S3 Express One Zone com o Amazon EMR no EKS, você deve ter os seguintes pré-requisitos:
+ [Configuração do Amazon EMR no EKS concluída](https://docs.aws.amazon.com/emr/latest/EMR-on-EKS-DevelopmentGuide/setting-up.html).
+ Depois de configurar o Amazon EMR no EKS, [crie um cluster virtual](https://docs.aws.amazon.com/emr/latest/EMR-on-EKS-DevelopmentGuide/virtual-cluster.html#create-virtul-cluster).

## Conceitos básicos da classe S3 Express One Zone
<a name="upload-data-s3-express-getting-started"></a>

Siga estas etapas para começar a usar o S3 Express One Zone

1. Adicione a permissão `CreateSession` ao perfil de execução do trabalho. Quando o S3 Express One Zone executa inicialmente uma ação como `GET`, `LIST`, ou `PUT` em um objeto do S3, a classe de armazenamento chama `CreateSession` em seu nome. A seguir está um exemplo de como conceder a permissão `CreateSession`.

------
#### [ JSON ]

****  

   ```
   {
     "Version":"2012-10-17",		 	 	 
     "Statement": [
       {
         "Effect": "Allow",
         "Resource": [
           "arn:aws:s3express:*:*:bucket/DOC-EXAMPLE-BUCKET"
         ],
         "Action": [
           "s3express:CreateSession"
         ],
         "Sid": "AllowS3EXPRESSCreatesession"
       }
     ]
   }
   ```

------

1. Você deve usar o conector Apache Hadoop S3A para acessar os buckets do S3 Express, então altere seu Amazon S3 para usar o esquema de uso do conector. URIs `s3a` Se não usarem o esquema, você poderá alterar a implementação do sistema de arquivos usada nos esquemas `s3` e `s3n`.

   Para alterar o esquema do `s3`, especifique as seguintes configurações de cluster:

   ```
   [
     {
       "Classification": "core-site",
       "Properties": {
         "fs.s3.impl": "org.apache.hadoop.fs.s3a.S3AFileSystem",
         "fs.AbstractFileSystem.s3.impl": "org.apache.hadoop.fs.s3a.S3A"
       }
     }
   ]
   ```

   Para alterar o esquema do s3n, especifique as seguintes configurações de cluster:

   ```
   [
     {
       "Classification": "core-site",
       "Properties": {
         "fs.s3n.impl": "org.apache.hadoop.fs.s3a.S3AFileSystem",
         "fs.AbstractFileSystem.s3n.impl": "org.apache.hadoop.fs.s3a.S3A",
         "fs.s3a.endpoint.region": "us-west-2",
         "fs.s3a.change.detection.mode": "none",
         "fs.s3a.select.enabled": "false"
       }
     },
      {
       "Classification": "spark-defaults",
       "Properties": {
         "spark.hadoop.fs.s3a.aws.credentials.provider": "software.amazon.awssdk.auth.credentials.WebIdentityTokenFileCredentialsProvider",
         "spark.sql.sources.fastS3PartitionDiscovery.enabled": "false"
       }
     }
   ]
   ```

1. Na configuração spark-submit, use o provedor de credenciais de identidade da Web.

   ```
   "spark.hadoop.fs.s3a.aws.credentials.provider=com.amazonaws.auth.WebIdentityTokenCredentialsProvider"
   ```