

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Configure o canal de entrada de dados para usar o Amazon FSx for Lustre
<a name="model-access-training-data-fsx"></a>

Aprenda a usar o Amazon FSx for Lustre como sua fonte de dados para maior produtividade e treinamento mais rápido, reduzindo o tempo de carregamento de dados.

**nota**  
Ao usar instâncias habilitadas para EFA, como P4d e P3dn, certifique-se de definir as regras de entrada e saída apropriadas no grupo de segurança. Especialmente, a abertura dessas portas é necessária para que a SageMaker IA acesse o sistema de FSx arquivos da Amazon no trabalho de treinamento. Para saber mais, consulte [Controle de acesso do sistema de arquivos com o Amazon VPC](https://docs.aws.amazon.com/fsx/latest/LustreGuide/limit-access-security-groups.html).

## Sincronize o Amazon S3 e o Amazon for FSx Lustre
<a name="model-access-training-data-fsx-sync-s3"></a>

Para vincular seu Amazon S3 ao Amazon FSx for Lustre e carregar seus conjuntos de dados de treinamento, faça o seguinte.

1. Prepare o conjunto de dados e faça upload para um bucket do Amazon S3. Por exemplo, suponha que os caminhos do Amazon S3 para um conjunto de dados de treino e um conjunto de dados de teste estejam no formato a seguir.

   ```
   s3://amzn-s3-demo-bucket/data/train
   s3://amzn-s3-demo-bucket/data/test
   ```

1. Para criar um FSx sistema de arquivos for Lustre vinculado ao bucket do Amazon S3 com os dados de treinamento, siga as etapas [em Vincular seu sistema de arquivos a um bucket do Amazon S3 no Guia do usuário *do FSx Amazon*](https://docs.aws.amazon.com/fsx/latest/LustreGuide/create-dra-linked-data-repo.html) for Lustre. Certifique-se de adicionar um endpoint à sua VPC permitindo o acesso ao Amazon S3. Para obter mais informações, consulte [Criar um endpoint da VPC para o Amazon S3](train-vpc.md#train-vpc-s3). Quando especificar o **caminho do repositório de dados**, forneça o URI do bucket do Amazon S3 da pasta que contém seus conjuntos de dados. Por exemplo, com base nos exemplos de caminhos do S3 na etapa 1, o caminho do repositório de dados deve ser o seguinte:

   ```
   s3://amzn-s3-demo-bucket/data
   ```

1. Depois que o sistema de arquivos FSx for Lustre for criado, verifique as informações de configuração executando os seguintes comandos.

   ```
   aws fsx describe-file-systems && \
   aws fsx describe-data-repository-association
   ```

   Esses comandos retornam `FileSystemId`, `MountName`, `FileSystemPath` e `DataRepositoryPath`. Por exemplo, os resultados serão semelhantes ao seguinte:

   ```
   # Output of aws fsx describe-file-systems
   "FileSystemId": "fs-0123456789abcdef0"
   "MountName": "1234abcd"
   
   # Output of aws fsx describe-data-repository-association
   "FileSystemPath": "/ns1",
   "DataRepositoryPath": "s3://amzn-s3-demo-bucket/data/"
   ```

   Depois que a sincronização entre o Amazon S3 e a Amazon for FSx concluída, seus conjuntos de dados serão salvos na Amazon FSx nos seguintes diretórios.

   ```
   /ns1/train  # synced with s3://amzn-s3-demo-bucket/data/train
   /ns1/test   # synced with s3://amzn-s3-demo-bucket/data/test
   ```

## Defina o caminho do sistema de FSx arquivos da Amazon como o canal de entrada de dados para SageMaker treinamento
<a name="model-access-training-data-fsx-set-as-input-channel"></a>

Os procedimentos a seguir orientam você no processo de configuração do sistema de FSx arquivos da Amazon como fonte de dados para trabalhos de SageMaker treinamento.

------
#### [ Using the SageMaker Python SDK ]

Para definir adequadamente o sistema de FSx arquivos da Amazon como fonte de dados, configure as classes do estimador de SageMaker IA `FileSystemInput` usando as instruções a seguir.

1. Configure um objeto FileSystemInput de classe.

   ```
   from sagemaker.inputs import FileSystemInput
   
   train_fs = FileSystemInput(
       file_system_id="fs-0123456789abcdef0",
       file_system_type="FSxLustre",
       directory_path="/1234abcd/ns1/",
       file_system_access_mode="ro",
   )
   ```
**dica**  
Ao especificar`directory_path`, certifique-se de fornecer o caminho do sistema de FSx arquivos da Amazon começando com`MountName`.

1. Configure um estimador de SageMaker IA com a configuração de VPC usada para o sistema de arquivos da Amazon. FSx 

   ```
   from sagemaker.estimator import Estimator
   
   estimator = Estimator(
       ...
       role="your-iam-role-with-access-to-your-fsx",
       subnets=["subnet-id"],  # Should be the same as the subnet used for Amazon FSx
       security_group_ids="security-group-id"
   )
   ```

   Certifique-se de que a função do IAM para o trabalho de SageMaker treinamento tenha as permissões para acessar e ler na Amazon FSx.

1. Inicie o trabalho de treinamento executando o método estimator.fit com o sistema de arquivos da Amazon. FSx

   ```
   estimator.fit(train_fs)
   ```

Para encontrar mais exemplos de código, consulte [Usar sistemas de arquivos como entradas de treinamento na documentação](https://sagemaker.readthedocs.io/en/stable/overview.html#use-file-systems-as-training-inputs) do SDK do *SageMaker Python*.

------
#### [ Using the SageMaker AI CreateTrainingJob API ]

Como parte da [CreateTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)solicitação JSON, configure da `InputDataConfig` seguinte maneira.

```
"InputDataConfig": [ 
    { 
        "ChannelName": "string",
        "DataSource": { 
            "FileSystemDataSource": { 
                "DirectoryPath": "/1234abcd/ns1/",
                "FileSystemAccessMode": "ro",
                "FileSystemId": "fs-0123456789abcdef0",
                "FileSystemType": "FSxLustre"
            }
        }
    }
],
```

**dica**  
Ao especificar`DirectoryPath`, certifique-se de fornecer o caminho do sistema de FSx arquivos da Amazon começando com`MountName`.

------