As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Consultar grandes conjuntos de dados usando um crawler do AWS Glue
<a name="sample-query-large-datasets"></a>

Este exemplo de projeto demonstra como ingerir um grande conjunto de dados no Amazon S3 e particioná-lo por meio de crawlers AWS Glue e, em seguida, executar queries do Amazon Athena nessa partição.

Neste projeto, a máquina de estado do Step Functions invoca um crawler AWS Glue que particiona um grande conjunto de dados no Amazon S3. Depois que o crawler AWS Glue retorna uma mensagem de sucesso, o fluxo de trabalho executa as queries do Athena nessa partição. Quando a execução da query for concluída com sucesso, uma notificação do Amazon SNS será enviada para um tópico do Amazon SNS.

## Etapa 1: Criar a máquina de estado
<a name="sample-query-large-datasets-create"></a>

1. Abra o [console do Step Functions](https://console.aws.amazon.com/states/home?region=us-east-1#/) e clique em **Criar máquina de estado**.

1. Selecione **Criar a partir do modelo** e encontre o modelo inicial relacionado. Escolha **Próximo** para continuar.

1. Escolha como usar o modelo:

   1. **Executar uma demonstração**: cria uma máquina de estado somente leitura. Após a revisão, você pode criar o fluxo de trabalho e todos os recursos relacionados.

   1. **Comece a criar**: fornece uma definição de fluxo de trabalho editável que você pode revisar, personalizar e implantar com seus próprios recursos. (Recursos relacionados, como perfis ou filas, **não** serão criados automaticamente.)

1. Escolha **Usar modelo** para continuar com a seleção.
**nota**  
*Cobranças padrão são aplicadas aos serviços implantados na conta.*

## Etapa 2: Executar a máquina de estado de demonstração
<a name="sample-query-large-datasets-start-execution"></a>

Se você escolher a opção **Executar uma demonstração**, todos os recursos relacionados serão implantados e estarão prontos para execução. Se você escolheu a opção **Comece a criar**, talvez seja necessário definir valores de espaço reservado e criar recursos adicionais antes de executar seu fluxo de trabalho personalizado.

1. Selecione **Implantar e executar**.

1. Aguarde até que a pilha do CloudFormation seja implantada. Esse processo pode levar até 10 minutos.

1. Depois que a opção **Iniciar execução** for exibida, revise a **Entrada** e selecione **Iniciar execução**.

**Parabéns\!**  
Agora você deve ter uma demonstração em execução da máquina de estado. Você pode escolher estados na **visualização do gráfico** para revisar a entrada, a saída, as variáveis, a definição e os eventos.