Criação de conjuntos de dados do Amazon S3 - Amazon Quick Suite

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação de conjuntos de dados do Amazon S3

Para criar um conjunto de dados do Amazon S3
  1. Marque Cotas de fonte de dados para garantir que seu arquivo de destino não exceda as cotas da fonte de dados.

  2. Crie um arquivo manifesto para identificar os arquivos de texto que você deseja importar, usando um dos formatos especificados em Formatos compatíveis para arquivos manifesto do Amazon S3.

  3. Salve o arquivo manifesto em um diretório local ou carregue-o no Amazon S3.

  4. Na página inicial do Quick Suite, escolha Dados.

  5. Na página Dados, escolha Criar e depois Novo conjunto de dados.

  6. Escolha o ícone Amazon S3 e, em seguida, escolha Avançar.

  7. Em Data source name (Nome da fonte de dados), digite uma descrição da fonte de dados. Esse nome deve ser algo que ajude a diferenciar essa fonte de dados de outras.

  8. Em Upload a manifest file, execute uma das seguintes opções:

    • Para usar um arquivo manifesto local, escolha Upload e, em seguida, Upload a JSON manifest file. Em Open, escolha um arquivo e, em seguida, Open.

    • Para usar um arquivo manifesto do Amazon S3, selecione URL e insira o URL do arquivo manifesto. Para encontrar o URL de um arquivo manifesto preexistente no console do Amazon S3, navegue até o arquivo apropriado e selecione-o. Um painel de propriedades é exibido, incluindo o link do URL. Você pode copiar o URL e colá-lo no Quick Sight.

  9. Selecione Conectar.

  10. Para ter certeza de que a conexão está concluída, escolha Edit/Preview data. Do contrário, escolha Visualize para criar uma análise usando os dados da forma como se encontram.

    Se escolher Editar ou visualizar dados, poderá especificar um nome de conjunto de dados como parte da preparação dos dados. Do contrário, o nome do conjunto de dados coincidirá com o nome do arquivo manifesto.

    Para saber mais sobre a preparação de dados, consulte Preparação de dados no Amazon Quick Sight.

Criação de conjuntos de dados baseados em vários arquivos do Amazon S3

Você pode usar um dos vários métodos para mesclar ou combinar arquivos dos buckets do Amazon S3 dentro do Quick Sight:

  • Combinar arquivos usando um manifesto: nesse caso, os arquivos devem ter o mesmo número de campos (colunas). Os tipos de dados entre os campos devem ter a mesma posição que no arquivo. Por exemplo, o primeiro campo deve ter o mesmo tipo de dados que em cada arquivo. O mesmo vale para o segundo campo, o terceiro e assim por diante. O Quick Sight usa os nomes dos campos do primeiro arquivo.

    Os arquivos devem ser listados explicitamente no manifesto. No entanto, não é preciso que estejam dentro do mesmo bucket do Amazon S3.

    Além disso, os arquivos devem seguir as regras descritas em Formatos compatíveis para arquivos manifesto do Amazon S3.

    Para obter mais detalhes sobre combinação de arquivos usando um manifesto, consulte Como criar um conjunto de dados usando arquivos do Amazon S3.

  • Mesclar arquivos sem usar um manifesto: para mesclar vários arquivos em um único sem a necessidade de listá-los individualmente no manifesto, use o Athena. Com esse método, você pode simplesmente consultar seus arquivos de texto, tal como eles estão em uma tabela em um banco de dados. Para obter mais informações, consulte a publicação Analyzing data in Amazon S3 using Athena no blog de big data.

  • Usar um script para anexar arquivos antes de importar: você pode usar um script criado para combinar os arquivos antes de carregá-los.