Especificar um local de tabela no Amazon S3 - Amazon Athena

Especificar um local de tabela no Amazon S3

Quando você executa uma consulta CREATE TABLE no Athena, ele registra a tabela no Catálogo de Dados do AWS Glue, que é onde o Athena armazena os metadados.

Para especificar o caminho para os seus dados no Amazon S3, use a propriedade LOCATION na sua instrução CREATE TABLE, conforme o exemplo a seguir:

CREATE EXTERNAL TABLE `test_table`( ... ) ROW FORMAT ... STORED AS INPUTFORMAT ... OUTPUTFORMAT ... LOCATION s3://amzn-s3-demo-bucket/folder/
  • Para obter informações sobre a nomenclatura de buckets, consulte Restrições e limitações do bucket no Guia do usuário do Amazon Simple Storage Service.

  • Para obter informações sobre o uso de pastas no Amazon S3, consulte Usar pastas no Guia do usuário do Amazon Simple Storage Service.

O LOCATION no Amazon S3 especifica todos os arquivos que representam sua tabela.

Importante

O Athena lê todos os dados armazenados na pasta do Amazon S3 que você especificar. Se você tem dados que não deseja que o Athena leia, não os armazene na mesma pasta do Amazon S3 que os dados que deseja que o Athena leia.

Ao especificar o LOCATION na instrução CREATE TABLE, use as seguintes diretrizes:

  • Use uma barra no final.

  • Você pode usar um caminho para uma pasta do Amazon S3 ou um alias de ponto de acesso do Amazon S3. Para obter informações sobre aliases de ponto de acesso do Amazon S3, consulte Usar um alias em estilo de bucket para seu ponto de acesso no Manual do usuário do Amazon S3.

Use:

s3://amzn-s3-demo-bucket/folder/
s3://amzn-s3-demo-bucket-metadata-s3alias/folder/

Não use nenhum dos itens a seguir para especificar a LOCATION dos dados.

  • Não use nomes de arquivo, sublinhado, curingas ou padrões glob para especificar locais de arquivos.

  • Não adicione a notação HTTP completa, como s3.amazon.com ao caminho do bucket do Amazon S3.

  • Não use pastas vazias, como //, no caminho, conforme segue: S3://amzn-s3-demo-bucket/folder//folder/.

  • Não use os caminhos da seguinte maneira:

    s3://amzn-s3-demo-bucket s3://amzn-s3-demo-bucket/* s3://amzn-s3-demo-bucket/mySpecialFile.dat s3://amzn-s3-demo-bucket/prefix/filename.csv s3://amzn-s3-demo-bucket.s3.amazon.com S3://amzn-s3-demo-bucket/prefix//prefix/ arn:aws:s3:::amzn-s3-demo-bucket/prefix s3://arn:aws:s3:<region>:<account_id>:accesspoint/<accesspointname> https://<accesspointname>-<number>.s3-accesspoint.<region>.amazonaws.com