Crie um AWS Glue rastreador - WorkSpaces Aplicativos da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Crie um AWS Glue rastreador

AWS Glue é um serviço de extração, transformação e carregamento (ETL) totalmente gerenciado que permite criar um banco de dados a partir dos dados do Amazon S3 e consultar esse banco de dados usando o Athena. Esse banco de dados também é conhecido como Catálogo AWS Glue de Dados. Um AWS Glue rastreador pode detectar automaticamente o esquema dos seus dados do Amazon S3 e criar o banco de dados e as tabelas correspondentes. WorkSpaces Os aplicativos fornecem um CloudFormation modelo que você pode usar para criar os AWS Glue recursos necessários.

Importante

A conclusão das etapas do procedimento a seguir cria um AWS Glue rastreador. Porém, estas etapas não iniciam o crawler. Para iniciar o crawler, você deve executar as etapas do próximo procedimento. Para obter mais informações sobre AWS Glue rastreadores, consulte Definindo rastreadores.

Para criar um AWS Glue rastreador
  1. Abra o console de WorkSpaces aplicativos em https://console.aws.amazon.com/appstream2.

  2. Escolha a AWS região para a qual você se inscreveu para receber relatórios de uso.

  3. No painel de navegação, escolha Usage Reports (Relatórios de uso) e verifique se o registro em log está habilitado.

  4. Na guia Detalhes do relatório, no parágrafo ao lado do Analytics, escolha o link do CloudFormationmodelo.

    A escolha do link abre o CloudFormation console, onde você pode revisar os parâmetros da CloudFormation pilha especificada pelo modelo antes de executá-la. O modelo, quando executado, cria um AWS Glue rastreador e vários exemplos de consultas do Athena.

  5. Na página Especificar detalhes, ao lado de ScheduleExpression, mantenha o valor padrão ou especifique um valor de expressão cron diferente para a frequência com que você deseja executar o rastreador. Não altere nenhum outro valor padrão. Quando concluir, selecione Próximo.

    Por padrão, o crawler está programado para ser executado diariamente, mas você pode configurar o crawler para ser executado semanalmente, mensalmente ou com outra frequência. Para obter informações sobre a sintaxe cron, consulte Expressões cron.

  6. Na página Options (Opções), mantenha os valores padrão e escolha Next (Próximo).

  7. Na página de revisão, marque a caixa de seleção ao lado de “Eu reconheço que CloudFormation pode criar recursos do IAM com nomes personalizados” e escolha Criar.

    Você deve ter permissões AWS Glue e AWS Identity and Access Management (IAM) suficientes para criar e executar a CloudFormation pilha. Se você não tiver as permissões necessárias, peça ao administrador da sua conta da Amazon Web Services para executar essas etapas na sua conta ou conceder as permissões a seguir.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "athena:CreateNamedQuery", "athena:BatchGetNamedQuery", "athena:GetNamedQuery", "athena:StartQueryExecution", "athena:GetQueryResults", "athena:GetQueryExecution", "athena:ListNamedQueries", "cloudformation:DescribeStacks", "cloudformation:GetStackPolicy", "cloudformation:DescribeStackEvents", "cloudformation:CreateStack", "cloudformation:GetTemplate", "cloudformation:ListChangeSets", "cloudformation:ListStackResources", "iam:GetRole", "iam:CreateRole", "iam:GetRolePolicy", "s3:GetBucketLocation", "s3:ListBucketMultipartUploads", "s3:ListBucket", "s3:ListMultipartUploadParts", "s3:PutObject", "s3:GetObject", "s3:AbortMultipartUpload" ], "Resource": [ "arn:aws:iam::*:role/AppStreamUsageReports-AppStreamUsageReportGlueRole*", "arn:aws:cloudformation:*:*:stack/AppStreamUsageReports/*", "arn:aws:athena:*:*:workgroup/primary", "arn:aws:s3:::aws-athena-query-results-*" ] }, { "Effect": "Allow", "Action": [ "iam:AttachRolePolicy", "iam:PutRolePolicy", "s3:GetObject", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::appstream-logs-*", "arn:aws:iam::*:role/AppStreamUsageReports-AppStreamUsageReportGlueRole*" ] }, { "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": [ "arn:aws:iam::*:role/AppStreamUsageReports-AppStreamUsageReportGlueRole*" ], "Condition": { "StringEquals": { "iam:PassedToService": "glue.amazonaws.com" } } }, { "Effect": "Allow", "Action": [ "cloudformation:GetTemplateSummary", "glue:GetResourcePolicy", "glue:GetCrawlers", "glue:BatchGetCrawlers", "glue:GetClassifiers", "glue:CreateClassifier", "glue:ListCrawlers", "glue:GetTags", "glue:GetCrawlerMetrics", "glue:GetClassifier", "tag:GetResources" ], "Resource": "*" }, { "Effect": "Allow", "Action": "athena:RunQuery", "Resource": "arn:aws:athena:*:*:workgroup/primary" }, { "Effect": "Allow", "Action": [ "glue:GetTables", "glue:GetPartitions", "glue:GetTable" ], "Resource": [ "arn:aws:glue:*:*:table/appstream-usage/*", "arn:aws:glue:*:*:database/appstream-usage", "arn:aws:glue:*:*:catalog" ] }, { "Effect": "Allow", "Action": [ "glue:GetDatabase", "glue:CreateDatabase", "glue:GetDatabases" ], "Resource": [ "arn:aws:glue:*:*:database/appstream-usage", "arn:aws:glue:*:*:catalog" ] }, { "Effect": "Allow", "Action": [ "glue:GetCrawler", "glue:StartCrawler", "glue:CreateCrawler" ], "Resource": "arn:aws:glue:*:*:crawler/appstream-usage*" }, { "Effect": "Allow", "Action": "glue:GetCatalogImportStatus", "Resource": "arn:aws:glue:*:*:catalog" } ] }