Informações sobre a versão anterior do Managed Service for Apache Flink - Managed Service for Apache Flink

Anteriormente, o Amazon Managed Service for Apache Flink (Amazon MSF) era conhecido como Amazon Kinesis Data Analytics for Apache Flink.

Informações sobre a versão anterior do Managed Service for Apache Flink

nota

As versões 1.6, 1.8 e 1.11 do Apache Flink não são suportadas pela comunidade Apache Flink há mais de três anos. Nós emitimos um aviso sobre essa alteração em junho de 2024 e outubro de 2024 e agora encerraremos o suporte para essas versões no Amazon Managed Service for Apache Flink.

  • Em 14 de julho de 2025 interromperemos os aplicativos e os colocaremos em um estado READY. Você poderá reiniciar as aplicações nesse momento e continuar a usá-las normalmente, sujeito aos limites de serviço.

  • A partir de 28 de julho de 2025, desativaremos a capacidade de INICIAR seus aplicativos. Você não poderá mais iniciar nem operar os aplicativos do Flink versão 1.6 a partir desse momento.

Recomendamos atualizar imediatamente todos os aplicativos existentes usando o Apache Flink versão 1.6, 1.8 ou 1.11 para o Apache Flink versão 1.20. Essa é a versão mais recente do Flink com suporte. Você pode atualizar seus aplicativos usando o recurso de atualização de versão in-place no Amazon Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.

Em caso de outras dúvidas ou preocupações, entre em contato conosco em AWS Support.

nota

A versão 1.13 do Apache Flink não tem suporte da comunidade Apache Flink há mais de três anos. Agora planejamos encerrar o suporte para essa versão no Amazon Managed Service for Apache Flink em 16 de outubro de 2025. Após essa data, você não poderá mais criar, iniciar ou executar aplicativos usando o Apache Flink versão 1.13 no Amazon Managed Service for Apache Flink.

Você pode atualizar seus aplicativos de forma estável usando o recurso de atualizações de versão in-place no Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.

A versão 1.15.2 é suportada pelo Managed Service for Apache Flink, mas não mais pela comunidade Apache Flink.

Uso do conector Kinesis Streams para o Apache Flink com versões anteriores do Apache Flink

O conector de fluxos Kinesis para o Apache Flink não estava incluído no Apache Flink antes da versão 1.11. Para que seu aplicativo use o conector Kinesis para o Apache Flink com versões anteriores do Apache Flink, você deve baixar, compilar e instalar a versão do Apache Flink que seu aplicativo usa. Esse conector é usado para consumir dados de um Kinesis Stream usado como fonte do aplicativo ou para gravar dados em um Kinesis Stream usado para saída do aplicativo.

nota

Certifique-se de criar o conector com a versão 0.14.0 do KPL ou superior.

Para baixar e instalar o código-fonte do Apache Flink versão 1.8.2, faça o seguinte:

  1. Certifique-se de ter o Apache Maven instalado e que sua variável de ambiente JAVA_HOME aponte para um JDK em vez de um JRE. Você pode testar a instalação do Apache Maven com o seguinte comando:

    mvn -version
  2. Baixe o código-fonte do Apache Flink versão 1.8.2:

    wget https://archive.apache.org/dist/flink/flink-1.8.2/flink-1.8.2-src.tgz
  3. Descompacte o código-fonte do Apache Flink:

    tar -xvf flink-1.8.2-src.tgz
  4. Vá para o diretório do código-fonte do Apache Flink:

    cd flink-1.8.2
  5. Compile e instale o Apache Flink:

    mvn clean install -Pinclude-kinesis -DskipTests
    nota

    Se você estiver compilando o Flink no Microsoft Windows, precisará adicionar o parâmetro -Drat.skip=true.

Compilação de aplicativos com o Apache Flink 1.8.2

Esta seção contém informações sobre os componentes que você usa para criar aplicativos do Managed Service for Apache Flink que funcionam com o Apache Flink 1.8.2.

Use as seguintes versões de componentes para os aplicativos do Managed Service for Apache Flink:

Componente Versão
Java 1.8 (recomendado)
Apache Flink 1.8.2
Runtime for Flink do Managed Service for Apache Flink (aws-kinesisanalytics-runtime) 1.0.1
Conectores do Managed Service for Apache Flink (aws-kinesisanalytics-flink) 1.0.1
Apache Maven 3.1

Para compilar um aplicativo usando o Apache Flink 1.8.2, execute o Maven com o seguinte parâmetro:

mvn package -Dflink.version=1.8.2

Para obter um exemplo de arquivo pom.xml para um aplicativo do Managed Service for Apache Flink que usa o Apache Flink versão 1.8.2, consulte Aplicativo de conceitos básicos do Managed Service for Apache Flink 1.8.2.

Para obter informações sobre como criar e usar o código de aplicativo para um aplicativo do Managed Service for Apache Flink, consulte. Cria uma aplicação

Compilação de aplicativos com o Apache Flink 1.6.2

Esta seção contém informações sobre os componentes que você usa para criar aplicativos do Managed Service for Apache Flink que funcionam com o Apache Flink 1.6.2.

Use as seguintes versões de componentes para os aplicativos do Managed Service for Apache Flink:

Componente Versão
Java 1.8 (recomendado)
AWS SDK do Java 1.11.379
Apache Flink 1.6.2
Runtime for Flink do Managed Service for Apache Flink (aws-kinesisanalytics-runtime) 1.0.1
Conectores do Managed Service for Apache Flink (aws-kinesisanalytics-flink) 1.0.1
Apache Maven 3.1
Apache Beam Não é compatível com o Apache Flink 1.6.2.
nota

Ao usar o Runtime do Managed Service for Apache Flink versão 1.0.1, você especifica a versão do Apache Flink em seu arquivo pom.xml em vez de usar o parâmetro -Dflink.version ao compilar o código do aplicativo.

Para obter um exemplo de arquivo pom.xml para um aplicativo do Managed Service for Apache Flink que usa o Apache Flink versão 1.6.2, consulte Aplicativo de conceitos básicos do Managed Service for Apache Flink 1.6.2.

Para obter informações sobre como criar e usar o código de aplicativo para um aplicativo do Managed Service for Apache Flink, consulte. Cria uma aplicação

Atualização de aplicativos

Para atualizar a versão Apache Flink de um aplicativo Amazon Managed Service for Apache Flink, use o recurso de atualização de versão do Apache Flink in-place usando o AWS CLI, AWS SDK, CloudFormation ou o Console de gerenciamento da AWS. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.

Você pode usar esse recurso com qualquer aplicativo existente que você usa com o Amazon Managed Service for Apache Flink no estado READY ou RUNNING.

Conectores disponíveis no Apache Flink 1.6.2 e 1.8.2

A estrutura do Apache Flink contém conectores para acessar dados de várias fontes.

Introdução: Flink 1.13.2

Esta seção apresenta os conceitos fundamentais do Managed Service for Apache Flink e da API DataStream. Ela descreve as opções disponíveis para criar e testar seus aplicativos. Ela também fornece instruções para instalar as ferramentas necessárias para concluir os tutoriais deste guia e criar seu primeiro aplicativo.

Componentes de um aplicativo Managed Service for Apache Flink

Para processar dados, seu aplicativo Managed Service for Apache Flink usa um aplicativo Java/Apache Maven ou Scala que processa a entrada e produz a saída usando o runtime do Apache Flink.

O aplicativo do Managed Service for Apache Flink tem os seguintes componentes:

  • Propriedades de runtime: você pode usar as propriedades de runtime para configurar seu aplicativo sem recompilar o código do aplicativo.

  • Fonte: o aplicativo consome dados usando uma fonte. Um conector de origem lê dados de um fluxo de dados do Kinesis, de um bucket do Amazon S3 etc. Para obter mais informações, consulte Adicione fontes de dados de transmissão.

  • Operadores: o aplicativo processa dados usando um ou mais operadores. Um operador pode transformar, enriquecer ou agregar dados. Para obter mais informações, consulte Operadores.

  • Coletor: o aplicativo produz dados para fontes externas usando coletores. Um conector do coletor grava dados em um fluxo de dados do Kinesis, um fluxo do Firehose, um bucket do Amazon S3 etc. Para obter mais informações, consulte Grave dados usando coletores .

Depois de criar, compilar e empacotar o código da aplicativo, é necessário fazer o upload do pacote do código em um bucket do Amazon Simple Storage Service (Amazon S3). Em seguida, crie um aplicativo do Managed Service for Apache Flink. Você passa na localização do pacote de código, um fluxo de dados do Kinesis como fonte de dados de fluxo e, normalmente, um local de fluxo ou arquivo que recebe os dados processados do aplicativo.

Pré-requisitos para concluir os exercícios

Para concluir as etapas neste guia, é necessário ter o seguinte:

Para começar a usar, vá até Configure uma conta da AWS e crie um usuário administrador.

Etapa 1: configurar uma conta da AWS e criar um usuário administrador

Inscrever-se para uma Conta da AWS

Se você ainda não tem uma Conta da AWS, siga as etapas abaixo para criar uma.

Como cadastrar uma Conta da AWS
  1. Abra https://portal.aws.amazon.com/billing/signup.

  2. Siga as instruções online.

    Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.

    Quando você se inscreve para uma Conta da AWS, um Usuário raiz da conta da AWS é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar tarefas que exigem acesso de usuário-raiz.

A AWS envia um e-mail de confirmação depois que o processo de inscrição é concluído. A qualquer momento, é possível exibir as atividades da conta atual e gerenciar sua conta acessando https://aws.amazon.com/ e selecionando Minha conta.

Criar um usuário com acesso administrativo

Depois de se cadastrar em uma Conta da AWS, proteja seu Usuário raiz da conta da AWS, habilite o AWS IAM Identity Center e crie um usuário administrativo para não usar o usuário-raiz em tarefas cotidianas.

Proteger o Usuário raiz da conta da AWS
  1. Faça login no Console de gerenciamento da AWS como o proprietário da conta ao escolher a opção Usuário-raiz e inserir o endereço de e-mail da Conta da AWS. Na próxima página, insira a senha.

    Para obter ajuda ao fazer login usando o usuário-raiz, consulte Fazer login como usuário-raiz no Guia do usuário do Início de Sessão da AWS.

  2. Habilite a autenticação multifator (MFA) para o usuário-raiz.

    Para obter instruções, consulte Habilitar um dispositivo MFA virtual para sua Conta da AWS de usuário-raiz (console) no Guia do usuário do IAM.

Criar um usuário com acesso administrativo
  1. Habilita o Centro de Identidade do IAM.

    Para obter instruções, consulte Habilitar o AWS IAM Identity Center no Guia do usuário do AWS IAM Identity Center.

  2. No Centro de Identidade do IAM, conceda o acesso administrativo a um usuário.

    Para obter um tutorial sobre como usar o Diretório do Centro de Identidade do IAM como a fonte de identidade, consulte Configurar o acesso dos usuários com o Diretório do Centro de Identidade do IAM padrão no Guia do usuário do AWS IAM Identity Center.

Iniciar sessão como o usuário com acesso administrativo
  • Para fazer login com o seu usuário do Centro de Identidade do IAM, use o URL de login enviado ao seu endereço de e-mail quando o usuário do Centro de Identidade do IAM foi criado.

    Para obter ajuda para fazer login usando um usuário do Centro de Identidade do IAM, consulte Fazer login no portal de acesso da AWS, no Guia do usuário do Início de Sessão da AWS.

Atribuir acesso a usuários adicionais
  1. No Centro de Identidade do IAM, crie um conjunto de permissões que siga as práticas recomendadas de aplicação de permissões com privilégio mínimo.

    Para obter instruções, consulte Criar um conjunto de permissões no Guia do usuário do AWS IAM Identity Center.

  2. Atribua usuários a um grupo e, em seguida, atribua o acesso de autenticação única ao grupo.

    Para obter instruções, consulte Adicionar grupos no Guia do usuário do AWS IAM Identity Center.

Conceder acesso programático

Os usuários precisam de acesso programático se quiserem interagir com a AWS de fora do Console de gerenciamento da AWS. A forma de conceder acesso programático depende do tipo de usuário que está acessando a AWS.

Para conceder acesso programático aos usuários, selecione uma das seguintes opções:

Qual usuário precisa de acesso programático? Para Por

Identidade da força de trabalho

(Usuários gerenciados no Centro de Identidade do IAM)

Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS.

Siga as instruções da interface que deseja utilizar.

IAM Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. Siga as instruções em Usar credenciais temporárias com recursos da AWS no Guia do usuário do IAM.
IAM

(Não recomendado)

Use credenciais de longo prazo para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS.

Siga as instruções da interface que deseja utilizar.

Próxima etapa

Configurar a AWS Command Line Interface (AWS CLI)

Próxima etapa

Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)

Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)

Nesta etapa, você baixa e configura a AWS CLI para uso com o Managed Service for Apache Flink.

nota

Os exercícios de conceitos básicos neste guia pressupõem o uso de credenciais de administrador (adminuser) em sua conta para executar as operações.

nota

Se já tiver a AWS CLI instalada, pode ser necessário atualizá-la para obter as funcionalidades mais recentes. Para obter mais informações, consulte Instalar a AWS Command Line Interface no Guia do usuário da AWS Command Line Interface. Para verificar a versão da AWS CLI, execute o seguinte comando:

aws --version

Os exercícios neste tutorial requerem a seguinte versão da AWS CLI ou posterior:

aws-cli/1.16.63
Para configurar a AWS CLI
  1. Faça download e configure a AWS CLI. Para obter instruções, consulte os seguintes tópicos no Guia do usuário do AWS Command Line Interface:

  2. Adicione um perfil nomeado para o usuário administrador no arquivo AWS CLI config . É possível usar esse perfil ao executar os comandos da AWS CLI. Para obter mais informações sobre perfis nomeados, consulte Perfis nomeados no Guia do usuário da AWS Command Line Interface.

    [profile adminuser] aws_access_key_id = adminuser access key ID aws_secret_access_key = adminuser secret access key region = aws-region

    Para obter uma lista das regiões da AWS disponíveis, consulte Regiões e endpoints no Referência geral da Amazon Web Services.

    nota

    O código e os comandos de exemplo neste tutorial usam a região Oeste dos EUA (Oregon). Para usar uma região diferente, altere a região no código e nos comandos deste tutorial para a região que você deseja usar.

  3. Verifique a configuração digitando o seguinte comando no prompt de comando:

    aws help

Depois de configurar uma conta da AWS e a AWS CLI, avance para o próximo exercício para tentar configurar um aplicativo de exemplo e testar toda a configuração.

Próxima etapa

Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink

Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink

Neste exercício, será criado um aplicativo Managed Service for Apache Flink com fluxos de dados como origem e coletor.

Criar dois fluxos de dados do Amazon Kinesis

Antes de criar um aplicativo do Managed Service for Apache Flink para este exercício, crie dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream). O aplicativo usa esses fluxos para os fluxos de origem e de destino do aplicativo.

É possível criar esses fluxos usando o console do Amazon Kinesis ou o comando da AWS CLI a seguir. Para obter instruções sobre o console, consulte Criar e atualizar fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams.

Como criar os fluxos de dados (AWS CLI)
  1. Para criar o primeiro fluxo (ExampleInputStream), use o comando create-stream AWS CLI do Amazon Kinesis a seguir.

    $ aws kinesis create-stream \ --stream-name ExampleInputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser
  2. Para criar o segundo fluxo que o aplicativo usa para gravar a saída, execute o mesmo comando, alterando o nome da transmissão para ExampleOutputStream.

    $ aws kinesis create-stream \ --stream-name ExampleOutputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))
  2. Mais adiante neste tutorial, será executado o script stock.py para enviar dados para o aplicativo.

    $ python stock.py

Baixar e examinar o código Java de fluxo do Apache Flink

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Duplique o repositório remoto usando o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  2. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/GettingStarted.

Observe o seguinte sobre o código do aplicativo:

  • Um arquivo Project Object Model (pom.xml) contém informações sobre a configuração e as dependências da aplicação, incluindo as bibliotecas do Managed Service for Apache Flink.

  • O arquivo BasicStreamingJob.java contém o método main que define a funcionalidade do aplicativo.

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));
  • Seu aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.

  • O aplicativo cria conectores de origem e de destino usando propriedades estáticas. Para usar as propriedades dinâmicas do aplicativo, use os métodos createSourceFromApplicationProperties e createSinkFromApplicationProperties para criar os conectores. Esses métodos leem as propriedades do aplicativo para configurar os conectores.

    Para obter mais informações sobre as propriedades do runtime, consulte Use as propriedades de runtime.

Compilar o código do aplicativo

Nesta seção, será usado o compilador do Apache Maven para criar o código Java para o aplicativo. Para obter informações sobre como instalar o Apache Maven e o Java Development Kit (JDK), consulte Atenda os pré-requisitos para concluir os exercícios.

Para compilar o código do aplicativo
  1. Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Há duas formas de compilar e empacotar o código:

    • Use a ferramenta de linha de comando do Maven. Crie seu arquivo JAR executando o seguinte comando no diretório que contém o arquivo pom.xml:

      mvn package -Dflink.version=1.13.2
    • Use o ambiente de desenvolvimento. Consulte a documentação de seu ambiente de desenvolvimento para obter mais detalhes.

      nota

      O código-fonte fornecido depende de bibliotecas do Java 11.

    É possível carregar o pacote como um arquivo JAR, ou pode compactar o pacote e carregá-lo como um arquivo ZIP. Se o aplicativo for criado usando a AWS CLI, é necessário especificar o tipo de conteúdo de código (JAR ou ZIP).

  2. Se houver erros durante a compilação, verifique se sua variável de ambiente JAVA_HOME está definida corretamente.

Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:

target/aws-kinesis-analytics-java-apps-1.0.jar

Upload do código Java de fluxo do Apache Flink

Nesta seção, será criado um bucket do Amazon Simple Storage Service (Amazon S3) e realizado o upload do código do aplicativo.

Para fazer upload do código do aplicativo
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione Criar bucket.

  3. Insira ka-app-code-<username> no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.

  4. Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.

  5. Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.

  6. Selecione Criar bucket.

  7. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  8. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Selecione Próximo.

  9. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.

nota

Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.

Crie e execute o aplicativo (console)

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Descrição, insira My java test app.

    • Em Runtime, selecione Apache Flink.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.13.

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:s3:::ka-app-code-username/aws-kinesis-analytics-java-apps-1.0.jar" ] }, { "Sid": "DescribeLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira aws-kinesis-analytics-java-apps-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Insira o seguinte:

    ID do grupo Chave Valor
    ProducerConfigProperties flink.inputstream.initpos LATEST
    ProducerConfigProperties aws.region us-west-2
    ProducerConfigProperties AggregationEnabled false
  5. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  6. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  7. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Interromper o aplicativo

Na página MyApplication, selecione Interromper. Confirme a ação.

Atualizar o aplicativo

Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo. Também é possível recarregar o JAR do aplicativo do bucket do Amazon S3 se for necessário atualizar o código do aplicativo.

Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.

Criar e executar a aplicação (AWS CLI)

Nesta seção, você usa a AWS CLI para criar e executar o aplicativo Flink do Managed Service for Apache Flink. O Managed Service for Apache Flink usa o comando kinesisanalyticsv2 AWS CLI para criar e interagir com aplicativos Managed Service for Apache Flink.

Criar uma política de permissões
nota

Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.

Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.

Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) (012345678901) pelo ID da conta.

JSON
{ "Version":"2012-10-17", "Statement": [ { "Sid": "S3", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": ["arn:aws:s3:::ka-app-code-username", "arn:aws:s3:::ka-app-code-username/*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }

Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.

nota

Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.

Criar um perfil do IAM

Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.

O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.

Anexe a política de permissões que criou na seção anterior a essa função.

Para criar uma perfil do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. No painel de navegação, selecione Funções e Criar função.

  3. Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.

    Selecione Next: Permissions (Próximo: permissões).

  4. Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.

  5. Na página Criar função, insira MF-stream-rw-role para o Nome da função. Selecione Criar função.

    Foi criado um perfil do IAM chamado MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função.

  6. Anexe a política de permissões à função.

    nota

    Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.

    1. Na página Resumo, selecione a guia Permissões.

    2. Selecione Attach Policies.

    3. Na caixa de pesquisa, insira AKReadSourceStreamWriteSinkStream (a política criada na seção anterior).

    4. Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.

Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.

Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.

Crie o aplicativo do Managed Service for Apache Flink
  1. Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (username) pelo sufixo selecionado na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta.

    { "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "aws-kinesis-analytics-java-apps-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } }
  2. Execute a ação CreateApplication com a solicitação anterior para criar o aplicativo:

    aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json

O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.

Iniciar o aplicativo

Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.

Para iniciar o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado start_request.json.

    { "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }
  2. Execute a ação StartApplication com a solicitação anterior para iniciar o aplicativo:

    aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json

O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.

Interromper o aplicativo

Nesta seção, a ação StopApplication será usada para interromper o aplicativo.

Como interromper o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado stop_request.json.

    { "ApplicationName": "test" }
  2. Execute a ação StopApplication com a seguinte solicitação para interromper o aplicativo:

    aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json

O aplicativo agora está interrompido.

Adicionar uma opção de registro em log do CloudWatch

Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.

Atualizar propriedades do ambiente

Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.

Para atualizar propriedades de ambiente para o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado update_properties_request.json.

    {"ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } }
  2. Execute a ação UpdateApplication com a solicitação anterior para atualizar as propriedades do ambiente:

    aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo

Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.

nota

Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.

Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.

O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Criar dois fluxos de dados do Amazon Kinesis.

{ "ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "aws-kinesis-analytics-java-apps-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }

Próxima etapa

Etapa 4: Limpar os recursos do AWS

Etapa 4: Limpar os recursos do AWS

Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.

Exclua o seu aplicativo Managed Service for Apache Flink

  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis

  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3

  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch

  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Próxima etapa

Etapa 5: Próximas etapas

Etapa 5: Próximas etapas

Agora que você criou e executou um aplicativo básico do Managed Service for Apache Flink, consulte os seguintes recursos para obter soluções mais avançadas de Managed Service for Apache Flink.

  • A solução de dados de transmissão para o Amazon Kinesis da AWS: A solução de dados de transmissão para o Amazon Kinesis da AWS configura automaticamente os serviços da AWS necessários para capturar, armazenar, processar e entregar dados de transmissão com facilidade. A solução oferece várias opções para resolver casos de uso de dados de transmissão. A opção Managed Service for Apache Flink fornece um exemplo de ETL de transmissão de ponta a ponta que demonstra um aplicativo do mundo real que executa operações analíticas em dados simulados de táxi de Nova York. A solução configura todos os recursos AWS necessários, como políticas e perfis do IAM, um painel do CloudWatch e alarmes do CloudWatch.

  • Solução de transmissão de dados para o Amazon MSK da AWS: A solução de transmissão de dados para o Amazon MSK da AWS fornece modelos de AWS CloudFormation onde os dados fluem por produtores, armazenamento de transmissão, consumidores e destinos.

  • Clickstream Lab com Apache Flink e Apache Kafka: um laboratório completo para casos de uso de clickstream usando Amazon Managed Streaming for Apache Kafka para armazenamento de transmissão e aplicativos Managed Service for Apache Flink for Apache Flink para processamento de fluxos.

  • Workshop do Amazon Managed Service for Apache Flink: neste workshop, você cria uma arquitetura de transmissão de ponta a ponta para ingerir, analisar e visualizar dados de transmissão quase em tempo real. Você decidiu melhorar as operações de uma empresa de táxi na cidade de Nova York. Você analisa os dados de telemetria de uma frota de táxis na cidade de Nova York quase em tempo real para otimizar as operações da frota.

  • Conheça o Flink: treinamento prático: Treinamento introdutório oficial do Apache Flink que ajuda você a começar a escrever ETL de transmissão escalável, analytics e aplicativos orientados a eventos.

    nota

    Esteja ciente de que o Managed Service for Apache Flink não é compatível com a versão Apache Flink (1.12) usada neste treinamento. É possível usar o Flink 1.15.2 no Flink Managed Service for Apache Flink.

Introdução: Flink 1.11.1 - obsolescência

nota

As versões 1.6, 1.8 e 1.11 do Apache Flink não são suportadas pela comunidade do Apache Flink há mais de três anos. Planejamos descontinuar essas versões no Amazon Managed Service for Apache Flink em 5 de novembro de 2024. A partir dessa data, você não poderá mais criar novos aplicativos para essas versões do Flink. No momento, ainda é possível continuar executando os aplicativos existentes. Você pode atualizar seus aplicativos de forma estável usando o recurso de atualizações de versão in-place no Amazon Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.

Este tópico contém uma versão do Tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink que usa o Apache Flink 1.11.1.

Esta seção apresenta os conceitos fundamentais do Managed Service for Apache Flink e da API DataStream. Ela descreve as opções disponíveis para criar e testar seus aplicativos. Ela também fornece instruções para instalar as ferramentas necessárias para concluir os tutoriais deste guia e criar seu primeiro aplicativo.

Componentes de um aplicativo Managed Service for Apache Flink

Para processar dados, seu aplicativo Managed Service for Apache Flink usa um aplicativo Java/Apache Maven ou Scala que processa a entrada e produz a saída usando o runtime do Apache Flink.

O Managed Service for Apache Flink tem os seguintes componentes:

  • Propriedades de runtime: você pode usar as propriedades de runtime para configurar seu aplicativo sem recompilar o código do aplicativo.

  • Fonte: o aplicativo consome dados usando uma fonte. Um conector de origem lê dados de um fluxo de dados do Kinesis, de um bucket do Amazon S3 etc. Para obter mais informações, consulte Adicione fontes de dados de transmissão.

  • Operadores: o aplicativo processa dados usando um ou mais operadores. Um operador pode transformar, enriquecer ou agregar dados. Para obter mais informações, consulte Operadores.

  • Coletor: o aplicativo produz dados para fontes externas usando coletores. Um conector do coletor grava dados em um fluxo de dados do Kinesis, um fluxo do Firehose, um bucket do Amazon S3 etc. Para obter mais informações, consulte Grave dados usando coletores .

Depois de criar, compilar e empacotar o código da aplicativo, é necessário fazer o upload do pacote do código em um bucket do Amazon Simple Storage Service (Amazon S3). Em seguida, crie um aplicativo do Managed Service for Apache Flink. Você passa na localização do pacote de código, um fluxo de dados do Kinesis como fonte de dados de fluxo e, normalmente, um local de fluxo ou arquivo que recebe os dados processados do aplicativo.

Pré-requisitos para concluir os exercícios

Para concluir as etapas neste guia, é necessário ter o seguinte:

Para começar a usar, vá até Configure uma conta da AWS e crie um usuário administrador.

Etapa 1: configurar uma conta da AWS e criar um usuário administrador

Inscrever-se para uma Conta da AWS

Se você ainda não tem uma Conta da AWS, siga as etapas abaixo para criar uma.

Como cadastrar uma Conta da AWS
  1. Abra https://portal.aws.amazon.com/billing/signup.

  2. Siga as instruções online.

    Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.

    Quando você se inscreve para uma Conta da AWS, um Usuário raiz da conta da AWS é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar tarefas que exigem acesso de usuário-raiz.

A AWS envia um e-mail de confirmação depois que o processo de inscrição é concluído. A qualquer momento, é possível exibir as atividades da conta atual e gerenciar sua conta acessando https://aws.amazon.com/ e selecionando Minha conta.

Criar um usuário com acesso administrativo

Depois de se cadastrar em uma Conta da AWS, proteja seu Usuário raiz da conta da AWS, habilite o AWS IAM Identity Center e crie um usuário administrativo para não usar o usuário-raiz em tarefas cotidianas.

Proteger o Usuário raiz da conta da AWS
  1. Faça login no Console de gerenciamento da AWS como o proprietário da conta ao escolher a opção Usuário-raiz e inserir o endereço de e-mail da Conta da AWS. Na próxima página, insira a senha.

    Para obter ajuda ao fazer login usando o usuário-raiz, consulte Fazer login como usuário-raiz no Guia do usuário do Início de Sessão da AWS.

  2. Habilite a autenticação multifator (MFA) para o usuário-raiz.

    Para obter instruções, consulte Habilitar um dispositivo MFA virtual para sua Conta da AWS de usuário-raiz (console) no Guia do usuário do IAM.

Criar um usuário com acesso administrativo
  1. Habilita o Centro de Identidade do IAM.

    Para obter instruções, consulte Habilitar o AWS IAM Identity Center no Guia do usuário do AWS IAM Identity Center.

  2. No Centro de Identidade do IAM, conceda o acesso administrativo a um usuário.

    Para obter um tutorial sobre como usar o Diretório do Centro de Identidade do IAM como a fonte de identidade, consulte Configurar o acesso dos usuários com o Diretório do Centro de Identidade do IAM padrão no Guia do usuário do AWS IAM Identity Center.

Iniciar sessão como o usuário com acesso administrativo
  • Para fazer login com o seu usuário do Centro de Identidade do IAM, use o URL de login enviado ao seu endereço de e-mail quando o usuário do Centro de Identidade do IAM foi criado.

    Para obter ajuda para fazer login usando um usuário do Centro de Identidade do IAM, consulte Fazer login no portal de acesso da AWS, no Guia do usuário do Início de Sessão da AWS.

Atribuir acesso a usuários adicionais
  1. No Centro de Identidade do IAM, crie um conjunto de permissões que siga as práticas recomendadas de aplicação de permissões com privilégio mínimo.

    Para obter instruções, consulte Criar um conjunto de permissões no Guia do usuário do AWS IAM Identity Center.

  2. Atribua usuários a um grupo e, em seguida, atribua o acesso de autenticação única ao grupo.

    Para obter instruções, consulte Adicionar grupos no Guia do usuário do AWS IAM Identity Center.

Conceder acesso programático

Os usuários precisam de acesso programático se quiserem interagir com a AWS de fora do Console de gerenciamento da AWS. A forma de conceder acesso programático depende do tipo de usuário que está acessando a AWS.

Para conceder acesso programático aos usuários, selecione uma das seguintes opções:

Qual usuário precisa de acesso programático? Para Por

Identidade da força de trabalho

(Usuários gerenciados no Centro de Identidade do IAM)

Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS.

Siga as instruções da interface que deseja utilizar.

IAM Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. Siga as instruções em Usar credenciais temporárias com recursos da AWS no Guia do usuário do IAM.
IAM

(Não recomendado)

Use credenciais de longo prazo para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS.

Siga as instruções da interface que deseja utilizar.

Próxima etapa

Configurar a AWS Command Line Interface (AWS CLI)

Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)

Nesta etapa, você baixa e configura a AWS CLI para uso com o Managed Service for Apache Flink.

nota

Os exercícios de conceitos básicos neste guia pressupõem o uso de credenciais de administrador (adminuser) em sua conta para executar as operações.

nota

Se já tiver a AWS CLI instalada, pode ser necessário atualizá-la para obter as funcionalidades mais recentes. Para obter mais informações, consulte Instalar a AWS Command Line Interface no Guia do usuário da AWS Command Line Interface. Para verificar a versão da AWS CLI, execute o seguinte comando:

aws --version

Os exercícios neste tutorial requerem a seguinte versão da AWS CLI ou posterior:

aws-cli/1.16.63
Para configurar a AWS CLI
  1. Faça download e configure a AWS CLI. Para obter instruções, consulte os seguintes tópicos no Guia do usuário do AWS Command Line Interface:

  2. Adicione um perfil nomeado para o usuário administrador no arquivo AWS CLI config . É possível usar esse perfil ao executar os comandos da AWS CLI. Para obter mais informações sobre perfis nomeados, consulte Perfis nomeados no Guia do usuário da AWS Command Line Interface.

    [profile adminuser] aws_access_key_id = adminuser access key ID aws_secret_access_key = adminuser secret access key region = aws-region

    Para obter uma lista das regiões da AWS disponíveis, consulte Regiões e endpoints no Referência geral da Amazon Web Services.

    nota

    O código e os comandos de exemplo neste tutorial usam a região Oeste dos EUA (Oregon). Para usar uma região diferente, altere a região no código e nos comandos deste tutorial para a região que você deseja usar.

  3. Verifique a configuração digitando o seguinte comando no prompt de comando:

    aws help

Depois de configurar uma conta da AWS e a AWS CLI, avance para o próximo exercício para tentar configurar um aplicativo de exemplo e testar toda a configuração.

Próxima etapa

Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink

Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink

Neste exercício, será criado um aplicativo Managed Service for Apache Flink com fluxos de dados como origem e coletor.

Criar dois fluxos de dados do Amazon Kinesis

Antes de criar um aplicativo do Managed Service for Apache Flink para este exercício, crie dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream). O aplicativo usa esses fluxos para os fluxos de origem e de destino do aplicativo.

É possível criar esses fluxos usando o console do Amazon Kinesis ou o comando da AWS CLI a seguir. Para obter instruções sobre o console, consulte Criar e atualizar fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams.

Como criar os fluxos de dados (AWS CLI)
  1. Para criar o primeiro fluxo (ExampleInputStream), use o comando create-stream AWS CLI do Amazon Kinesis a seguir.

    $ aws kinesis create-stream \ --stream-name ExampleInputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser
  2. Para criar o segundo fluxo que o aplicativo usa para gravar a saída, execute o mesmo comando, alterando o nome da transmissão para ExampleOutputStream.

    $ aws kinesis create-stream \ --stream-name ExampleOutputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { "EVENT_TIME": datetime.datetime.now().isoformat(), "TICKER": random.choice(["AAPL", "AMZN", "MSFT", "INTC", "TBV"]), "PRICE": round(random.random() * 100, 2), } def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey" ) if __name__ == "__main__": generate(STREAM_NAME, boto3.client("kinesis"))
  2. Mais adiante neste tutorial, será executado o script stock.py para enviar dados para o aplicativo.

    $ python stock.py

Baixar e examinar o código Java de fluxo do Apache Flink

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Duplique o repositório remoto usando o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  2. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/GettingStarted.

Observe o seguinte sobre o código do aplicativo:

  • Um arquivo Project Object Model (pom.xml) contém informações sobre a configuração e as dependências da aplicação, incluindo as bibliotecas do Managed Service for Apache Flink.

  • O arquivo BasicStreamingJob.java contém o método main que define a funcionalidade do aplicativo.

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));
  • Seu aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.

  • O aplicativo cria conectores de origem e de destino usando propriedades estáticas. Para usar as propriedades dinâmicas do aplicativo, use os métodos createSourceFromApplicationProperties e createSinkFromApplicationProperties para criar os conectores. Esses métodos leem as propriedades do aplicativo para configurar os conectores.

    Para obter mais informações sobre as propriedades do runtime, consulte Use as propriedades de runtime.

Compilar o código do aplicativo

Nesta seção, será usado o compilador do Apache Maven para criar o código Java para o aplicativo. Para obter informações sobre como instalar o Apache Maven e o Java Development Kit (JDK), consulte Atenda os pré-requisitos para concluir os exercícios.

Para compilar o código do aplicativo
  1. Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Há duas formas de compilar e empacotar o código:

    • Use a ferramenta de linha de comando do Maven. Crie seu arquivo JAR executando o seguinte comando no diretório que contém o arquivo pom.xml:

      mvn package -Dflink.version=1.11.3
    • Use o ambiente de desenvolvimento. Consulte a documentação de seu ambiente de desenvolvimento para obter mais detalhes.

      nota

      O código-fonte fornecido depende de bibliotecas do Java 11. Certifique-se de que a versão Java do seu projeto seja 11.

    É possível carregar o pacote como um arquivo JAR, ou pode compactar o pacote e carregá-lo como um arquivo ZIP. Se o aplicativo for criado usando a AWS CLI, é necessário especificar o tipo de conteúdo de código (JAR ou ZIP).

  2. Se houver erros durante a compilação, verifique se sua variável de ambiente JAVA_HOME está definida corretamente.

Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:

target/aws-kinesis-analytics-java-apps-1.0.jar

Upload do código Java de fluxo do Apache Flink

Nesta seção, será criado um bucket do Amazon Simple Storage Service (Amazon S3) e realizado o upload do código do aplicativo.

Para fazer upload do código do aplicativo
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione Criar bucket.

  3. Insira ka-app-code-<username> no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.

  4. Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.

  5. Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.

  6. Selecione Criar bucket.

  7. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  8. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Selecione Próximo.

  9. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.

nota

Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.

Crie e execute o aplicativo (console)

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Descrição, insira My java test app.

    • Em Runtime, selecione Apache Flink.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.11 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:s3:::ka-app-code-username/aws-kinesis-analytics-java-apps-1.0.jar" ] }, { "Sid": "DescribeLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira aws-kinesis-analytics-java-apps-1.0.jar.

  3. Na seção ‭Acesso aos recursos do aplicativo‭‬, em ‭‬Permissões de acesso‭, selecione ‭Criar/atualizar o perfil do IAM ‭kinesis-analytics-MyApplication-us-west-2.

  4. Em Propriedades, ID do grupo, insira ProducerConfigProperties.

  5. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    ProducerConfigProperties flink.inputstream.initpos LATEST
    ProducerConfigProperties aws.region us-west-2
    ProducerConfigProperties AggregationEnabled false
  6. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  7. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  8. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Interromper o aplicativo

Na página MyApplication, selecione Interromper. Confirme a ação.

Atualizar o aplicativo

Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo. Também é possível recarregar o JAR do aplicativo do bucket do Amazon S3 se for necessário atualizar o código do aplicativo.

Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.

Criar e executar a aplicação (AWS CLI)

Nesta seção, você usa o AWS CLI para criar e executar o aplicativo Managed Service for Apache Flink. Um Managed Service for Apache Flink usa o kinesisanalyticsv2 AWS CLI comando para criar e interagir com o Managed Service for Apache Flink.

Criar uma política de permissões
nota

Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.

Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.

Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) (012345678901) pelo ID da conta.

JSON
{ "Version":"2012-10-17", "Statement": [ { "Sid": "S3", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": ["arn:aws:s3:::ka-app-code-username", "arn:aws:s3:::ka-app-code-username/*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }

Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.

nota

Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.

Criar um perfil do IAM

Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.

O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.

Anexe a política de permissões que criou na seção anterior a essa função.

Para criar uma perfil do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. No painel de navegação, selecione Funções e Criar função.

  3. Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.

    Selecione Next: Permissions (Próximo: permissões).

  4. Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.

  5. Na página Criar função, insira MF-stream-rw-role para o Nome da função. Selecione Criar função.

    Foi criado um perfil do IAM chamado MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função.

  6. Anexe a política de permissões à função.

    nota

    Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.

    1. Na página Resumo, selecione a guia Permissões.

    2. Selecione Attach Policies.

    3. Na caixa de pesquisa, insira AKReadSourceStreamWriteSinkStream (a política criada na seção anterior).

    4. Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.

Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.

Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.

Crie o aplicativo do Managed Service for Apache Flink
  1. Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (username) pelo sufixo selecionado na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta.

    { "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_11", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "aws-kinesis-analytics-java-apps-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } }
  2. Execute a ação CreateApplication com a solicitação anterior para criar o aplicativo:

    aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json

O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.

Iniciar o aplicativo

Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.

Para iniciar o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado start_request.json.

    { "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }
  2. Execute a ação StartApplication com a solicitação anterior para iniciar o aplicativo:

    aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json

O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.

Interromper o aplicativo

Nesta seção, a ação StopApplication será usada para interromper o aplicativo.

Como interromper o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado stop_request.json.

    { "ApplicationName": "test" }
  2. Execute a ação StopApplication com a seguinte solicitação para interromper o aplicativo:

    aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json

O aplicativo agora está interrompido.

Adicionar uma opção de registro em log do CloudWatch

Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.

Atualizar propriedades do ambiente

Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.

Para atualizar propriedades de ambiente para o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado update_properties_request.json.

    {"ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } }
  2. Execute a ação UpdateApplication com a solicitação anterior para atualizar as propriedades do ambiente:

    aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo

Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.

nota

Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.

Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.

O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Criar dois fluxos de dados do Amazon Kinesis.

{ "ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "aws-kinesis-analytics-java-apps-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }

Próxima etapa

Etapa 4: Limpar os recursos do AWS

Etapa 4: Limpar os recursos do AWS

Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.

Exclua o seu aplicativo Managed Service for Apache Flink

  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis

  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3

  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch

  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Próxima etapa

Etapa 5: Próximas etapas

Etapa 5: Próximas etapas

Agora que você criou e executou um aplicativo básico do Managed Service for Apache Flink, consulte os seguintes recursos para obter soluções mais avançadas de Managed Service for Apache Flink.

  • A solução de dados de transmissão para o Amazon Kinesis da AWS: A solução de dados de transmissão para o Amazon Kinesis da AWS configura automaticamente os serviços da AWS necessários para capturar, armazenar, processar e entregar dados de transmissão com facilidade. A solução oferece várias opções para resolver casos de uso de dados de transmissão. A opção Managed Service for Apache Flink fornece um exemplo de ETL de transmissão de ponta a ponta que demonstra um aplicativo do mundo real que executa operações analíticas em dados simulados de táxi de Nova York. A solução configura todos os recursos AWS necessários, como políticas e perfis do IAM, um painel do CloudWatch e alarmes do CloudWatch.

  • Solução de transmissão de dados para o Amazon MSK da AWS: A solução de transmissão de dados para o Amazon MSK da AWS fornece modelos de AWS CloudFormation onde os dados fluem por produtores, armazenamento de transmissão, consumidores e destinos.

  • Clickstream Lab com Apache Flink e Apache Kafka: um laboratório completo para casos de uso de clickstream usando Amazon Managed Streaming for Apache Kafka para armazenamento de transmissão e aplicativos Managed Service for Apache Flink for Apache Flink para processamento de fluxos.

  • Workshop do Amazon Managed Service for Apache Flink: neste workshop, você cria uma arquitetura de transmissão de ponta a ponta para ingerir, analisar e visualizar dados de transmissão quase em tempo real. Você decidiu melhorar as operações de uma empresa de táxi na cidade de Nova York. Você analisa os dados de telemetria de uma frota de táxis na cidade de Nova York quase em tempo real para otimizar as operações da frota.

  • Conheça o Flink: treinamento prático: Treinamento introdutório oficial do Apache Flink que ajuda você a começar a escrever ETL de transmissão escalável, analytics e aplicativos orientados a eventos.

    nota

    Esteja ciente de que o Managed Service for Apache Flink não é compatível com a versão Apache Flink (1.12) usada neste treinamento. É possível usar o Flink 1.15.2 no Flink Managed Service for Apache Flink.

  • Exemplos de código do Apache Flink: um repositório do GitHub com uma grande variedade de exemplos de aplicativos do Apache Flink.

Introdução: Flink 1.8.2 - obsolescência

nota

As versões 1.6, 1.8 e 1.11 do Apache Flink não são suportadas pela comunidade do Apache Flink há mais de três anos. Planejamos descontinuar essas versões no Amazon Managed Service for Apache Flink em 5 de novembro de 2024. A partir dessa data, você não poderá mais criar novos aplicativos para essas versões do Flink. No momento, ainda é possível continuar executando os aplicativos existentes. Você pode atualizar seus aplicativos de forma estável usando o recurso de atualizações de versão in-place no Amazon Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.

Este tópico contém uma versão do Tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink que usa o Apache Flink 1.8.2.

Componentes do aplicativo do Managed Service for Apache Flink

Para processar dados, seu aplicativo Managed Service for Apache Flink usa um aplicativo Java/Apache Maven ou Scala que processa a entrada e produz a saída usando o runtime do Apache Flink.

O Managed Service for Apache Flink tem os seguintes componentes:

  • Propriedades de runtime: você pode usar as propriedades de runtime para configurar seu aplicativo sem recompilar o código do aplicativo.

  • Fonte: o aplicativo consome dados usando uma fonte. Um conector de origem lê dados de um fluxo de dados do Kinesis, de um bucket do Amazon S3 etc. Para obter mais informações, consulte Adicione fontes de dados de transmissão.

  • Operadores: o aplicativo processa dados usando um ou mais operadores. Um operador pode transformar, enriquecer ou agregar dados. Para obter mais informações, consulte Operadores.

  • Coletor: o aplicativo produz dados para fontes externas usando coletores. Um conector do coletor grava dados em um fluxo de dados do Kinesis, um fluxo do Firehose, um bucket do Amazon S3 etc. Para obter mais informações, consulte Grave dados usando coletores .

Depois de criar, compilar e empacotar o código da aplicativo, é necessário fazer o upload do pacote do código em um bucket do Amazon Simple Storage Service (Amazon S3). Em seguida, crie um aplicativo do Managed Service for Apache Flink. Você passa na localização do pacote de código, um fluxo de dados do Kinesis como fonte de dados de fluxo e, normalmente, um local de fluxo ou arquivo que recebe os dados processados do aplicativo.

Pré-requisitos para concluir os exercícios

Para concluir as etapas neste guia, é necessário ter o seguinte:

Para começar a usar, vá até Etapa 1: configurar uma conta da AWS e criar um usuário administrador.

Etapa 1: configurar uma conta da AWS e criar um usuário administrador

Inscrever-se para uma Conta da AWS

Se você ainda não tem uma Conta da AWS, siga as etapas abaixo para criar uma.

Como cadastrar uma Conta da AWS
  1. Abra https://portal.aws.amazon.com/billing/signup.

  2. Siga as instruções online.

    Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.

    Quando você se inscreve para uma Conta da AWS, um Usuário raiz da conta da AWS é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar tarefas que exigem acesso de usuário-raiz.

A AWS envia um e-mail de confirmação depois que o processo de inscrição é concluído. A qualquer momento, é possível exibir as atividades da conta atual e gerenciar sua conta acessando https://aws.amazon.com/ e selecionando Minha conta.

Criar um usuário com acesso administrativo

Depois de se cadastrar em uma Conta da AWS, proteja seu Usuário raiz da conta da AWS, habilite o AWS IAM Identity Center e crie um usuário administrativo para não usar o usuário-raiz em tarefas cotidianas.

Proteger o Usuário raiz da conta da AWS
  1. Faça login no Console de gerenciamento da AWS como o proprietário da conta ao escolher a opção Usuário-raiz e inserir o endereço de e-mail da Conta da AWS. Na próxima página, insira a senha.

    Para obter ajuda ao fazer login usando o usuário-raiz, consulte Fazer login como usuário-raiz no Guia do usuário do Início de Sessão da AWS.

  2. Habilite a autenticação multifator (MFA) para o usuário-raiz.

    Para obter instruções, consulte Habilitar um dispositivo MFA virtual para sua Conta da AWS de usuário-raiz (console) no Guia do usuário do IAM.

Criar um usuário com acesso administrativo
  1. Habilita o Centro de Identidade do IAM.

    Para obter instruções, consulte Habilitar o AWS IAM Identity Center no Guia do usuário do AWS IAM Identity Center.

  2. No Centro de Identidade do IAM, conceda o acesso administrativo a um usuário.

    Para obter um tutorial sobre como usar o Diretório do Centro de Identidade do IAM como a fonte de identidade, consulte Configurar o acesso dos usuários com o Diretório do Centro de Identidade do IAM padrão no Guia do usuário do AWS IAM Identity Center.

Iniciar sessão como o usuário com acesso administrativo
  • Para fazer login com o seu usuário do Centro de Identidade do IAM, use o URL de login enviado ao seu endereço de e-mail quando o usuário do Centro de Identidade do IAM foi criado.

    Para obter ajuda para fazer login usando um usuário do Centro de Identidade do IAM, consulte Fazer login no portal de acesso da AWS, no Guia do usuário do Início de Sessão da AWS.

Atribuir acesso a usuários adicionais
  1. No Centro de Identidade do IAM, crie um conjunto de permissões que siga as práticas recomendadas de aplicação de permissões com privilégio mínimo.

    Para obter instruções, consulte Criar um conjunto de permissões no Guia do usuário do AWS IAM Identity Center.

  2. Atribua usuários a um grupo e, em seguida, atribua o acesso de autenticação única ao grupo.

    Para obter instruções, consulte Adicionar grupos no Guia do usuário do AWS IAM Identity Center.

Conceder acesso programático

Os usuários precisam de acesso programático se quiserem interagir com a AWS de fora do Console de gerenciamento da AWS. A forma de conceder acesso programático depende do tipo de usuário que está acessando a AWS.

Para conceder acesso programático aos usuários, selecione uma das seguintes opções:

Qual usuário precisa de acesso programático? Para Por

Identidade da força de trabalho

(Usuários gerenciados no Centro de Identidade do IAM)

Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS.

Siga as instruções da interface que deseja utilizar.

IAM Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. Siga as instruções em Usar credenciais temporárias com recursos da AWS no Guia do usuário do IAM.
IAM

(Não recomendado)

Use credenciais de longo prazo para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS.

Siga as instruções da interface que deseja utilizar.

Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)

Nesta etapa, você baixa e configura a AWS CLI para uso com o Managed Service for Apache Flink.

nota

Os exercícios de conceitos básicos neste guia pressupõem o uso de credenciais de administrador (adminuser) em sua conta para executar as operações.

nota

Se já tiver a AWS CLI instalada, pode ser necessário atualizá-la para obter as funcionalidades mais recentes. Para obter mais informações, consulte Instalar a AWS Command Line Interface no Guia do usuário da AWS Command Line Interface. Para verificar a versão da AWS CLI, execute o seguinte comando:

aws --version

Os exercícios neste tutorial requerem a seguinte versão da AWS CLI ou posterior:

aws-cli/1.16.63
Para configurar a AWS CLI
  1. Faça download e configure a AWS CLI. Para obter instruções, consulte os seguintes tópicos no Guia do usuário do AWS Command Line Interface:

  2. Adicione um perfil nomeado para o usuário administrador no arquivo AWS CLI config . É possível usar esse perfil ao executar os comandos da AWS CLI. Para obter mais informações sobre perfis nomeados, consulte Perfis nomeados no Guia do usuário da AWS Command Line Interface.

    [profile adminuser] aws_access_key_id = adminuser access key ID aws_secret_access_key = adminuser secret access key region = aws-region

    Para obter uma lista das regiões disponíveis, consulte Regiões e endpoints no Referência geral da Amazon Web Services.

    nota

    O código e os comandos de exemplo neste tutorial usam a região Oeste dos EUA (Oregon). Para usar uma região AWS diferente, altere a região no código e nos comandos deste tutorial para a região que você deseja usar.

  3. Verifique a configuração digitando o seguinte comando no prompt de comando:

    aws help

Depois de configurar uma conta da AWS e a AWS CLI, avance para o próximo exercício para tentar configurar um aplicativo de exemplo e testar toda a configuração.

Próxima etapa

Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink

Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink

Neste exercício, será criado um aplicativo Managed Service for Apache Flink com fluxos de dados como origem e coletor.

Criar dois fluxos de dados do Amazon Kinesis

Antes de criar um aplicativo do Managed Service for Apache Flink para este exercício, crie dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream). O aplicativo usa esses fluxos para os fluxos de origem e de destino do aplicativo.

É possível criar esses fluxos usando o console do Amazon Kinesis ou o comando da AWS CLI a seguir. Para obter instruções sobre o console, consulte Criar e atualizar fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams.

Como criar os fluxos de dados (AWS CLI)
  1. Para criar o primeiro fluxo (ExampleInputStream), use o comando create-stream AWS CLI do Amazon Kinesis a seguir.

    $ aws kinesis create-stream \ --stream-name ExampleInputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser
  2. Para criar o segundo fluxo que o aplicativo usa para gravar a saída, execute o mesmo comando, alterando o nome da transmissão para ExampleOutputStream.

    $ aws kinesis create-stream \ --stream-name ExampleOutputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { "EVENT_TIME": datetime.datetime.now().isoformat(), "TICKER": random.choice(["AAPL", "AMZN", "MSFT", "INTC", "TBV"]), "PRICE": round(random.random() * 100, 2), } def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey" ) if __name__ == "__main__": generate(STREAM_NAME, boto3.client("kinesis"))
  2. Mais adiante neste tutorial, será executado o script stock.py para enviar dados para o aplicativo.

    $ python stock.py

Baixar e examinar o código Java de fluxo do Apache Flink

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Duplique o repositório remoto usando o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  2. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/GettingStarted_1_8.

Observe o seguinte sobre o código do aplicativo:

  • Um arquivo Project Object Model (pom.xml) contém informações sobre a configuração e as dependências da aplicação, incluindo as bibliotecas do Managed Service for Apache Flink.

  • O arquivo BasicStreamingJob.java contém o método main que define a funcionalidade do aplicativo.

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));
  • Seu aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.

  • O aplicativo cria conectores de origem e de destino usando propriedades estáticas. Para usar as propriedades dinâmicas do aplicativo, use os métodos createSourceFromApplicationProperties e createSinkFromApplicationProperties para criar os conectores. Esses métodos leem as propriedades do aplicativo para configurar os conectores.

    Para obter mais informações sobre as propriedades do runtime, consulte Use as propriedades de runtime.

Compilar o código do aplicativo

Nesta seção, será usado o compilador do Apache Maven para criar o código Java para o aplicativo. Para obter informações sobre como instalar o Apache Maven e o Java Development Kit (JDK), consulte Pré-requisitos para concluir os exercícios.

nota

Para usar o conector Kinesis com versões do Apache Flink anteriores à 1.11, você precisa baixar, compilar e instalar o Apache Maven. Para obter mais informações, consulte Uso do conector Kinesis Streams para o Apache Flink com versões anteriores do Apache Flink.

Para compilar o código do aplicativo
  1. Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Há duas formas de compilar e empacotar o código:

    • Use a ferramenta de linha de comando do Maven. Crie seu arquivo JAR executando o seguinte comando no diretório que contém o arquivo pom.xml:

      mvn package -Dflink.version=1.8.2
    • Use o ambiente de desenvolvimento. Consulte a documentação de seu ambiente de desenvolvimento para obter mais detalhes.

      nota

      O código-fonte fornecido depende de bibliotecas do Java 1.8. Certifique-se de que a versão Java do seu projeto seja 1.8.

    É possível carregar o pacote como um arquivo JAR, ou pode compactar o pacote e carregá-lo como um arquivo ZIP. Se o aplicativo for criado usando a AWS CLI, é necessário especificar o tipo de conteúdo de código (JAR ou ZIP).

  2. Se houver erros durante a compilação, verifique se sua variável de ambiente JAVA_HOME está definida corretamente.

Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:

target/aws-kinesis-analytics-java-apps-1.0.jar

Upload do código Java de fluxo do Apache Flink

Nesta seção, será criado um bucket do Amazon Simple Storage Service (Amazon S3) e realizado o upload do código do aplicativo.

Para fazer upload do código do aplicativo
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione Criar bucket.

  3. Insira ka-app-code-<username> no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.

  4. Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.

  5. Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.

  6. Selecione Criar bucket.

  7. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  8. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Selecione Próximo.

  9. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.

nota

Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.

Crie e execute o aplicativo (console)

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Descrição, insira My java test app.

    • Em Runtime, selecione Apache Flink.

    • Deixe o menu suspenso da versão como Apache Flink 1.8 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:s3:::ka-app-code-username/aws-kinesis-analytics-java-apps-1.0.jar" ] }, { "Sid": "DescribeLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira aws-kinesis-analytics-java-apps-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    ProducerConfigProperties flink.inputstream.initpos LATEST
    ProducerConfigProperties aws.region us-west-2
    ProducerConfigProperties AggregationEnabled false
  5. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  6. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  7. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Execute o aplicativo
  1. Na página MyApplication, selecione Executar. Confirme a ação.

  2. Quando o aplicativo estiver em execução, atualize a página. O console mostra o Gráfico do aplicativo.

Interromper o aplicativo

Na página MyApplication, selecione Interromper. Confirme a ação.

Atualizar o aplicativo

Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo. Também é possível recarregar o JAR do aplicativo do bucket do Amazon S3 se for necessário atualizar o código do aplicativo.

Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.

Criar e executar a aplicação (AWS CLI)

Nesta seção, você usa a AWS CLI para criar e executar o aplicativo Flink do Managed Service for Apache Flink. O Managed Service for Apache Flink usa o comando kinesisanalyticsv2 AWS CLI para criar e interagir com aplicativos Managed Service for Apache Flink.

Criar uma política de permissões
nota

Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.

Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.

Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) (012345678901) pelo ID da conta.

JSON
{ "Version":"2012-10-17", "Statement": [ { "Sid": "S3", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": ["arn:aws:s3:::ka-app-code-username", "arn:aws:s3:::ka-app-code-username/*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }

Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.

nota

Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.

Criar um perfil do IAM

Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.

O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.

Anexe a política de permissões que criou na seção anterior a essa função.

Para criar uma perfil do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. No painel de navegação, selecione Funções e Criar função.

  3. Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.

    Selecione Next: Permissions (Próximo: permissões).

  4. Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.

  5. Na página Criar função, insira MF-stream-rw-role para o Nome da função. Selecione Criar função.

    Foi criado um perfil do IAM chamado MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função.

  6. Anexe a política de permissões à função.

    nota

    Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.

    1. Na página Resumo, selecione a guia Permissões.

    2. Selecione Attach Policies.

    3. Na caixa de pesquisa, insira AKReadSourceStreamWriteSinkStream (a política criada na seção anterior).

    4. Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.

Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.

Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.

Crie o aplicativo do Managed Service for Apache Flink
  1. Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (username) pelo sufixo selecionado na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta.

    { "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_8", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "aws-kinesis-analytics-java-apps-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } }
  2. Execute a ação CreateApplication com a solicitação anterior para criar o aplicativo:

    aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json

O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.

Iniciar o aplicativo

Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.

Para iniciar o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado start_request.json.

    { "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }
  2. Execute a ação StartApplication com a solicitação anterior para iniciar o aplicativo:

    aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json

O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.

Interromper o aplicativo

Nesta seção, a ação StopApplication será usada para interromper o aplicativo.

Como interromper o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado stop_request.json.

    { "ApplicationName": "test" }
  2. Execute a ação StopApplication com a seguinte solicitação para interromper o aplicativo:

    aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json

O aplicativo agora está interrompido.

Adicionar uma opção de registro em log do CloudWatch

Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.

Atualizar propriedades do ambiente

Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.

Para atualizar propriedades de ambiente para o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado update_properties_request.json.

    {"ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } }
  2. Execute a ação UpdateApplication com a solicitação anterior para atualizar as propriedades do ambiente:

    aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo

Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.

nota

Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.

Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.

O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Criar dois fluxos de dados do Amazon Kinesis.

{ "ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "aws-kinesis-analytics-java-apps-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }

Próxima etapa

Etapa 4: Limpar os recursos do AWS

Etapa 4: Limpar os recursos do AWS

Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.

Exclua o seu aplicativo Managed Service for Apache Flink

  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Selecione Configurar.

  4. Na seção Snapshots, selecione Desativar e, em seguida, selecione Atualizar.

  5. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis

  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3

  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch

  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Introdução: Flink 1.6.2 - obsolescência

nota

As versões 1.6, 1.8 e 1.11 do Apache Flink não são suportadas pela comunidade do Apache Flink há mais de três anos. Planejamos descontinuar essas versões no Amazon Managed Service for Apache Flink em 5 de novembro de 2024. A partir dessa data, você não poderá mais criar novos aplicativos para essas versões do Flink. No momento, ainda é possível continuar executando os aplicativos existentes. Você pode atualizar seus aplicativos de forma estável usando o recurso de atualizações de versão in-place no Amazon Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.

Este tópico contém uma versão do Tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink que usa o Apache Flink 1.6.2.

Componentes de um aplicativo Managed Service for Apache Flink

Para processar dados, seu aplicativo Managed Service for Apache Flink usa um aplicativo Java/Apache Maven ou Scala que processa a entrada e produz a saída usando o runtime do Apache Flink.

um Managed Service for Apache Flink tem os seguintes componentes:

  • Propriedades de runtime: você pode usar as propriedades de runtime para configurar seu aplicativo sem recompilar o código do aplicativo.

  • Fonte: o aplicativo consome dados usando uma fonte. Um conector de origem lê dados de um fluxo de dados do Kinesis, de um bucket do Amazon S3 etc. Para obter mais informações, consulte Adicione fontes de dados de transmissão.

  • Operadores: o aplicativo processa dados usando um ou mais operadores. Um operador pode transformar, enriquecer ou agregar dados. Para obter mais informações, consulte Operadores.

  • Coletor: o aplicativo produz dados para fontes externas usando coletores. Um conector do coletor grava dados em um fluxo de dados do Kinesis, um fluxo do Firehose, um bucket do Amazon S3 etc. Para obter mais informações, consulte Grave dados usando coletores .

Depois de criar, compilar e empacotar o seu aplicativo, é necessário fazer o upload do pacote do código em um bucket do Amazon Simple Storage Service (Amazon S3). Em seguida, crie um aplicativo do Managed Service for Apache Flink. Você passa na localização do pacote de código, um fluxo de dados do Kinesis como fonte de dados de fluxo e, normalmente, um local de fluxo ou arquivo que recebe os dados processados do aplicativo.

Pré-requisitos para concluir os exercícios

Para concluir as etapas neste guia, é necessário ter o seguinte:

  • Java Development Kit (JDK) versão 8. Defina a variável do ambienteJAVA_HOME para apontar para o local de instalação do JDK.

  • Recomenda-se o uso de um ambiente de desenvolvimento (como Eclipse Java Neon ou IntelliJ Idea) para desenvolver e compilar seu aplicativo.

  • Cliente do Git. Instale o cliente do Git, se isso ainda não foi feito.

  • Apache Maven Compiler Plugin. Maven deve estar em seu caminho de trabalho. Para testar a instalação do Apache Maven, insira o seguinte:

    $ mvn -version

Para começar a usar, vá até Etapa 1: configurar uma conta da AWS e criar um usuário administrador.

Etapa 1: configurar uma conta da AWS e criar um usuário administrador

Inscrever-se para uma Conta da AWS

Se você ainda não tem uma Conta da AWS, siga as etapas abaixo para criar uma.

Como cadastrar uma Conta da AWS
  1. Abra https://portal.aws.amazon.com/billing/signup.

  2. Siga as instruções online.

    Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.

    Quando você se inscreve para uma Conta da AWS, um Usuário raiz da conta da AWS é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar tarefas que exigem acesso de usuário-raiz.

A AWS envia um e-mail de confirmação depois que o processo de inscrição é concluído. A qualquer momento, é possível exibir as atividades da conta atual e gerenciar sua conta acessando https://aws.amazon.com/ e selecionando Minha conta.

Criar um usuário com acesso administrativo

Depois de se cadastrar em uma Conta da AWS, proteja seu Usuário raiz da conta da AWS, habilite o AWS IAM Identity Center e crie um usuário administrativo para não usar o usuário-raiz em tarefas cotidianas.

Proteger o Usuário raiz da conta da AWS
  1. Faça login no Console de gerenciamento da AWS como o proprietário da conta ao escolher a opção Usuário-raiz e inserir o endereço de e-mail da Conta da AWS. Na próxima página, insira a senha.

    Para obter ajuda ao fazer login usando o usuário-raiz, consulte Fazer login como usuário-raiz no Guia do usuário do Início de Sessão da AWS.

  2. Habilite a autenticação multifator (MFA) para o usuário-raiz.

    Para obter instruções, consulte Habilitar um dispositivo MFA virtual para sua Conta da AWS de usuário-raiz (console) no Guia do usuário do IAM.

Criar um usuário com acesso administrativo
  1. Habilita o Centro de Identidade do IAM.

    Para obter instruções, consulte Habilitar o AWS IAM Identity Center no Guia do usuário do AWS IAM Identity Center.

  2. No Centro de Identidade do IAM, conceda o acesso administrativo a um usuário.

    Para obter um tutorial sobre como usar o Diretório do Centro de Identidade do IAM como a fonte de identidade, consulte Configurar o acesso dos usuários com o Diretório do Centro de Identidade do IAM padrão no Guia do usuário do AWS IAM Identity Center.

Iniciar sessão como o usuário com acesso administrativo
  • Para fazer login com o seu usuário do Centro de Identidade do IAM, use o URL de login enviado ao seu endereço de e-mail quando o usuário do Centro de Identidade do IAM foi criado.

    Para obter ajuda para fazer login usando um usuário do Centro de Identidade do IAM, consulte Fazer login no portal de acesso da AWS, no Guia do usuário do Início de Sessão da AWS.

Atribuir acesso a usuários adicionais
  1. No Centro de Identidade do IAM, crie um conjunto de permissões que siga as práticas recomendadas de aplicação de permissões com privilégio mínimo.

    Para obter instruções, consulte Criar um conjunto de permissões no Guia do usuário do AWS IAM Identity Center.

  2. Atribua usuários a um grupo e, em seguida, atribua o acesso de autenticação única ao grupo.

    Para obter instruções, consulte Adicionar grupos no Guia do usuário do AWS IAM Identity Center.

Conceder acesso programático

Os usuários precisam de acesso programático se quiserem interagir com a AWS de fora do Console de gerenciamento da AWS. A forma de conceder acesso programático depende do tipo de usuário que está acessando a AWS.

Para conceder acesso programático aos usuários, selecione uma das seguintes opções:

Qual usuário precisa de acesso programático? Para Por

Identidade da força de trabalho

(Usuários gerenciados no Centro de Identidade do IAM)

Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS.

Siga as instruções da interface que deseja utilizar.

IAM Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. Siga as instruções em Usar credenciais temporárias com recursos da AWS no Guia do usuário do IAM.
IAM

(Não recomendado)

Use credenciais de longo prazo para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS.

Siga as instruções da interface que deseja utilizar.

Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)

Nesta etapa, você baixa e configura a AWS CLI para uso com um Managed Service for Apache Flink.

nota

Os exercícios de conceitos básicos neste guia pressupõem o uso de credenciais de administrador (adminuser) em sua conta para executar as operações.

nota

Se já tiver a AWS CLI instalada, pode ser necessário atualizá-la para obter as funcionalidades mais recentes. Para obter mais informações, consulte Instalar a AWS Command Line Interface no Guia do usuário da AWS Command Line Interface. Para verificar a versão da AWS CLI, execute o seguinte comando:

aws --version

Os exercícios neste tutorial requerem a seguinte versão da AWS CLI ou posterior:

aws-cli/1.16.63
Para configurar a AWS CLI
  1. Faça download e configure a AWS CLI. Para obter instruções, consulte os seguintes tópicos no Guia do usuário do AWS Command Line Interface:

  2. Adicione um perfil nomeado para o usuário administrador no arquivo AWS CLI config . É possível usar esse perfil ao executar os comandos da AWS CLI. Para obter mais informações sobre perfis nomeados, consulte Perfis nomeados no Guia do usuário da AWS Command Line Interface.

    [profile adminuser] aws_access_key_id = adminuser access key ID aws_secret_access_key = adminuser secret access key region = aws-region

    Para obter uma lista das regiões da AWS disponíveis, consulte Regiões e endpoints no Referência geral da Amazon Web Services.

    nota

    O código e os comandos de exemplo neste tutorial usam a região Oeste dos EUA (Oregon). Para usar uma região diferente, altere a região no código e nos comandos deste tutorial para a região que você deseja usar.

  3. Verifique a configuração digitando o seguinte comando no prompt de comando:

    aws help

Depois de configurar uma conta da AWS e a AWS CLI, avance para o próximo exercício para tentar configurar um aplicativo de exemplo e testar toda a configuração.

Próxima etapa

Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink

Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink

Neste exercício, será criado um aplicativo Managed Service for Apache Flink com fluxos de dados como origem e coletor.

Criar dois fluxos de dados do Amazon Kinesis

Antes de criar um aplicativo do Managed Service for Apache Flink para este exercício, crie dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream). O aplicativo usa esses fluxos para os fluxos de origem e de destino do aplicativo.

É possível criar esses fluxos usando o console do Amazon Kinesis ou o comando da AWS CLI a seguir. Para obter instruções sobre o console, consulte Criar e atualizar fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams.

Como criar os fluxos de dados (AWS CLI)
  1. Para criar o primeiro fluxo (ExampleInputStream), use o comando create-stream AWS CLI do Amazon Kinesis a seguir.

    $ aws kinesis create-stream \ --stream-name ExampleInputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser
  2. Para criar o segundo fluxo que o aplicativo usa para gravar a saída, execute o mesmo comando, alterando o nome da transmissão para ExampleOutputStream.

    $ aws kinesis create-stream \ --stream-name ExampleOutputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { "EVENT_TIME": datetime.datetime.now().isoformat(), "TICKER": random.choice(["AAPL", "AMZN", "MSFT", "INTC", "TBV"]), "PRICE": round(random.random() * 100, 2), } def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey" ) if __name__ == "__main__": generate(STREAM_NAME, boto3.client("kinesis"))
  2. Mais adiante neste tutorial, será executado o script stock.py para enviar dados para o aplicativo.

    $ python stock.py

Baixar e examinar o código Java de fluxo do Apache Flink

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Duplique o repositório remoto usando o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  2. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/GettingStarted_1_6.

Observe o seguinte sobre o código do aplicativo:

  • Um arquivo Project Object Model (pom.xml) contém informações sobre a configuração e as dependências do aplicativo, incluindo as bibliotecas do Managed Service for Apache Flink.

  • O arquivo BasicStreamingJob.java contém o método main que define a funcionalidade do aplicativo.

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));
  • Seu aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.

  • O aplicativo cria conectores de origem e de destino usando propriedades estáticas. Para usar as propriedades dinâmicas do aplicativo, use os métodos createSourceFromApplicationProperties e createSinkFromApplicationProperties para criar os conectores. Esses métodos leem as propriedades do aplicativo para configurar os conectores.

    Para obter mais informações sobre as propriedades do runtime, consulte Use as propriedades de runtime.

Compilar o código do aplicativo

Nesta seção, será usado o compilador do Apache Maven para criar o código Java para o aplicativo. Para obter informações sobre como instalar o Apache Maven e o Java Development Kit (JDK), consulte Pré-requisitos para concluir os exercícios.

nota

Para usar o conector do Kinesis com versões do Apache Flink anteriores a 1.11, você precisa baixar o código-fonte do conector e compilá-lo conforme descrito na documentação do Apache Flink.

Para compilar o código do aplicativo
  1. Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Há duas formas de compilar e empacotar o código:

    • Use a ferramenta de linha de comando do Maven. Crie seu arquivo JAR executando o seguinte comando no diretório que contém o arquivo pom.xml:

      mvn package
      nota

      O parâmetro -Dflink.version não é necessário para o runtime do Managed Service for Apache Flink versão 1.0.1; ele só é necessário para a versão 1.1.0 e posterior. Para obter mais informações, consulte Especifique a versão do Apache Flink do seu aplicativo.

    • Use o ambiente de desenvolvimento. Consulte a documentação de seu ambiente de desenvolvimento para obter mais detalhes.

    É possível carregar o pacote como um arquivo JAR, ou pode compactar o pacote e carregá-lo como um arquivo ZIP. Se o aplicativo for criado usando a AWS CLI, é necessário especificar o tipo de conteúdo de código (JAR ou ZIP).

  2. Se houver erros durante a compilação, verifique se sua variável de ambiente JAVA_HOME está definida corretamente.

Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:

target/aws-kinesis-analytics-java-apps-1.0.jar

Upload do código Java de fluxo do Apache Flink

Nesta seção, será criado um bucket do Amazon Simple Storage Service (Amazon S3) e realizado o upload do código do aplicativo.

Para fazer upload do código do aplicativo
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione Criar bucket.

  3. Insira ka-app-code-<username> no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.

  4. Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.

  5. Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.

  6. Selecione Criar bucket.

  7. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  8. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Selecione Próximo.

  9. Na etapa Definir permissões, mantenha as configurações como estão. Selecione Próximo.

  10. Na etapa Definir propriedades, mantenha as configurações como estão. Escolha Carregar.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.

nota

Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.

Crie e execute o aplicativo (console)

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Descrição, insira My java test app.

    • Em Runtime, selecione Apache Flink.

      nota

      O Managed Service for Apache Flink usa o Apache Flink versão 1.8.2 ou 1.6.2.

    • Altere o pulldown da versão para Apache Flink 1.6.

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:s3:::ka-app-code-username/java-getting-started-1.0.jar" ] }, { "Sid": "DescribeLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira java-getting-started-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    ProducerConfigProperties flink.inputstream.initpos LATEST
    ProducerConfigProperties aws.region us-west-2
    ProducerConfigProperties AggregationEnabled false
  5. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  6. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  7. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Execute o aplicativo
  1. Na página MyApplication, selecione Executar. Confirme a ação.

  2. Quando o aplicativo estiver em execução, atualize a página. O console mostra o Gráfico do aplicativo.

Interromper o aplicativo

Na página MyApplication, selecione Interromper. Confirme a ação.

Atualizar o aplicativo

Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo. Também é possível recarregar o JAR do aplicativo do bucket do Amazon S3 se for necessário atualizar o código do aplicativo.

Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.

Criar e executar a aplicação (AWS CLI)

Nesta seção, você usa a AWS CLI para criar e executar o aplicativo Flink do Managed Service for Apache Flink. O Managed Service for Apache Flink usa o comando kinesisanalyticsv2 AWS CLI para criar e interagir com aplicativos Managed Service for Apache Flink.

Criar uma política de permissões

Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.

Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) (012345678901) pelo ID da conta.

JSON
{ "Version":"2012-10-17", "Statement": [ { "Sid": "S3", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": ["arn:aws:s3:::ka-app-code-username", "arn:aws:s3:::ka-app-code-username/*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }

Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.

nota

Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.

Criar um perfil do IAM

Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.

O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.

Anexe a política de permissões que criou na seção anterior a essa função.

Para criar uma perfil do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. No painel de navegação, selecione Funções e Criar função.

  3. Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.

    Selecione Next: Permissions (Próximo: permissões).

  4. Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.

  5. Na página Criar função, insira MF-stream-rw-role para o Nome da função. Selecione Criar função.

    Foi criado um perfil do IAM chamado MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função.

  6. Anexe a política de permissões à função.

    nota

    Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.

    1. Na página Resumo, selecione a guia Permissões.

    2. Selecione Attach Policies.

    3. Na caixa de pesquisa, insira AKReadSourceStreamWriteSinkStream (a política criada na seção anterior).

    4. Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.

Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.

Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.

Crie o aplicativo do Managed Service for Apache Flink
  1. Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (username) pelo sufixo selecionado na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta.

    { "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_6", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "java-getting-started-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } }
  2. Execute a ação CreateApplication com a solicitação anterior para criar o aplicativo:

    aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json

O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.

Iniciar o aplicativo

Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.

Para iniciar o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado start_request.json.

    { "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }
  2. Execute a ação StartApplication com a solicitação anterior para iniciar o aplicativo:

    aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json

O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.

Interromper o aplicativo

Nesta seção, a ação StopApplication será usada para interromper o aplicativo.

Como interromper o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado stop_request.json.

    { "ApplicationName": "test" }
  2. Execute a ação StopApplication com a seguinte solicitação para interromper o aplicativo:

    aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json

O aplicativo agora está interrompido.

Adicionar uma opção de registro em log do CloudWatch

Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.

Atualizar propriedades do ambiente

Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.

Para atualizar propriedades de ambiente para o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado update_properties_request.json.

    {"ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } }
  2. Execute a ação UpdateApplication com a solicitação anterior para atualizar as propriedades do ambiente:

    aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo

Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.

Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3. O aplicativo será reiniciado com o novo pacote de código.

O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Criar dois fluxos de dados do Amazon Kinesis.

{ "ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "java-getting-started-1.0.jar" } } } } }

Etapa 4: Limpar os recursos do AWS

Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.

Exclua o seu aplicativo Managed Service for Apache Flink

  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Selecione Configurar.

  4. Na seção Snapshots, selecione Desativar e, em seguida, selecione Atualizar.

  5. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis

  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3

  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch

  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplos de versões anteriores (legadas) do Managed Service for Apache Flink

Esta seção apresenta exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink. Eles incluem código de exemplo e instruções passo a passo para ajudar você a criar aplicativos do Managed Service for Apache Flink e testar seus resultados.

Antes de explorar esses exemplos, recomendamos que você analise em primeiro lugar o seguinte :

nota

Esses exemplos pressupõem que você esteja usando a região Oeste dos EUA (Oregon) (us-west-2). Se você estiver usando uma região diferente, atualize o código, os comandos e o perfil do IAM do aplicativo de forma adequada.

Exemplos de API DataStream

Os exemplos a seguir demonstram como criar aplicativos usando a API DataStream do Apache Flink.

Exemplo: janela em cascata

Neste exercício, você cria um aplicativo Managed Service for Apache Flink que agrega dados usando uma janela em cascata. A agregação está habilitada por padrão no Flink. Para desativá-la, use o seguinte:

sink.producer.aggregation-enabled' = 'false'
nota

Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

Crie recursos dependentes

Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:

  • Dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream)

  • Um bucket do Amazon S3 para armazenar o código do aplicativo (ka-app-code-<username>)

Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:

  • Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seu fluxo de dados ExampleInputStream e ExampleOutputStream.

  • Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como ka-app-code-<username>.

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))
  2. Execute o script stock.py:

    $ python stock.py

    Mantenha o script em execução enquanto você conclui o restante do tutorial.

Baixe e examine o código do aplicativo

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/TumblingWindow.

O código do aplicativo está localizado no arquivo TumblingWindowStreamingJob.java. Observe o seguinte sobre o código do aplicativo:

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));
  • Inclua a seguinte declaração de importação:

    import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows; //flink 1.13 onward
  • O aplicativo usa o operador timeWindow para encontrar a contagem dos valores de cada símbolo de ação em uma janela em cascata de cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:

    input.flatMap(new Tokenizer()) // Tokenizer for generating words .keyBy(0) // Logically partition the stream for each word .window(TumblingProcessingTimeWindows.of(Time.seconds(5))) //Flink 1.13 onward .sum(1) // Sum the number of words per partition .map(value -> value.f0 + "," + value.f1.toString() + "\n") .addSink(createSinkFromStaticConfig());
Compilar o código do aplicativo

Para compilar o aplicativo, faça o seguinte:

  1. Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

  2. Compile o aplicativo com o seguinte comando:

    mvn package -Dflink.version=1.15.3
    nota

    O código-fonte fornecido depende de bibliotecas do Java 11.

A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).

Upload do código Java de fluxo do Apache Flink

Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.

  1. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  2. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior.

  3. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink.

      nota

      O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "logs:DescribeLogGroups", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*", "arn:aws:s3:::ka-app-code-<username>/aws-kinesis-analytics-java-apps-1.0.jar" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": "logs:DescribeLogStreams", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": "logs:PutLogEvents", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" }, { "Sid": "ListCloudwatchLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira aws-kinesis-analytics-java-apps-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  5. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  6. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.

Execute o aplicativo
  1. Na página MyApplication, selecione Executar. Deixe a opção Executar sem snapshot selecionada e confirme a ação.

  2. Quando o aplicativo estiver em execução, atualize a página. O console mostra o Gráfico do aplicativo.

Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.

Limpar recursos da AWS

Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janela em cascata.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplo: janela deslizante

nota

Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

Crie recursos dependentes

Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:

  • Dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream).

  • Um bucket do Amazon S3 para armazenar o código do aplicativo (ka-app-code-<username>)

Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:

  • Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seus fluxos de dados ExampleInputStream e ExampleOutputStream.

  • Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como ka-app-code-<username>.

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { "EVENT_TIME": datetime.datetime.now().isoformat(), "TICKER": random.choice(["AAPL", "AMZN", "MSFT", "INTC", "TBV"]), "PRICE": round(random.random() * 100, 2), } def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey" ) if __name__ == "__main__": generate(STREAM_NAME, boto3.client("kinesis"))
  2. Execute o script stock.py:

    $ python stock.py

    Mantenha o script em execução enquanto você conclui o restante do tutorial.

Baixe e examine o código do aplicativo

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/SlidingWindow.

O código do aplicativo está localizado no arquivo SlidingWindowStreamingJobWithParallelism.java. Observe o seguinte sobre o código do aplicativo:

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));
  • O aplicativo usa o operador timeWindow para descobrir o valor mínimo para cada símbolo de ação em uma janela de dez segundos que desliza por cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:

  • Inclua a seguinte declaração de importação:

    import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows; //flink 1.13 onward
  • O aplicativo usa o operador timeWindow para encontrar a contagem dos valores de cada símbolo de ação em uma janela em cascata de cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:

    input.flatMap(new Tokenizer()) // Tokenizer for generating words .keyBy(0) // Logically partition the stream for each word .window(TumblingProcessingTimeWindows.of(Time.seconds(5))) //Flink 1.13 onward .sum(1) // Sum the number of words per partition .map(value -> value.f0 + "," + value.f1.toString() + "\n") .addSink(createSinkFromStaticConfig());
Compilar o código do aplicativo

Para compilar o aplicativo, faça o seguinte:

  1. Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

  2. Compile o aplicativo com o seguinte comando:

    mvn package -Dflink.version=1.15.3
    nota

    O código-fonte fornecido depende de bibliotecas do Java 11.

A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).

Upload do código Java de fluxo do Apache Flink

Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.

  1. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  2. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior.

  3. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "logs:DescribeLogGroups", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*", "arn:aws:s3:::ka-app-code-<username>/aws-kinesis-analytics-java-apps-1.0.jar" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": "logs:DescribeLogStreams", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": "logs:PutLogEvents", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" }, { "Sid": "ListCloudwatchLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira aws-kinesis-analytics-java-apps-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  5. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  6. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.

Configure o paralelismo do aplicativo

Este exemplo de aplicativo usa a execução paralela de tarefas. O código do aplicativo a seguir define o paralelismo do operador min:

.setParallelism(3) // Set parallelism for the min operator

O paralelismo do aplicativo não pode ser maior do que o paralelismo provisionado, que tem um padrão de 1. Para aumentar o paralelismo do seu aplicativo, use a seguinte ação AWS CLI:

aws kinesisanalyticsv2 update-application --application-name MyApplication --current-application-version-id <VersionId> --application-configuration-update "{\"FlinkApplicationConfigurationUpdate\": { \"ParallelismConfigurationUpdate\": {\"ParallelismUpdate\": 5, \"ConfigurationTypeUpdate\": \"CUSTOM\" }}}"

Você pode recuperar o ID da versão atual do aplicativo usando as ações DescribeApplication ou ListApplications.

Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.

Limpar recursos da AWS

Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janelas deslizantes.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplo: gravação em um bucket do Amazon S3

Neste exercício, você cria um Managed Service for Apache Flink que tem um fluxo de dados do Kinesis como origem e um bucket do Amazon S3 como coletor. Usando o coletor, você pode conferir a saída do aplicativo no console do Amazon S3.

nota

Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

Crie recursos dependentes

Antes de criar um Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:

  • Um fluxo de dados do Kinesis (ExampleInputStream).

  • Um bucket do Amazon S3 para armazenar o código e saída do aplicativo (ka-app-code-<username>)

nota

O Managed Service for Apache Flink não pode gravar dados no Amazon S3 com a criptografia do lado do servidor habilitada no Managed Service for Apache Flink.

Você pode criar o fluxo de dados do Kinesis e um bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:

  • Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seu fluxo de dados ExampleInputStream.

  • Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como ka-app-code-<username>. Crie duas pastas (code e data) no bucket do Amazon S3.

O aplicativo cria os seguintes recursos do CloudWatch, se eles ainda não existirem:

  • Um grupo de logs chamado /AWS/KinesisAnalytics-java/MyApplication.

  • Um fluxo de logs chamado kinesis-analytics-log-stream.

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))
  2. Execute o script stock.py:

    $ python stock.py

    Mantenha o script em execução enquanto você conclui o restante do tutorial.

Baixe e examine o código do aplicativo

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/S3Sink.

O código do aplicativo está localizado no arquivo S3StreamingSinkJob.java. Observe o seguinte sobre o código do aplicativo:

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));
  • Você precisa incluir a seguinte declaração de importação:

    import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows;
  • O aplicativo usa um coletor do Apache Flink S3 para gravar no Amazon S3.

    O coletor lê mensagens em uma janela em cascata, codifica mensagens em objetos de bucket do S3 e envia os objetos codificados para o coletor do S3. O código a seguir codifica objetos para envio ao Amazon S3:

    input.map(value -> { // Parse the JSON JsonNode jsonNode = jsonParser.readValue(value, JsonNode.class); return new Tuple2<>(jsonNode.get("ticker").toString(), 1); }).returns(Types.TUPLE(Types.STRING, Types.INT)) .keyBy(v -> v.f0) // Logically partition the stream for each word .window(TumblingProcessingTimeWindows.of(Time.minutes(1))) .sum(1) // Count the appearances by ticker per partition .map(value -> value.f0 + " count: " + value.f1.toString() + "\n") .addSink(createS3SinkFromStaticConfig());
nota

O aplicativo usa um objeto StreamingFileSink Flink para gravar no Amazon S3. Para obter mais informações sobre o StreamingFileSink, consulte StreamingFileSink na documentação do Apache Flink.

Modifique o código do aplicativo

Nesta seção, você modifica o código do aplicativo para gravar a saída em seu bucket do Amazon S3.

Atualize a linha a seguir com seu nome de usuário para especificar o local de saída do aplicativo:

private static final String s3SinkPath = "s3a://ka-app-code-<username>/data";
Compilar o código do aplicativo

Para compilar o aplicativo, faça o seguinte:

  1. Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

  2. Compile o aplicativo com o seguinte comando:

    mvn package -Dflink.version=1.15.3

A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).

nota

O código-fonte fornecido depende de bibliotecas do Java 11.

Upload do código Java de fluxo do Apache Flink

Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.

  1. No console do Amazon S3, selecione o bucket ka-app-code-<username>, navegue até a pasta do código e selecione Upload.

  2. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior.

  3. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

    nota

    Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink.

    • Deixe a versão como Apache Flink versão 1.15.2 (versão recomendada).

  6. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  7. Selecione Create application (Criar aplicativo).

nota

Ao criar um Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso ao fluxo de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta. Substitua <username> pelo seu nome de usuário.

    { "Sid": "S3", "Effect": "Allow", "Action": [ "s3:Abort*", "s3:DeleteObject*", "s3:GetObject*", "s3:GetBucket*", "s3:List*", "s3:ListBucket", "s3:PutObject" ], "Resource": [ "arn:aws:s3:::ka-app-code-<username>", "arn:aws:s3:::ka-app-code-<username>/*" ] }, { "Sid": "ListCloudwatchLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:region:account-id:log-group:*" ] }, { "Sid": "ListCloudwatchLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:region:account-id:log-group:%LOG_GROUP_PLACEHOLDER%:log-stream:*" ] }, { "Sid": "PutCloudwatchLogs", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:region:account-id:log-group:%LOG_GROUP_PLACEHOLDER%:log-stream:%LOG_STREAM_PLACEHOLDER%" ] } , { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, ] }
Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira code/aws-kinesis-analytics-java-apps-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  5. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  6. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.

Execute o aplicativo
  1. Na página MyApplication, selecione Executar. Deixe a opção Executar sem snapshot selecionada e confirme a ação.

  2. Quando o aplicativo estiver em execução, atualize a página. O console mostra o Gráfico do aplicativo.

Verifique a saída do aplicativo

No console do Amazon S3, abra a pasta de dados em seu bucket do S3.

Depois de alguns minutos, os objetos contendo dados agregados do aplicativo serão apresentados.

nota

A agregação está habilitada por padrão no Flink. Para desativá-la, use o seguinte:

sink.producer.aggregation-enabled' = 'false'
Opcional: personalize a fonte e o coletor

Nesta seção, você personaliza as configurações dos objetos de origem e coletor.

nota

Depois de alterar as seções do código descritas nas seções a seguir, faça o seguinte para recarregar o código do aplicativo:

  • Repita as etapas da seção Compilar o código do aplicativo para compilar o código atualizado do aplicativo.

  • Repita as etapas da seção Upload do código Java de fluxo do Apache Flink para fazer o upload do código atualizado do aplicativo.

  • Na página do aplicativo no console, selecione Configure e, em seguida, selecione Update (Atualizar) para recarregar o código do aplicativo atualizado em seu aplicativo.

Configure o particionamento de dados

Nesta seção, você configura os nomes das pastas que o coletor de arquivos de streaming cria no bucket do S3. Para isso, adicione um atribuidor de bucket ao coletor de arquivos de streaming.

Para personalizar os nomes das pastas criados no bucket do S3, faça o seguinte:

  1. Adicione as seguintes declarações de importação ao início do arquivo S3StreamingSinkJob.java:

    import org.apache.flink.streaming.api.functions.sink.filesystem.rollingpolicies.DefaultRollingPolicy; import org.apache.flink.streaming.api.functions.sink.filesystem.bucketassigners.DateTimeBucketAssigner;
  2. Atualize o método createS3SinkFromStaticConfig() no código para que fique como se segue:

    private static StreamingFileSink<String> createS3SinkFromStaticConfig() { final StreamingFileSink<String> sink = StreamingFileSink .forRowFormat(new Path(s3SinkPath), new SimpleStringEncoder<String>("UTF-8")) .withBucketAssigner(new DateTimeBucketAssigner("yyyy-MM-dd--HH")) .withRollingPolicy(DefaultRollingPolicy.create().build()) .build(); return sink; }

O exemplo de código anterior usa o DateTimeBucketAssigner com um formato de data personalizado para criar pastas no bucket do S3. O DateTimeBucketAssigner usa o sistema de horário atual para criar nomes para os buckets. Se você quiser criar um atribuidor de bucket personalizado para personalizar ainda mais os nomes das pastas criadas, você pode criar uma classe que implemente o BucketAssigner. Você implementa sua lógica personalizada usando o método getBucketId.

Uma implementação personalizada do BucketAssigner pode usar o parâmetro Contexto para obter mais informações sobre um registro a fim de determinar sua pasta de destino.

Configure a frequência de leitura

Nesta seção, você configura a frequência das leituras no fluxo de origem.

Por padrão, o consumidor do Kinesis Streams lê o fluxo de origem cinco vezes por segundo. Essa frequência causará problemas se houver mais de um cliente lendo o fluxo ou se o aplicativo precisar tentar ler um registro novamente. Você pode evitar esses problemas definindo a frequência de leitura do consumidor.

Para definir a frequência de leitura do consumidor do Kinesis, você define a configuração SHARD_GETRECORDS_INTERVAL_MILLIS.

O exemplo de código a seguir define a configuração SHARD_GETRECORDS_INTERVAL_MILLIS para um segundo:

kinesisConsumerConfig.setProperty(ConsumerConfigConstants.SHARD_GETRECORDS_INTERVAL_MILLIS, "1000");
Configure o buffer de gravação

Nesta seção, você define a frequência de gravação e outras configurações do coletor.

Por padrão, o aplicativo grava no bucket de destino a cada minuto. Você pode alterar esse intervalo e outras configurações configurando o objeto DefaultRollingPolicy.

nota

O coletor de arquivos de streaming do Apache Flink grava em seu bucket de saída toda vez que o aplicativo cria um ponto de verificação. Por padrão, o aplicativo cria um ponto de verificação a cada minuto. Para aumentar o intervalo de gravação do coletor do S3, você também deve aumentar o intervalo do ponto de verificação.

Para configurar o objeto DefaultRollingPolicy, faça o seguinte:

  1. Aumente a CheckpointInterval configuração do aplicativo. A entrada a seguir para a ação UpdateApplication define o intervalo do ponto de verificação para dez minutos:

    { "ApplicationConfigurationUpdate": { "FlinkApplicationConfigurationUpdate": { "CheckpointConfigurationUpdate": { "ConfigurationTypeUpdate" : "CUSTOM", "CheckpointIntervalUpdate": 600000 } } }, "ApplicationName": "MyApplication", "CurrentApplicationVersionId": 5 }

    Para usar o código anterior, especifique a versão atual do aplicativo. Você pode recuperar o ID da versão atual do aplicativo usando a ação ListApplications.

  2. Adicione a seguinte declaração de importação ao início do arquivo S3StreamingSinkJob.java:

    import java.util.concurrent.TimeUnit;
  3. Atualize o método createS3SinkFromStaticConfig no arquivo S3StreamingSinkJob.java para que fique como se segue:

    private static StreamingFileSink<String> createS3SinkFromStaticConfig() { final StreamingFileSink<String> sink = StreamingFileSink .forRowFormat(new Path(s3SinkPath), new SimpleStringEncoder<String>("UTF-8")) .withBucketAssigner(new DateTimeBucketAssigner("yyyy-MM-dd--HH")) .withRollingPolicy( DefaultRollingPolicy.create() .withRolloverInterval(TimeUnit.MINUTES.toMillis(8)) .withInactivityInterval(TimeUnit.MINUTES.toMillis(5)) .withMaxPartSize(1024 * 1024 * 1024) .build()) .build(); return sink; }

    O exemplo de código anterior define a frequência de gravações no bucket do Amazon S3 em oito minutos.

Para obter mais informações sobre como configurar o coletor de arquivos de streaming do Apache Flink, consulte Formatos codificados por linha na documentação do Apache Flink.

Limpar recursos da AWS

Esta seção inclui procedimentos para limpar os recursos AWS que você criou no tutorial do Amazon S3.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seu fluxo de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

Exclua seus objetos e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Funções.

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. Na barra de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Tutorial: uso de um aplicativo Managed Service for Apache Flink para replicar dados de um tópico em um cluster MSK para outro em uma VPC

O tutorial a seguir demonstra como criar uma VPC da Amazon com um cluster do Amazon MSK e dois tópicos e como criar um aplicativo Managed Service for Apache Flink que lê um tópico do Amazon MSK e grava em outro.

nota

Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

Crie uma Amazon VPC com um cluster Amazon MSK

Para criar um exemplo de VPC e de cluster do Amazon MSK para acessar a partir de um aplicativo Managed Service for Apache Flink, siga o tutorial Conceitos básicos do uso do Amazon MSK.

Ao concluir o tutorial, observe o seguinte:

  • Na Etapa 3: Crie um tópico, repita o comando kafka-topics.sh --create para criar um tópico de destino chamado AWSKafkaTutorialTopicDestination:

    bin/kafka-topics.sh --create --zookeeper ZooKeeperConnectionString --replication-factor 3 --partitions 1 --topic AWSKafkaTutorialTopicDestination
  • Registre a lista de servidores bootstrap do seu cluster. Você pode obter a lista de servidores bootstrap com o seguinte comando (substitua ClusterArn pelo ARN do seu cluster do MSK):

    aws kafka get-bootstrap-brokers --region us-west-2 --cluster-arn ClusterArn {... "BootstrapBrokerStringTls": "b-2.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094,b-1.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094,b-3.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094" }
  • Ao seguir as etapas dos tutoriais, certifique-se de usar a região AWS selecionada no código, nos comandos e nas entradas do console.

Crie o código do aplicativo

Nesta seção, você baixará e compilará o arquivo JAR do aplicativo. Recomendamos usar o Java 11.

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. O código do aplicativo está localizado no arquivo amazon-kinesis-data-analytics-java-examples/KafkaConnectors/KafkaGettingStartedJob.java. Você pode examinar o código para se familiarizar com a estrutura do código do aplicativo Managed Service for Apache Flink.

  4. Use a ferramenta Maven de linha de comando ou seu ambiente de desenvolvimento preferido para criar o arquivo JAR. Para compilar o arquivo JAR usando a ferramenta Maven de linha de comando, digite o seguinte:

    mvn package -Dflink.version=1.15.3

    Se a compilação for feita com sucesso, o seguinte arquivo será criado:

    target/KafkaGettingStartedJob-1.0.jar
    nota

    O código-fonte fornecido depende de bibliotecas do Java 11. Se você estiver usando um ambiente de desenvolvimento,

Upload do código Java de fluxo do Apache Flink

Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

nota

Se você excluiu o bucket do Amazon S3 no tutorial de introdução, siga a etapa Faça upload do arquivo JAR do código do aplicativo novamente.

  1. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  2. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo KafkaGettingStartedJob-1.0.jar, criado na etapa anterior.

  3. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink..

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink 1.15.2.

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira KafkaGettingStartedJob-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

    nota

    Quando você especifica recursos do aplicativo usando o console (como o CloudWatch Logs ou um Amazon VPC), o console modifica sua função de execução do aplicativo para conceder permissão para acessar esses recursos.

  4. Em Propriedades, selecione Adicionar grupo. Insira as seguintes propriedades:

    ID do grupo Chave Valor
    KafkaSource tópico AWSKafkaTutorialTopic
    KafkaSource bootstrap.servers A lista de servidores bootstrap que você salvou anteriormente
    KafkaSource security.protocol SSL
    KafkaSource ssl.truststore.location /usr/lib/jvm/java-11-amazon-corretto/lib/security/cacerts
    KafkaSource ssl.truststore.password changeit
    nota

    O ssl.truststore.password para o certificado padrão é “changeit”; você não precisa alterar esse valor se estiver usando o certificado padrão.

    Selecione Adicionar grupo novamente. Insira as seguintes propriedades:

    ID do grupo Chave Valor
    KafkaSink tópico AWSKafkaTutorialTopicDestination
    KafkaSink bootstrap.servers A lista de servidores bootstrap que você salvou anteriormente
    KafkaSink security.protocol SSL
    KafkaSink ssl.truststore.location /usr/lib/jvm/java-11-amazon-corretto/lib/security/cacerts
    KafkaSink ssl.truststore.password changeit
    KafkaSink transaction.timeout.ms 1000

    O código do aplicativo lê as propriedades do aplicativo acima para configurar a origem e o coletor usados para interagir com sua VPC e com o cluster do Amazon MSK. Para obter mais informações sobre usar as propriedades, consulte Use as propriedades de runtime.

  5. Em Snapshots, selecione Desativar. Isso facilitará a atualização do aplicativo sem carregar dados inválidos do estado do aplicativo.

  6. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  7. Em CloudWatch logging, marque a caixa de seleção Habilitar.

  8. Na seção Nuvem privada virtual (VPC), selecione a VPC a ser associada ao aplicativo. Selecione as sub-redes e o grupo de segurança associados à sua VPC os quais você deseja que o aplicativo use para acessar os recursos da VPC.

  9. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Esse fluxo de logs é usado para monitorar o aplicativo.

Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Teste a aplicação

Nesta seção, você grava registros no tópico de origem. O aplicativo lê registros do tópico de origem e os grava no tópico de destino. Você verifica se o aplicativo está funcionando gravando registros no tópico de origem e lendo registros do tópico de destino.

Para escrever e ler registros dos tópicos, siga as etapas de Etapa 6: Produza e consuma dados no tutorial de Introdução ao uso do Amazon MSK.

Para ler o tópico de destino, use o nome do tópico de destino em vez do nome do tópico de origem em sua segunda conexão com o cluster:

bin/kafka-console-consumer.sh --bootstrap-server BootstrapBrokerString --consumer.config client.properties --topic AWSKafkaTutorialTopicDestination --from-beginning

Se nenhum registro aparecer no tópico de destino, consulte a seção Não é possível acessar recursos em uma VPC no tópico Solucionar problemas do Managed Service for Apache Flink.

Exemplo: use um consumidor EFO com um fluxo de dados do Kinesis

Neste exercício, você cria um aplicativo Managed Service for Apache Flink que lê a partir de um fluxo de dados do Kinesis usando um consumidor Enhanced Fan-Out (EFO). Se um consumidor do Kinesis usa o EFO, o serviço Kinesis Data Streams fornece sua própria largura de banda dedicada, em vez de fazer com que o consumidor compartilhe a largura de banda fixa do stream com os outros consumidores que estão lendo o stream.

Para obter mais informações sobre como usar o EFO com o consumidor Kinesis, consulte FLIP-128: distribuição avançada para consumidores da Kinesis.

O aplicativo que você cria neste exemplo usa o conector AWS Kinesis (flink-connector-kinesis) 1.15.3.

nota

Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

Crie recursos dependentes

Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:

  • Dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream)

  • Um bucket do Amazon S3 para armazenar o código do aplicativo (ka-app-code-<username>)

Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:

  • Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seu fluxo de dados ExampleInputStream e ExampleOutputStream.

  • Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como ka-app-code-<username>.

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))
  2. Execute o script stock.py:

    $ python stock.py

    Mantenha o script em execução enquanto você conclui o restante do tutorial.

Baixe e examine o código do aplicativo

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/EfoConsumer.

O código do aplicativo está localizado no arquivo EfoApplication.java. Observe o seguinte sobre o código do aplicativo:

  • Você habilita o consumidor EFO definindo os seguintes parâmetros no consumidor do Kinesis:

    • RECORD_PUBLISHER_TYPE: defina esse parâmetro como EFO para que seu aplicativo use um consumidor EFO para acessar os dados do Kinesis Data Stream.

    • EFO_CONSUMER_NAME: defina esse parâmetro como um valor de sequência de caracteres que é exclusivo entre os consumidores desse fluxo. A reutilização de um nome de consumidor no mesmo Kinesis Data Stream fará com que o consumidor anterior que usava esse nome seja excluído.

  • O exemplo de código a seguir demonstra como atribuir valores às propriedades de configuração do consumidor para usar um consumidor EFO para ler o fluxo de origem:

    consumerConfig.putIfAbsent(RECORD_PUBLISHER_TYPE, "EFO"); consumerConfig.putIfAbsent(EFO_CONSUMER_NAME, "basic-efo-flink-app");
Compilar o código do aplicativo

Para compilar o aplicativo, faça o seguinte:

  1. Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

  2. Compile o aplicativo com o seguinte comando:

    mvn package -Dflink.version=1.15.3
    nota

    O código-fonte fornecido depende de bibliotecas do Java 11.

A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).

Upload do código Java de fluxo do Apache Flink

Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.

  1. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  2. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior.

  3. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink.

      nota

      O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    nota

    Essas permissões concedem ao aplicativo a capacidade de acessar o consumidor EFO.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "logs:DescribeLogGroups", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*", "arn:aws:s3:::ka-app-code-<username>/aws-kinesis-analytics-java-apps-1.0.jar" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": "logs:DescribeLogStreams", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": "logs:PutLogEvents", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" }, { "Sid": "ListCloudwatchLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "AllStreams", "Effect": "Allow", "Action": [ "kinesis:ListShards", "kinesis:ListStreamConsumers", "kinesis:DescribeStreamSummary" ], "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/*" }, { "Sid": "Stream", "Effect": "Allow", "Action": [ "kinesis:DescribeStream", "kinesis:RegisterStreamConsumer", "kinesis:DeregisterStreamConsumer" ], "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" }, { "Sid": "Consumer", "Effect": "Allow", "Action": [ "kinesis:DescribeStreamConsumer", "kinesis:SubscribeToShard" ], "Resource": [ "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream/consumer/my-efo-flink-app", "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream/consumer/my-efo-flink-app:*" ] } ] }
Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira aws-kinesis-analytics-java-apps-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Propriedades, selecione Criar grupo.

  5. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    ConsumerConfigProperties flink.stream.recordpublisher EFO
    ConsumerConfigProperties flink.stream.efo.consumername basic-efo-flink-app
    ConsumerConfigProperties INPUT_STREAM ExampleInputStream
    ConsumerConfigProperties flink.inputstream.initpos LATEST
    ConsumerConfigProperties AWS_REGION us-west-2
  6. Em Propriedades, selecione Criar grupo.

  7. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    ProducerConfigProperties OUTPUT_STREAM ExampleOutputStream
    ProducerConfigProperties AWS_REGION us-west-2
    ProducerConfigProperties AggregationEnabled false
  8. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  9. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  10. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.

Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.

Você também pode verificar o nome do seu consumidor (basic-efo-flink-app) no console do Kinesis Data Streams, na guia Enhanced fan-out do fluxo de dados.

Limpar recursos da AWS

Esta seção inclui procedimentos para limpar AWS recursos criados no tutorial Janela EFO.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplo: gravação no Firehose

Neste exercício, você cria um aplicativo Managed Service for Apache Flink que tem um fluxo de dados do Kinesis como fonte e um fluxo do Firehose como coletor. Usando o coletor, você pode conferir a saída do aplicativo em um bucket do Amazon S3.

nota

Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

Crie recursos dependentes

Antes de criar um Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:

  • Um fluxo de dados do Kinesis (ExampleInputStream)

  • Um fluxo do Firehose no qual o aplicativo grava o resultado em (ExampleDeliveryStream).

  • Um bucket do Amazon S3 para armazenar o código do aplicativo (ka-app-code-<username>)

É possível criar o fluxo do Kinesis, os buckets do Amazon S3 e o fluxo do Firehose usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))
  2. Execute o script stock.py:

    $ python stock.py

    Mantenha o script em execução enquanto você conclui o restante do tutorial.

Baixar e examinar o código Java de fluxo do Apache Flink

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  2. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/FirehoseSink.

O código do aplicativo está localizado no arquivo FirehoseSinkStreamingJob.java. Observe o seguinte sobre o código do aplicativo:

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));
  • O aplicativo usa um coletor do Firehose para gravar dados em um fluxo do Firehose. O trecho a seguir cria o coletor do Firehose:

    private static KinesisFirehoseSink<String> createFirehoseSinkFromStaticConfig() { Properties sinkProperties = new Properties(); sinkProperties.setProperty(AWS_REGION, region); return KinesisFirehoseSink.<String>builder() .setFirehoseClientProperties(sinkProperties) .setSerializationSchema(new SimpleStringSchema()) .setDeliveryStreamName(outputDeliveryStreamName) .build(); }
Compilar o código do aplicativo

Para compilar o aplicativo, faça o seguinte:

  1. Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

  2. Para usar o conector Kinesis no aplicativo a seguir, você precisa baixar, compilar e instalar o Apache Maven. Para obter mais informações, consulte Uso do conector Kinesis Streams para o Apache Flink com versões anteriores do Apache Flink.

  3. Compile o aplicativo com o seguinte comando:

    mvn package -Dflink.version=1.15.3
    nota

    O código-fonte fornecido depende de bibliotecas do Java 11.

A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).

Upload do código Java de fluxo do Apache Flink

Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.

Para fazer upload do código do aplicativo
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. No console, selecione o bucket ka-app-code-<username> e selecione Upload.

  3. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo java-getting-started-1.0.jar, criado na etapa anterior.

  4. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.

nota

Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.

Crie e execute o aplicativo (console)

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Descrição, insira My java test app.

    • Em Runtime, selecione Apache Flink.

      nota

      O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Quando você cria o aplicativo usando o console, você tem a opção de criar um perfil e uma política do IAM para o seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso ao fluxo de dados do Kinesis e ao fluxo do Firehose.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua todas as ocorrências do exemplo de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:s3:::ka-app-code-username/java-getting-started-1.0.jar" ] }, { "Sid": "DescribeLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteDeliveryStream", "Effect": "Allow", "Action": "firehose:*", "Resource": "arn:aws:firehose:us-west-2:012345678901:deliverystream/ExampleDeliveryStream" } ] }
Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira java-getting-started-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  5. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  6. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Interromper o aplicativo

Na página MyApplication, selecione Interromper. Confirme a ação.

Atualizar o aplicativo

Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo.

Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.

nota

Para atualizar o código do aplicativo no console, você deve alterar o nome do objeto do JAR, usar um bucket do S3 diferente ou usar o AWS CLI conforme descrito na seção Atualizar o código do aplicativo. Se o nome do arquivo ou o bucket não mudar, o código do aplicativo não será recarregado quando você selecionar Atualizar na página Configure.

Criar e executar a aplicação (AWS CLI)

Nesta seção, você usa a AWS CLI para criar e executar o aplicativo Flink do Managed Service for Apache Flink.

Criar uma política de permissões

Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.

Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário que você usará para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) (012345678901) pelo ID da conta.

JSON
{ "Version":"2012-10-17", "Statement": [ { "Sid": "S3", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": ["arn:aws:s3:::ka-app-code-username", "arn:aws:s3:::ka-app-code-username/*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteDeliveryStream", "Effect": "Allow", "Action": "firehose:*", "Resource": "arn:aws:firehose:us-west-2:012345678901:deliverystream/ExampleDeliveryStream" } ] }

Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.

nota

Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.

Criar um perfil do IAM

Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.

O Managed Service for Apache Flink não pode acessar seu fluxo se não tiver permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink a permissão de assumir a função. A política de permissões determina o que o Managed Service for Apache Flink pode fazer depois de assumir a função.

Anexe a política de permissões que criou na seção anterior a essa função.

Para criar uma perfil do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. No painel de navegação, selecione Funções e Criar função.

  3. Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.

    Selecione Next: Permissions (Próximo: permissões).

  4. Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.

  5. Na página Criar função, insira MF-stream-rw-role para o Nome da função. Selecione Criar função.

    Foi criado um perfil do IAM chamado MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função.

  6. Anexe a política de permissões à função.

    nota

    Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.

    1. Na página Resumo, selecione a guia Permissões.

    2. Selecione Attach Policies.

    3. Na caixa de pesquisa, insira AKReadSourceStreamWriteSinkStream (a política criada na seção anterior).

    4. Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.

Agora você criou a função de execução de serviço que seu aplicativo usará para acessar os recursos. Anote o ARN da nova função.

Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.

Crie o aplicativo do Managed Service for Apache Flink
  1. Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket pelo sufixo que você selecionou na seçãoCrie recursos dependentes (ka-app-code-<username>). Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta.

    { "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "java-getting-started-1.0.jar" } }, "CodeContentType": "ZIPFILE" } } } }
  2. Execute a ação CreateApplication com a solicitação anterior para criar o aplicativo:

    aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json

O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.

Iniciar o aplicativo

Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.

Para iniciar o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado start_request.json.

    { "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }
  2. Execute a ação StartApplication com a solicitação anterior para iniciar o aplicativo:

    aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json

O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.

Interromper o aplicativo

Nesta seção, a ação StopApplication será usada para interromper o aplicativo.

Como interromper o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado stop_request.json.

    { "ApplicationName": "test" }
  2. Execute a ação StopApplication com a seguinte solicitação para interromper o aplicativo:

    aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json

O aplicativo agora está interrompido.

Adicionar uma opção de registro em log do CloudWatch

Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.

Atualizar o código do aplicativo

Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.

Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3.

O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Crie recursos dependentes.

{ "ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "java-getting-started-1.0.jar" } } } } }
Limpar recursos da AWS

Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Selecione Configurar.

  4. Na seção Snapshots, selecione Desativar e, em seguida, selecione Atualizar.

  5. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seu fluxo de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

Exclua seu fluxo do Firehose
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel do Firehose, selecione ExampleDeliveryStream.

  3. Na página ExampleDeliveryStream, selecione Excluir fluxo do Firehose e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

  4. Se você criou um bucket do Amazon S3 para o destino do fluxo do Firehose, exclua esse bucket também.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Se você criou uma nova política para o fluxo do Firehose, exclua essa política também.

  7. Na barra de navegação, selecione Roles (Funções).

  8. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  9. Selecione Excluir função e, em seguida, confirme a exclusão.

  10. Se você criou uma nova função para o fluxo do Firehose, exclua essa função também.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplo: leia a partir de um fluxo do Kinesis em outra conta

Este exemplo demonstra como criar um Managed Service para o aplicativo Apache Flink que lê dados de um fluxo do Kinesis em uma conta diferente. Neste exemplo, você usará uma conta para o fluxo de origem do Kinesis e uma segunda conta para o aplicativo Managed Service for Apache Flink e para o fluxo de dados do coletor do Kinesis.

Pré-requisitos
  • Neste tutorial, você modifica o exemplo da Introdução para ler dados de um fluxo do Kinesis em uma conta diferente. Conclua o tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink antes de continuar.

  • Você precisa de duas AWS contas para concluir este tutorial: uma para o fluxo de origem e outra para o aplicativo e o fluxo do coletor. Use a conta AWS que você usou para o tutorial da Introdução para o aplicativo e o fluxo do coletor. Use uma conta AWS diferente para o fluxo de origem.

Configuração

Você acessará suas duas contas AWS usando perfis nomeados. Modifique suas AWS credenciais e arquivos de configuração para incluir dois perfis que contenham a região e as informações de conexão de suas duas contas.

O arquivo de credencial de exemplo a seguir contém dois perfis nomeados, ka-source-stream-account-profile e ka-sink-stream-account-profile. Use a conta que você usou no tutorial da Introdução para a conta do fluxo do coletor.

[ka-source-stream-account-profile] aws_access_key_id=AKIAIOSFODNN7EXAMPLE aws_secret_access_key=wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY [ka-sink-stream-account-profile] aws_access_key_id=AKIAI44QH8DHBEXAMPLE aws_secret_access_key=je7MtGbClwBF/2Zp9Utk/h3yCo8nvbEXAMPLEKEY

O arquivo de configuração de exemplo a seguir contém os mesmos perfis nomeados com informações de região e formato de saída.

[profile ka-source-stream-account-profile] region=us-west-2 output=json [profile ka-sink-stream-account-profile] region=us-west-2 output=json
nota

Este tutorial não usa o ka-sink-stream-account-profile. Ele está incluído como um exemplo de como acessar duas contas AWS diferentes usando perfis.

Para obter mais informações sobre perfis nomeados com o AWS CLI, consulte Perfis nomeados na documentação AWS Command Line Interface.

Crie um fluxo do Kinesis da fonte

Nesta seção, você criará o fluxo do Kinesis na conta de origem.

Use o comando a seguir para criar o fluxo do Kinesis que o aplicativo usará como entrada. Observe que o parâmetro --profile especifica qual perfil de conta usar.

$ aws kinesis create-stream \ --stream-name SourceAccountExampleInputStream \ --shard-count 1 \ --profile ka-source-stream-account-profile
Crie e atualize os perfis e políticas do IAM

Para permitir o acesso a objetos em todas as contas AWS, você deve crias um perfil e uma política do IAM na conta de origem. Em seguida, você modifica a política do IAM na conta do coletor. Para obter mais informações sobre como criar perfis e políticas do IAM, consulte os seguintes tópicos no AWS Identity and Access ManagementGuia do usuário:

Perfis e políticas da conta do coletor
  1. Edite a kinesis-analytics-service-MyApplication-us-west-2 política do tutorial da Introdução. Essa política permite que o perfil da conta de origem seja assumido para ler o fluxo de origem.

    nota

    Quando você usa o console para criar seu aplicativo, o console cria uma política chamada kinesis-analytics-service-<application name>-<application region> e um perfil chamado kinesisanalytics-<application name>-<application region>.

    Adicione a seção destacada abaixo à política. Substitua o exemplo de ID de conta (SOURCE01234567) pelo ID da conta que você usará para o fluxo de origem.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "AssumeRoleInSourceAccount", "Effect": "Allow", "Action": "sts:AssumeRole", "Resource": "arn:aws:iam::123456789012:role/KA-Source-Stream-Role" }, { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:s3:::ka-app-code-username/aws-kinesis-analytics-java-apps-1.0.jar" ] }, { "Sid": "ListCloudwatchLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:123456789012:log-group:*" ] }, { "Sid": "ListCloudwatchLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:123456789012:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutCloudwatchLogs", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:123456789012:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] } ] }
  2. Abra o perfil kinesis-analytics-MyApplication-us-west-2 e anote o nome do recurso da Amazon (ARN). Ele será necessário na próxima seção. O ARN do perfil é semelhante ao seguinte.

    arn:aws:iam::SINK012345678:role/service-role/kinesis-analytics-MyApplication-us-west-2
Perfis e políticas da conta de fonte
  1. Crie uma política na conta de origem chamada KA-Source-Stream-Policy. Use o seguinte JSON para a política. Substitua o número da conta de exemplo pelo número da conta de origem.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadInputStream", "Effect": "Allow", "Action": [ "kinesis:DescribeStream", "kinesis:GetRecords", "kinesis:GetShardIterator", "kinesis:ListShards" ], "Resource": "arn:aws:kinesis:us-west-2:111122223333:stream/SourceAccountExampleInputStream" } ] }
  2. Crie um perfil na conta de origem chamado MF-Source-Stream-Role. Faça o seguinte para criar o perfil usando o caso de uso do Managed Flink:

    1. No console de gerenciamento do IAM, selecione Criar perfil.

    2. Na página Criar perfil, selecione AWSServiço. Na lista de serviços, selecione Kinesis.

    3. Na seção Selecione seu caso de uso, selecione Managed Service for Apache Flink.

    4. Selecione Next: Permissions (Próximo: permissões).

    5. Adicione a política de permissões KA-Source-Stream-Policy que criada na etapa anterior. Selecione Next: Tags (Próximo: tags).

    6. Selecione Next: Review (Próximo: revisar).

    7. Nomeie a função KA-Source-Stream-Role. Seu aplicativo usará esse perfil para acessar o fluxo de origem.

  3. Adicione o kinesis-analytics-MyApplication-us-west-2 ARN da conta do coletor à relação de confiança do KA-Source-Stream-Role perfil na conta de origem:

    1. Abra o KA-Source-Stream-Role no console do IAM.

    2. Selecione a guia Relacionamentos de confiança.

    3. Selecione Edit trust relationship (Editar relação de confiança).

    4. Use o código a seguir para a relação de confiança. Substitua o exemplo de IDs de conta (SINK012345678) pelo ID da conta do coletor.

      JSON
      { "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::111122223333:role/service-role/kinesis-analytics-MyApplication-us-west-2" }, "Action": "sts:AssumeRole" } ] }
Atualize o script Python

Nesta seção, você atualiza o script Python que gera dados de amostra para usar no perfil da conta de origem.

Atualize o script stock.py com as seguintes alterações destacadas.

import json import boto3 import random import datetime import os os.environ['AWS_PROFILE'] ='ka-source-stream-account-profile' os.environ['AWS_DEFAULT_REGION'] = 'us-west-2' kinesis = boto3.client('kinesis') def getReferrer(): data = {} now = datetime.datetime.now() str_now = now.isoformat() data['event_time'] = str_now data['ticker'] = random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']) price = random.random() * 100 data['price'] = round(price, 2) return data while True: data = json.dumps(getReferrer()) print(data) kinesis.put_record( StreamName="SourceAccountExampleInputStream", Data=data, PartitionKey="partitionkey")
Atualize o aplicativo Java

Nesta seção, você atualiza o código do aplicativo Java para assumir a função da conta de origem ao ler o fluxo de origem.

Faça as alterações a seguir no arquivo BasicStreamingJob.java. Substitua o exemplo do número da conta de origem (SOURCE01234567) pelo número da conta de origem.

package com.amazonaws.services.managed-flink; import com.amazonaws.services.managed-flink.runtime.KinesisAnalyticsRuntime; import org.apache.flink.api.common.serialization.SimpleStringSchema; import org.apache.flink.streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.connectors.kinesis.FlinkKinesisConsumer; import org.apache.flink.streaming.connectors.kinesis.FlinkKinesisProducer; import org.apache.flink.streaming.connectors.kinesis.config.ConsumerConfigConstants; import org.apache.flink.streaming.connectors.kinesis.config.AWSConfigConstants; import java.io.IOException; import java.util.Map; import java.util.Properties; /** * A basic Managed Service for Apache Flink for Java application with Kinesis data streams * as source and sink. */ public class BasicStreamingJob { private static final String region = "us-west-2"; private static final String inputStreamName = "SourceAccountExampleInputStream"; private static final String outputStreamName = ExampleOutputStream; private static final String roleArn = "arn:aws:iam::SOURCE01234567:role/KA-Source-Stream-Role"; private static final String roleSessionName = "ksassumedrolesession"; private static DataStream<String> createSourceFromStaticConfig(StreamExecutionEnvironment env) { Properties inputProperties = new Properties(); inputProperties.setProperty(AWSConfigConstants.AWS_CREDENTIALS_PROVIDER, "ASSUME_ROLE"); inputProperties.setProperty(AWSConfigConstants.AWS_ROLE_ARN, roleArn); inputProperties.setProperty(AWSConfigConstants.AWS_ROLE_SESSION_NAME, roleSessionName); inputProperties.setProperty(ConsumerConfigConstants.AWS_REGION, region); inputProperties.setProperty(ConsumerConfigConstants.STREAM_INITIAL_POSITION, "LATEST"); return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties)); } private static KinesisStreamsSink<String> createSinkFromStaticConfig() { Properties outputProperties = new Properties(); outputProperties.setProperty(AWSConfigConstants.AWS_REGION, region); return KinesisStreamsSink.<String>builder() .setKinesisClientProperties(outputProperties) .setSerializationSchema(new SimpleStringSchema()) .setStreamName(outputProperties.getProperty("OUTPUT_STREAM", "ExampleOutputStream")) .setPartitionKeyGenerator(element -> String.valueOf(element.hashCode())) .build(); } public static void main(String[] args) throws Exception { // set up the streaming execution environment final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); DataStream<String> input = createSourceFromStaticConfig(env); input.addSink(createSinkFromStaticConfig()); env.execute("Flink Streaming Java API Skeleton"); } }
Compile, faça o upload e execute o aplicativo

Faça o seguinte para atualizar e executar o aplicativo:

  1. Compile o aplicativo novamente executando o comando a seguir no diretório com o arquivo pom.xml.

    mvn package -Dflink.version=1.15.3
  2. Exclua o arquivo JAR anterior do seu bucket do Amazon Simple Storage Service (Amazon S3) e, em seguida, faça o upload do novo arquivo aws-kinesis-analytics-java-apps-1.0.jar no bucket do Amazon S3.

  3. Na página do aplicativo no console Managed Service for Apache Flink, selecione Configurar, Atualizar para recarregar o arquivo JAR do aplicativo.

  4. Execute o script stock.py para enviar dados para o fluxo de origem.

    python stock.py

Agora, o aplicativo lê dados do fluxo do Kinesis na outra conta.

Você pode ver se o aplicativo está funcionando verificando a métrica PutRecords.Bytes do fluxo ExampleOutputStream. Se houver atividade no fluxo de saída, o aplicativo está funcionando corretamente.

Tutorial: como usar um armazenamento confiável personalizado com o Amazon MSK

APIs de fonte de dados atuais

Se você estiver usando as APIs da fonte de dados atual, seu aplicativo poderá aproveitar o utilitário Amazon MSK Config Providers descrito aqui. Isso permite que sua função KafkaSource acesse seu keystore e seu truststore para TLS mútuo no Amazon S3.

... // define names of config providers: builder.setProperty("config.providers", "secretsmanager,s3import"); // provide implementation classes for each provider: builder.setProperty("config.providers.secretsmanager.class", "com.amazonaws.kafka.config.providers.SecretsManagerConfigProvider"); builder.setProperty("config.providers.s3import.class", "com.amazonaws.kafka.config.providers.S3ImportConfigProvider"); String region = appProperties.get(Helpers.S3_BUCKET_REGION_KEY).toString(); String keystoreS3Bucket = appProperties.get(Helpers.KEYSTORE_S3_BUCKET_KEY).toString(); String keystoreS3Path = appProperties.get(Helpers.KEYSTORE_S3_PATH_KEY).toString(); String truststoreS3Bucket = appProperties.get(Helpers.TRUSTSTORE_S3_BUCKET_KEY).toString(); String truststoreS3Path = appProperties.get(Helpers.TRUSTSTORE_S3_PATH_KEY).toString(); String keystorePassSecret = appProperties.get(Helpers.KEYSTORE_PASS_SECRET_KEY).toString(); String keystorePassSecretField = appProperties.get(Helpers.KEYSTORE_PASS_SECRET_FIELD_KEY).toString(); // region, etc.. builder.setProperty("config.providers.s3import.param.region", region); // properties builder.setProperty("ssl.truststore.location", "${s3import:" + region + ":" + truststoreS3Bucket + "/" + truststoreS3Path + "}"); builder.setProperty("ssl.keystore.type", "PKCS12"); builder.setProperty("ssl.keystore.location", "${s3import:" + region + ":" + keystoreS3Bucket + "/" + keystoreS3Path + "}"); builder.setProperty("ssl.keystore.password", "${secretsmanager:" + keystorePassSecret + ":" + keystorePassSecretField + "}"); builder.setProperty("ssl.key.password", "${secretsmanager:" + keystorePassSecret + ":" + keystorePassSecretField + "}"); ...

Mais detalhes e uma explicação passo a passo podem ser encontrados aqui.

APIs herdadas do SourceFunction

Se você estiver usando as APIs herdadas do SourceFunction, seu aplicativo usará esquemas personalizados de serialização e desserialização que substituem o método open para carregar o truststore personalizado. Isso torna o truststore disponível para o aplicativo após o aplicativo ser reiniciado ou substituído pelos encadeamentos.

O truststore personalizado é recuperado e armazenado usando o seguinte código:

public static void initializeKafkaTruststore() { ClassLoader classLoader = Thread.currentThread().getContextClassLoader(); URL inputUrl = classLoader.getResource("kafka.client.truststore.jks"); File dest = new File("/tmp/kafka.client.truststore.jks"); try { FileUtils.copyURLToFile(inputUrl, dest); } catch (Exception ex) { throw new FlinkRuntimeException("Failed to initialize Kakfa truststore", ex); } }
nota

O Apache Flink exige que o truststore esteja no formato JKS.

nota

Para configurar os pré-requisitos necessários para este exercício, em primeiro lugar conclua o exercício. Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink

O tutorial a seguir demonstra como se conectar com segurança (criptografia em trânsito) a um cluster do Kafka que usa certificados de servidor emitidos por uma autoridade de certificação (CA) personalizada, privada ou, até mesmo, auto-hospedada.

Para conectar qualquer cliente do Kafka de forma segura via TLS a um cluster do Kafka, o cliente do Kafka (como o exemplo do aplicativo Flink) deve confiar em toda a cadeia de confiança apresentada pelos certificados de servidor do cluster do Kafka (da AC emissora até a AC de nível raiz). Como exemplo de um armazenamento confiável personalizado, usaremos um cluster do Amazon MSK com a autenticação TLS mútua (MTLS) habilitada. Isso significa que os nós do cluster do MSK usam certificados de servidor emitidos por uma Autoridade de Certificação Privada do AWS Certificate Manager que é privada na sua conta e região e, portanto, não é confiável para o armazenamento confiável padrão do Java Virtual Machine (JVM) que executa o aplicativo Flink.

nota
  • Um keystore é usado para armazenar a chave privada e os certificados de identidade que um aplicativo deve apresentar ao servidor ou ao cliente para verificação.

  • Um armazenamento confiável é usado para armazenar certificados de Autoridades Certificadas (AC) que verificam o certificado apresentado pelo servidor em uma conexão SSL.

Você também pode usar a técnica deste tutorial para interações entre um aplicativo Managed Service for Apache Flink e outras fontes do Apache Kafka, como:

Crie uma VPC com um cluster do Amazon MSK

Para criar um exemplo de VPC e de cluster do Amazon MSK para acessar a partir de um aplicativo Managed Service for Apache Flink, siga o tutorial Conceitos básicos do uso do Amazon MSK.

Ao concluir o tutorial, faça também o seguinte:

  • Na Etapa 3: Crie um tópico, repita o comando kafka-topics.sh --create para criar um tópico de destino chamado AWSKafkaTutorialTopicDestination:

    bin/kafka-topics.sh --create --bootstrap-server ZooKeeperConnectionString --replication-factor 3 --partitions 1 --topic AWSKafkaTutorialTopicDestination
    nota

    Se o comando kafka-topics.sh retornar um ZooKeeperClientTimeoutException, verifique se o grupo de segurança do cluster do Kafka tem uma regra de entrada para permitir todo o tráfego do endereço IP privado da instância do cliente.

  • Registre a lista de servidores bootstrap do seu cluster. Você pode obter a lista de servidores bootstrap com o seguinte comando (substitua ClusterArn pelo ARN do seu cluster do MSK):

    aws kafka get-bootstrap-brokers --region us-west-2 --cluster-arn ClusterArn {... "BootstrapBrokerStringTls": "b-2.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094,b-1.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094,b-3.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094" }
  • Ao seguir as etapas deste tutorial e dos tutoriais de pré-requisito, certifique-se de usar a região AWS selecionada no seu código, nos comandos e nas entradas do console.

Crie um armazenamento confiável personalizado e aplique-o ao seu cluster

Nesta seção, você cria uma autoridade de certificação (CA) personalizada, a usa para gerar um truststore personalizado e a aplica ao seu cluster do MSK.

Para criar e aplicar seu truststore personalizado, siga o tutorial de Autenticação do cliente no Guia do desenvolvedor do Amazon Managed Streaming for Apache Kafka.

Crie o código do aplicativo

Nesta seção, você baixa e compila o arquivo JAR do aplicativo.

O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. O código do aplicativo está localizado no amazon-kinesis-data-analytics-java-examples/CustomKeystore. Você pode examinar o código para se familiarizar com a estrutura do código do Managed Service for Apache Flink.

  4. Use a ferramenta Maven de linha de comando ou seu ambiente de desenvolvimento preferido para criar o arquivo JAR. Para compilar o arquivo JAR usando a ferramenta Maven de linha de comando, insira o seguinte:

    mvn package -Dflink.version=1.15.3

    Se a compilação for feita com sucesso, o seguinte arquivo será criado:

    target/flink-app-1.0-SNAPSHOT.jar
    nota

    O código-fonte fornecido depende de bibliotecas do Java 11.

Upload do código Java de fluxo do Apache Flink

Nesta seção, você faz o upload do código do seu aplicativo no bucket do Amazon S3 que você criou no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.

nota

Se você excluiu o bucket do Amazon S3 no tutorial de introdução, siga a etapa Faça upload do arquivo JAR do código do aplicativo novamente.

  1. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  2. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo flink-app-1.0-SNAPSHOT.jar, criado na etapa anterior.

  3. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink 1.15.2.

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira flink-app-1.0-SNAPSHOT.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

    nota

    Quando você especifica recursos do aplicativo usando o console (como Logs ou uma VPC), o console modifica sua função de execução do aplicativo para conceder permissão para acessar esses recursos.

  4. Em Propriedades, selecione Adicionar grupo. Insira as seguintes propriedades:

    ID do grupo Chave Valor
    KafkaSource tópico AWSKafkaTutorialTopic
    KafkaSource bootstrap.servers A lista de servidores bootstrap que você salvou anteriormente
    KafkaSource security.protocol SSL
    KafkaSource ssl.truststore.location /usr/lib/jvm/java-11-amazon-corretto/lib/security/cacerts
    KafkaSource ssl.truststore.password changeit
    nota

    O ssl.truststore.password para o certificado padrão é “changeit”; você não precisa alterar esse valor se estiver usando o certificado padrão.

    Selecione Adicionar grupo novamente. Insira as seguintes propriedades:

    ID do grupo Chave Valor
    KafkaSink tópico AWSKafkaTutorialTopicDestination
    KafkaSink bootstrap.servers A lista de servidores bootstrap que você salvou anteriormente
    KafkaSink security.protocol SSL
    KafkaSink ssl.truststore.location /usr/lib/jvm/java-11-amazon-corretto/lib/security/cacerts
    KafkaSink ssl.truststore.password changeit
    KafkaSink transaction.timeout.ms 1000

    O código do aplicativo lê as propriedades do aplicativo acima para configurar a origem e o coletor usados para interagir com sua VPC e com o cluster do Amazon MSK. Para obter mais informações sobre usar as propriedades, consulte Use as propriedades de runtime.

  5. Em Snapshots, selecione Desativar. Isso facilitará a atualização do aplicativo sem carregar dados inválidos do estado do aplicativo.

  6. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  7. Em CloudWatch logging, marque a caixa de seleção Habilitar.

  8. Na seção Nuvem privada virtual (VPC), selecione a VPC a ser associada ao aplicativo. Selecione as sub-redes e o grupo de segurança associados à sua VPC os quais você deseja que o aplicativo use para acessar os recursos da VPC.

  9. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Esse fluxo de logs é usado para monitorar o aplicativo.

Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Teste a aplicação

Nesta seção, você grava registros no tópico de origem. O aplicativo lê registros do tópico de origem e os grava no tópico de destino. Você verifica se o aplicativo está funcionando gravando registros no tópico de origem e lendo registros do tópico de destino.

Para escrever e ler registros dos tópicos, siga as etapas de Etapa 6: Produza e consuma dados no tutorial de Introdução ao uso do Amazon MSK.

Para ler o tópico de destino, use o nome do tópico de destino em vez do nome do tópico de origem em sua segunda conexão com o cluster:

bin/kafka-console-consumer.sh --bootstrap-server BootstrapBrokerString --consumer.config client.properties --topic AWSKafkaTutorialTopicDestination --from-beginning

Se nenhum registro aparecer no tópico de destino, consulte a seção Não é possível acessar recursos em uma VPC no tópico Solucionar problemas do Managed Service for Apache Flink.

Exemplos de Python

Os exemplos a seguir demonstram como criar aplicativos usando o Python com a API de tabelas do Apache Flink.

Exemplo: criação de uma janela em cascata em Python

Neste exercício, você cria um aplicativo Python Managed Service for Apache Flink que agrega dados usando uma janela em cascata.

nota

Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: introdução ao uso do Python no Managed Service for Apache Flink.

Crie recursos dependentes

Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:

  • Dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream)

  • Um bucket do Amazon S3 para armazenar o código do aplicativo (ka-app-code-<username>)

Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:

  • Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seus fluxos de dados ExampleInputStream e ExampleOutputStream.

  • Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como ka-app-code-<username>.

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

nota

O script do Python nesta seção usa o AWS CLI. Você deve configurar seu AWS CLI para usar as credenciais da sua conta e a região padrão. Para configurar o seu AWS CLI, digite o seguinte:

aws configure
  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))
  2. Execute o script stock.py:

    $ python stock.py

    Mantenha o script em execução enquanto você conclui o restante do tutorial.

Baixe e examine o código do aplicativo

O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/python/TumblingWindow.

O código do aplicativo está localizado no arquivo tumbling-windows.py. Observe o seguinte sobre o código do aplicativo:

  • O aplicativo usa uma origem de tabela do Kinesis para ler o fluxo de origem. O trecho a seguir chama a função create_table para criar a origem de tabela Kinesis:

    table_env.execute_sql( create_input_table(input_table_name, input_stream, input_region, stream_initpos) )

    A função create_table usa um comando SQL para criar uma tabela que é apoiada pela origem de transmissão:

    def create_input_table(table_name, stream_name, region, stream_initpos): return """ CREATE TABLE {0} ( ticker VARCHAR(6), price DOUBLE, event_time TIMESTAMP(3), WATERMARK FOR event_time AS event_time - INTERVAL '5' SECOND ) PARTITIONED BY (ticker) WITH ( 'connector' = 'kinesis', 'stream' = '{1}', 'aws.region' = '{2}', 'scan.stream.initpos' = '{3}', 'format' = 'json', 'json.timestamp-format.standard' = 'ISO-8601' ) """.format(table_name, stream_name, region, stream_initpos)
  • O aplicativo usa o operador Tumble para agregar registros em uma janela em cascata especificada e retornar os registros agregados como um objeto de tabela:

    tumbling_window_table = ( input_table.window( Tumble.over("10.seconds").on("event_time").alias("ten_second_window") ) .group_by("ticker, ten_second_window") .select("ticker, price.min as price, to_string(ten_second_window.end) as event_time")
  • O aplicativo usa o conector Kinesis Flink, do flink-sql-connector-kinesis-1.15.2.jar .

Comprima e faça upload do código Python de transmissão do Apache Flink

Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.

  1. Use seu aplicativo de compressão preferido para comprimir os arquivos tumbling-windows.py e flink-sql-connector-kinesis-1.15.2.jar. Nomeie o arquivo como myapp.zip.

  2. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  3. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo myapp.zip, criado na etapa anterior.

  4. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink.

      nota

      O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira myapp.zip.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Propriedades, selecione Adicionar grupo.

  5. Insira o seguinte:

    ID do grupo Chave Valor
    consumer.config.0 input.stream.name ExampleInputStream
    consumer.config.0 aws.region us-west-2
    consumer.config.0 scan.stream.initpos LATEST

    Selecione Save (Salvar).

  6. Em Propriedades, selecione Adicionar grupo novamente.

  7. Insira o seguinte:

    ID do grupo Chave Valor
    producer.config.0 output.stream.name ExampleOutputStream
    producer.config.0 aws.region us-west-2
    producer.config.0 shard.count 1
  8. Em Propriedades, selecione Adicionar grupo novamente. Em ID do grupo, digite kinesis.analytics.flink.run.options. Esse grupo de propriedades especiais informa ao aplicativo onde encontrar seus recursos de código. Para obter mais informações, consulte Especifique seus arquivos de código.

  9. Insira o seguinte:

    ID do grupo Chave Valor
    kinesis.analytics.flink.run.options python tumbling-windows.py
    kinesis.analytics.flink.run.options jarfile flink-sql-connector-kinesis-1.15.2.jar
  10. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  11. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  12. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "logs:DescribeLogGroups", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*", "arn:aws:s3:::ka-app-code-<username>/myapp.zip" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": "logs:DescribeLogStreams", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": "logs:PutLogEvents", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" }, { "Sid": "ListCloudwatchLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.

Limpar recursos da AWS

Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janela em cascata.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplo: criação de uma janela deslizante em Python

nota

Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: introdução ao uso do Python no Managed Service for Apache Flink.

Crie recursos dependentes

Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:

  • Dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream)

  • Um bucket do Amazon S3 para armazenar o código do aplicativo (ka-app-code-<username>)

Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:

  • Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seus fluxos de dados ExampleInputStream e ExampleOutputStream.

  • Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como ka-app-code-<username>.

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

nota

O script do Python nesta seção usa o AWS CLI. Você deve configurar seu AWS CLI para usar as credenciais da sua conta e a região padrão. Para configurar o seu AWS CLI, digite o seguinte:

aws configure
  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))
  2. Execute o script stock.py:

    $ python stock.py

    Mantenha o script em execução enquanto você conclui o restante do tutorial.

Baixe e examine o código do aplicativo

O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/>amazon-kinesis-data-analytics-java-examples
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/python/SlidingWindow.

O código do aplicativo está localizado no arquivo sliding-windows.py. Observe o seguinte sobre o código do aplicativo:

  • O aplicativo usa uma origem de tabela do Kinesis para ler o fluxo de origem. O trecho a seguir chama a função create_input_table para criar a origem de tabela Kinesis:

    table_env.execute_sql( create_input_table(input_table_name, input_stream, input_region, stream_initpos) )

    A função create_input_table usa um comando SQL para criar uma tabela que é apoiada pela origem de transmissão:

    def create_input_table(table_name, stream_name, region, stream_initpos): return """ CREATE TABLE {0} ( ticker VARCHAR(6), price DOUBLE, event_time TIMESTAMP(3), WATERMARK FOR event_time AS event_time - INTERVAL '5' SECOND ) PARTITIONED BY (ticker) WITH ( 'connector' = 'kinesis', 'stream' = '{1}', 'aws.region' = '{2}', 'scan.stream.initpos' = '{3}', 'format' = 'json', 'json.timestamp-format.standard' = 'ISO-8601' ) """.format(table_name, stream_name, region, stream_initpos) }
  • O aplicativo usa o operador Slide para agregar registros em uma janela deslizante especificada e retornar os registros agregados como um objeto de tabela:

    sliding_window_table = ( input_table .window( Slide.over("10.seconds") .every("5.seconds") .on("event_time") .alias("ten_second_window") ) .group_by("ticker, ten_second_window") .select("ticker, price.min as price, to_string(ten_second_window.end) as event_time") )
  • O aplicativo usa o conector Kinesis Flink, do arquivo flink-sql-connector-kinesis-1.15.2.jar.

Comprima e faça upload do código Python de transmissão do Apache Flink

Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.

Esta seção descreve como empacotar seu aplicativo Python.

  1. Use seu aplicativo de compressão preferido para comprimir os arquivos sliding-windows.py e flink-sql-connector-kinesis-1.15.2.jar. Nomeie o arquivo como myapp.zip.

  2. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  3. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo myapp.zip, criado na etapa anterior.

  4. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink.

      nota

      O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira myapp.zip.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Propriedades, selecione Adicionar grupo.

  5. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    consumer.config.0 input.stream.name ExampleInputStream
    consumer.config.0 aws.region us-west-2
    consumer.config.0 scan.stream.initpos LATEST

    Selecione Save (Salvar).

  6. Em Propriedades, selecione Adicionar grupo novamente.

  7. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    producer.config.0 output.stream.name ExampleOutputStream
    producer.config.0 aws.region us-west-2
    producer.config.0 shard.count 1
  8. Em Propriedades, selecione Adicionar grupo novamente. Em ID do grupo, digite kinesis.analytics.flink.run.options. Esse grupo de propriedades especiais informa ao aplicativo onde encontrar seus recursos de código. Para obter mais informações, consulte Especifique seus arquivos de código.

  9. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    kinesis.analytics.flink.run.options python sliding-windows.py
    kinesis.analytics.flink.run.options jarfile flink-sql-connector-kinesis_1.15.2.jar
  10. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  11. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  12. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "logs:DescribeLogGroups", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*", "arn:aws:s3:::ka-app-code-<username>/myapp.zip" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": "logs:DescribeLogStreams", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": "logs:PutLogEvents", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" }, { "Sid": "ListCloudwatchLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.

Limpar recursos da AWS

Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janelas deslizantes.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplo: envie dados de transmissão para o Amazon S3 em Python

Neste exercício, você cria um aplicativo Managed Service for Apache Flink em Python que transmite dados para um coletor do Amazon Simple Storage Service.

nota

Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: introdução ao uso do Python no Managed Service for Apache Flink.

Crie recursos dependentes

Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:

  • Um fluxo de dados do Kinesis (ExampleInputStream)

  • Um bucket do Amazon S3 para armazenar o código e saída do aplicativo (ka-app-code-<username>)

nota

O Managed Service for Apache Flink não pode gravar dados no Amazon S3 com a criptografia do lado do servidor habilitada no Managed Service for Apache Flink.

Você pode criar o fluxo de dados do Kinesis e um bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:

  • Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seu fluxo de dados ExampleInputStream.

  • Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como ka-app-code-<username>.

Gravação de registros de amostra no fluxo de entrada

Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.

nota

Essa seção requer AWS SDK for Python (Boto).

nota

O script do Python nesta seção usa o AWS CLI. Você deve configurar seu AWS CLI para usar as credenciais da sua conta e a região padrão. Para configurar o seu AWS CLI, digite o seguinte:

aws configure
  1. Crie um arquivo denominado stock.py com o conteúdo a seguir:

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))
  2. Execute o script stock.py:

    $ python stock.py

    Mantenha o script em execução enquanto você conclui o restante do tutorial.

Baixe e examine o código do aplicativo

O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/python/S3Sink.

O código do aplicativo está localizado no arquivo streaming-file-sink.py. Observe o seguinte sobre o código do aplicativo:

  • O aplicativo usa uma origem de tabela do Kinesis para ler o fluxo de origem. O trecho a seguir chama a função create_source_table para criar a origem de tabela Kinesis:

    table_env.execute_sql( create_source_table(input_table_name, input_stream, input_region, stream_initpos) )

    A função create_source_table usa um comando SQL para criar uma tabela que é apoiada pela fonte de streaming

    import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))
  • O aplicativo usa o conector filesystem para enviar registros para um bucket do Amazon S3:

    def create_sink_table(table_name, bucket_name): return """ CREATE TABLE {0} ( ticker VARCHAR(6), price DOUBLE, event_time VARCHAR(64) ) PARTITIONED BY (ticker) WITH ( 'connector'='filesystem', 'path'='s3a://{1}/', 'format'='json', 'sink.partition-commit.policy.kind'='success-file', 'sink.partition-commit.delay' = '1 min' ) """.format(table_name, bucket_name)
  • O aplicativo usa o conector Kinesis Flink, do arquivo flink-sql-connector-kinesis-1.15.2.jar.

Comprima e faça upload do código Python de transmissão do Apache Flink

Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.

  1. Use seu aplicativo de compressão preferido para comprimir os arquivos streaming-file-sink.py e flink-sql-connector-kinesis-1.15.2.jar. Nomeie o arquivo como myapp.zip.

  2. No console do Amazon S3, selecione o bucket ka-app-code-<username> e selecione Fazer upload.

  3. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo myapp.zip, criado na etapa anterior.

  4. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Criar e executar a aplicação do Managed Service for Apache Flink

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Runtime, selecione Apache Flink.

      nota

      O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.

    • Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Configure o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira myapp.zip.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Propriedades, selecione Adicionar grupo.

  5. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    consumer.config.0 input.stream.name ExampleInputStream
    consumer.config.0 aws.region us-west-2
    consumer.config.0 scan.stream.initpos LATEST

    Selecione Save (Salvar).

  6. Em Propriedades, selecione Adicionar grupo novamente. Em ID do grupo, digite kinesis.analytics.flink.run.options. Esse grupo de propriedades especiais informa ao aplicativo onde encontrar seus recursos de código. Para obter mais informações, consulte Especifique seus arquivos de código.

  7. Insira as seguintes propriedades e valores de aplicativo:

    ID do grupo Chave Valor
    kinesis.analytics.flink.run.options python streaming-file-sink.py
    kinesis.analytics.flink.run.options jarfile S3Sink/lib/flink-sql-connector-kinesis-1.15.2.jar
  8. Em Propriedades, selecione Adicionar grupo novamente. Em ID do grupo, digite sink.config.0. Esse grupo de propriedades especiais informa ao aplicativo onde encontrar seus recursos de código. Para obter mais informações, consulte Especifique seus arquivos de código.

  9. Insira as seguintes propriedades e valores do aplicativo: (substitua o bucket-name pelo nome real do seu bucket do Amazon S3).

    ID do grupo Chave Valor
    sink.config.0 output.bucket.name bucket-name
  10. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  11. Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.

  12. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.

Editar a política do IAM

Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.

  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "logs:DescribeLogGroups", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*", "arn:aws:s3:::ka-app-code-<username>/myapp.zip" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": "logs:DescribeLogStreams", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": "logs:PutLogEvents", "Resource": "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" }, { "Sid": "ListCloudwatchLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteObjects", "Effect": "Allow", "Action": [ "s3:Abort*", "s3:DeleteObject*", "s3:GetObject*", "s3:GetBucket*", "s3:List*", "s3:ListBucket", "s3:PutObject" ], "Resource": [ "arn:aws:s3:::ka-app-code-<username>", "arn:aws:s3:::ka-app-code-<username>/*" ] } ] }
Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.

Limpar recursos da AWS

Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janelas deslizantes.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seu fluxo de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

Exclua seus objetos e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplos do Scala

Os exemplos a seguir demonstram como criar aplicativos usando o Scala com o Apache Flink.

Exemplo: criação de uma janela em cascata no Scala

nota

A partir da versão 1.15, o Flink não tem mais o Scala. Agora, os aplicativos podem usar a API Java de qualquer versão do Scala. O Flink ainda usa o Scala em alguns componentes importantes internamente, mas não expõe o Scala no carregador de classes do código do usuário. Por isso, os usuários precisam adicionar dependências do Scala em seus arquivos jar.

Para obter mais informações sobre as mudanças do Scala no Flink 1.15, consulte Sem o Scala na versão 1.15.

Neste exercício, você criará um aplicativo de streaming simples que usa o Scala 3.2.0 e a API Java de DataStream do Flink. O aplicativo lê os dados do fluxo do Kinesis, os agrega usando janelas deslizantes e grava os resultados no fluxo de saída do Kinesis.

nota

Para configurar os pré-requisitos necessários para este exercício, conclua primeiro o exercício Introdução (Scala).

Baixe e examine o código do aplicativo

O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/scala/TumblingWindow.

Observe o seguinte sobre o código do aplicativo:

  • Um arquivo build.sbt contém informações sobre a configuração e as dependências do aplicativo, incluindo as bibliotecas do Managed Service for Apache Flink.

  • O arquivo BasicStreamingJob.scala contém o método principal que define a funcionalidade do aplicativo.

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    private def createSource: FlinkKinesisConsumer[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val inputProperties = applicationProperties.get("ConsumerConfigProperties") new FlinkKinesisConsumer[String](inputProperties.getProperty(streamNameKey, defaultInputStreamName), new SimpleStringSchema, inputProperties) }

    O aplicativo também usa um coletor do Kinesis para gravar no fluxo de resultados. O trecho a seguir cria o coletor do Kinesis:

    private def createSink: KinesisStreamsSink[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val outputProperties = applicationProperties.get("ProducerConfigProperties") KinesisStreamsSink.builder[String] .setKinesisClientProperties(outputProperties) .setSerializationSchema(new SimpleStringSchema) .setStreamName(outputProperties.getProperty(streamNameKey, defaultOutputStreamName)) .setPartitionKeyGenerator((element: String) => String.valueOf(element.hashCode)) .build }
  • O aplicativo usa o operador de janela para encontrar a contagem de valores para cada símbolo de ação em uma janela em cascata de cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:

    environment.addSource(createSource) .map { value => val jsonNode = jsonParser.readValue(value, classOf[JsonNode]) new Tuple2[String, Int](jsonNode.get("ticker").toString, 1) } .returns(Types.TUPLE(Types.STRING, Types.INT)) .keyBy(v => v.f0) // Logically partition the stream for each ticker .window(TumblingProcessingTimeWindows.of(Time.seconds(10))) .sum(1) // Sum the number of tickers per partition .map { value => value.f0 + "," + value.f1.toString + "\n" } .sinkTo(createSink)
  • O aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.

  • O aplicativo cria conectores de origem e de coletores usando propriedades dinâmicas do aplicativo. As propriedades de runtime do aplicativo para ler e configurar os conectores. Para obter mais informações sobre as propriedades de runtime, consulte Propriedades de runtime.

Compile e faça o upload do código do aplicativo

Nesta seção, você compila e faz o upload do código do aplicativo para um bucket do Amazon S3.

Compilar o código do aplicativo

Use a ferramenta de construção SBT para criar o código Scala para o aplicativo. Para instalar o SBT, consulte Instalar o sbt com a configuração cs. Você também precisa instalar o Java Development Kit (JDK). Consulte Pré-requisitos para concluir os exercícios.

  1. Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Você pode compilar e empacotar seu código com o SBT:

    sbt assembly
  2. Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:

    target/scala-3.2.0/tumbling-window-scala-1.0.jar
Faça o upload do código Scala do Apache Flink Streaming

Nesta seção, você cria um bucket do Amazon S3 e faz upload do código do seu aplicativo.

  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione Criar bucket

  3. Insira ka-app-code-<username> no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.

  4. Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.

  5. Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.

  6. Selecione Criar bucket.

  7. Selecione o bucket ka-app-code-<username> e, em seguida, selecione Upload.

  8. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo tumbling-window-scala-1.0.jar, criado na etapa anterior.

  9. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Crie e execute o aplicativo (console)

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Descrição, insira My Scala test app.

    • Em Runtime, selecione Apache Flink.

    • Deixe a versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Configure o aplicativo

Siga o procedimento a seguir para configurar o aplicativo.

Configurar o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira tumbling-window-scala-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Propriedades, selecione Adicionar grupo.

  5. Insira o seguinte:

    ID do grupo Chave Valor
    ConsumerConfigProperties input.stream.name ExampleInputStream
    ConsumerConfigProperties aws.region us-west-2
    ConsumerConfigProperties flink.stream.initpos LATEST

    Selecione Save (Salvar).

  6. Em Propriedades, selecione Adicionar grupo novamente.

  7. Insira o seguinte:

    ID do grupo Chave Valor
    ProducerConfigProperties output.stream.name ExampleOutputStream
    ProducerConfigProperties aws.region us-west-2
  8. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  9. Em CloudWatch logging, marque a caixa de seleção Habilitar.

  10. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Editar a política do IAM

Edite a política do IAM para adicionar permissões para acessar o bucket do Amazon S3.

Editar a política do IAM para adicionar permissões do bucket do S3
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:s3:::ka-app-code-username/tumbling-window-scala-1.0.jar" ] }, { "Sid": "DescribeLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Interromper o aplicativo

Para interromper o aplicativo, na página Meu aplicativo, selecione Parar. Confirme a ação.

Crie e execute o aplicativo (CLI)

Nesta seção, você usa a AWS Command Line Interface para criar e executar o aplicativo Flink do Managed Service for Apache Flink. Use o comando AWS CLI kinesisanalyticsv2 para criar e interagir com os aplicativos Managed Service para aplicativos Apache Flink.

Criar uma política de permissões
nota

Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.

Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação de ler no fluxo de origem, e outra que concede permissões para ações de gravação no fluxo de coleta. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.

Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos nomes do recurso da Amazon Resources Names (ARNs) (012345678901)pelo ID da sua conta. A função MF-stream-rw-role de execução do serviço deve ser adaptada à função específica do cliente.

{ "ApplicationName": "tumbling_window", "ApplicationDescription": "Scala tumbling window application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "tumbling-window-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }

Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.

Criar um perfil do IAM

Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.

O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.

Anexe a política de permissões que criou na seção anterior a essa função.

Para criar uma perfil do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. No painel de navegação, selecione Perfis e Criar perfil.

  3. Em Selecionar tipo de identidade de confiança, selecione AWSServiço

  4. Em Selecionar o serviço que usará esta função, selecione Kinesis.

  5. Em Selecione seu caso de uso, selecione Managed Service for Apache Flink.

  6. Selecione Next: Permissions (Próximo: permissões).

  7. Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.

  8. Na página Criar função, insira MF-stream-rw-role para o Nome da função. Selecione Criar função.

    Foi criado um perfil do IAM chamado MF-stream-rw-role. Em seguida, você atualiza as políticas de confiança e de permissões para a função

  9. Anexe a política de permissões à função.

    nota

    Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, você anexa a política que criou na etapa anterior, Crie uma política de permissões.

    1. Na página Resumo, selecione a guia Permissões.

    2. Selecione Attach Policies.

    3. Na caixa de pesquisa, insira AKReadSourceStreamWriteSinkStream (a política criada na seção anterior).

    4. Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.

Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.

Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.

Criar o aplicativo

Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (nome do usuário) pelo sufixo que você selecionou na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta. O ServiceExecutionRole deve incluir o perfil do usuário do IAM que você criou na seção anterior.

"ApplicationName": "tumbling_window", "ApplicationDescription": "Scala getting started application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "tumbling-window-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }

Execute o CreateApplication com a seguinte solicitação para criar o aplicativo:

aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json

O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.

Iniciar o aplicativo

Nesta seção, você usa a ação StartApplication para iniciar o aplicativo.

Para iniciar o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado start_request.json.

    { "ApplicationName": "tumbling_window", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }
  2. Execute a ação StartApplication com a solicitação anterior para iniciar o aplicativo:

    aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json

O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.

Interromper o aplicativo

Nesta seção, você usa a ação StopApplication para interromper o aplicativo.

Como interromper o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado stop_request.json.

    { "ApplicationName": "tumbling_window" }
  2. Execute a ação StopApplication com a solicitação anterior para interromper o aplicativo:

    aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json

O aplicativo agora está interrompido.

Adicionar uma opção de registro em log do CloudWatch

Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter informações sobre o uso do CloudWatch Logs com seu aplicativo, consulte Configurando o log de aplicativos.

Atualizar propriedades do ambiente

Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.

Para atualizar propriedades de ambiente para o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado update_properties_request.json.

    {"ApplicationName": "tumbling_window", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } } }
  2. Execute a ação UpdateApplication com a solicitação anterior para atualizar as propriedades do ambiente:

    aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo

Quando você precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação CLI UpdateApplication.

nota

Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.

Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.

O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Crie recursos dependentes.

{ "ApplicationName": "tumbling_window", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "tumbling-window-scala-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }
Limpar recursos da AWS

Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janela em cascata.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplo: criação de uma janela deslizante em Scala

nota

A partir da versão 1.15, o Flink não tem mais o Scala. Agora, os aplicativos podem usar a API Java de qualquer versão do Scala. O Flink ainda usa o Scala em alguns componentes importantes internamente, mas não expõe o Scala no carregador de classes do código do usuário. Por isso, os usuários precisam adicionar dependências do Scala em seus arquivos jar.

Para obter mais informações sobre as mudanças do Scala no Flink 1.15, consulte Sem o Scala na versão 1.15.

Neste exercício, você criará um aplicativo de streaming simples que usa o Scala 3.2.0 e a API Java de DataStream do Flink. O aplicativo lê os dados do fluxo do Kinesis, os agrega usando janelas deslizantes e grava os resultados no fluxo de saída do Kinesis.

nota

Para configurar os pré-requisitos necessários para este exercício, conclua primeiro o exercício Introdução (Scala).

Baixe e examine o código do aplicativo

O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/scala/SlidingWindow.

Observe o seguinte sobre o código do aplicativo:

  • Um arquivo build.sbt contém informações sobre a configuração e as dependências do aplicativo, incluindo as bibliotecas do Managed Service for Apache Flink.

  • O arquivo BasicStreamingJob.scala contém o método principal que define a funcionalidade do aplicativo.

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    private def createSource: FlinkKinesisConsumer[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val inputProperties = applicationProperties.get("ConsumerConfigProperties") new FlinkKinesisConsumer[String](inputProperties.getProperty(streamNameKey, defaultInputStreamName), new SimpleStringSchema, inputProperties) }

    O aplicativo também usa um coletor do Kinesis para gravar no fluxo de resultados. O trecho a seguir cria o coletor do Kinesis:

    private def createSink: KinesisStreamsSink[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val outputProperties = applicationProperties.get("ProducerConfigProperties") KinesisStreamsSink.builder[String] .setKinesisClientProperties(outputProperties) .setSerializationSchema(new SimpleStringSchema) .setStreamName(outputProperties.getProperty(streamNameKey, defaultOutputStreamName)) .setPartitionKeyGenerator((element: String) => String.valueOf(element.hashCode)) .build }
  • O aplicativo usa o operador de janela para encontrar a contagem de valores para cada símbolo de ação em uma janela de dez segundos que desliza por cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:

    environment.addSource(createSource) .map { value => val jsonNode = jsonParser.readValue(value, classOf[JsonNode]) new Tuple2[String, Double](jsonNode.get("ticker").toString, jsonNode.get("price").asDouble) } .returns(Types.TUPLE(Types.STRING, Types.DOUBLE)) .keyBy(v => v.f0) // Logically partition the stream for each word .window(SlidingProcessingTimeWindows.of(Time.seconds(10), Time.seconds(5))) .min(1) // Calculate minimum price per ticker over the window .map { value => value.f0 + String.format(",%.2f", value.f1) + "\n" } .sinkTo(createSink)
  • O aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.

  • O aplicativo cria conectores de origem e de coletores usando propriedades dinâmicas do aplicativo. As propriedades de runtime do aplicativo para ler e configurar os conectores. Para obter mais informações sobre as propriedades de runtime, consulte Propriedades de runtime.

Compile e faça o upload do código do aplicativo

Nesta seção, você compila e faz o upload do código do aplicativo para um bucket do Amazon S3.

Compilar o código do aplicativo

Use a ferramenta de construção SBT para criar o código Scala para o aplicativo. Para instalar o SBT, consulte Instalar o sbt com a configuração cs. Você também precisa instalar o Java Development Kit (JDK). Consulte Pré-requisitos para concluir os exercícios.

  1. Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Você pode compilar e empacotar seu código com o SBT:

    sbt assembly
  2. Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:

    target/scala-3.2.0/sliding-window-scala-1.0.jar
Faça o upload do código Scala do Apache Flink Streaming

Nesta seção, você cria um bucket do Amazon S3 e faz upload do código do seu aplicativo.

  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione Criar bucket

  3. Insira ka-app-code-<username> no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.

  4. Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.

  5. Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.

  6. Selecione Criar bucket.

  7. Selecione o bucket ka-app-code-<username> e, em seguida, selecione Upload.

  8. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo sliding-window-scala-1.0.jar, criado na etapa anterior.

  9. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Crie e execute o aplicativo (console)

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Descrição, insira My Scala test app.

    • Em Runtime, selecione Apache Flink.

    • Deixe a versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Configure o aplicativo

Siga o procedimento a seguir para configurar o aplicativo.

Configurar o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira sliding-window-scala-1.0.jar..

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Propriedades, selecione Adicionar grupo.

  5. Insira o seguinte:

    ID do grupo Chave Valor
    ConsumerConfigProperties input.stream.name ExampleInputStream
    ConsumerConfigProperties aws.region us-west-2
    ConsumerConfigProperties flink.stream.initpos LATEST

    Selecione Save (Salvar).

  6. Em Propriedades, selecione Adicionar grupo novamente.

  7. Insira o seguinte:

    ID do grupo Chave Valor
    ProducerConfigProperties output.stream.name ExampleOutputStream
    ProducerConfigProperties aws.region us-west-2
  8. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  9. Em CloudWatch logging, marque a caixa de seleção Habilitar.

  10. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Editar a política do IAM

Edite a política do IAM para adicionar permissões para acessar o bucket do Amazon S3.

Editar a política do IAM para adicionar permissões do bucket do S3
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:s3:::ka-app-code-username/sliding-window-scala-1.0.jar" ] }, { "Sid": "DescribeLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleOutputStream" } ] }
Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Interromper o aplicativo

Para interromper o aplicativo, na página Meu aplicativo, selecione Parar. Confirme a ação.

Crie e execute o aplicativo (CLI)

Nesta seção, você usa a AWS Command Line Interface para criar e executar o aplicativo Flink do Managed Service for Apache Flink. Use o comando AWS CLI kinesisanalyticsv2 para criar e interagir com os aplicativos Managed Service para aplicativos Apache Flink.

Criar uma política de permissões
nota

Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.

Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação de ler no fluxo de origem, e outra que concede permissões para ações de gravação no fluxo de coleta. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.

Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos nomes do recurso da Amazon Resources Names (ARNs) (012345678901)pelo ID da sua conta.

{ "ApplicationName": "sliding_window", "ApplicationDescription": "Scala sliding window application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "sliding-window-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }

Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.

Criar um perfil do IAM

Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.

O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.

Anexe a política de permissões que criou na seção anterior a essa função.

Para criar uma perfil do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. No painel de navegação, selecione Perfis e Criar perfil.

  3. Em Selecionar tipo de identidade de confiança, selecione AWSServiço

  4. Em Selecionar o serviço que usará esta função, selecione Kinesis.

  5. Em Selecione seu caso de uso, selecione Managed Service for Apache Flink.

  6. Selecione Next: Permissions (Próximo: permissões).

  7. Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.

  8. Na página Criar função, insira MF-stream-rw-role para o Nome da função. Selecione Criar função.

    Foi criado um perfil do IAM chamado MF-stream-rw-role. Em seguida, você atualiza as políticas de confiança e de permissões para a função

  9. Anexe a política de permissões à função.

    nota

    Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, você anexa a política que criou na etapa anterior, Crie uma política de permissões.

    1. Na página Resumo, selecione a guia Permissões.

    2. Selecione Attach Policies.

    3. Na caixa de pesquisa, insira AKReadSourceStreamWriteSinkStream (a política criada na seção anterior).

    4. Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.

Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.

Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.

Criar o aplicativo

Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (nome do usuário) pelo sufixo que você selecionou na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta.

{ "ApplicationName": "sliding_window", "ApplicationDescription": "Scala sliding_window application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "sliding-window-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }

Execute o CreateApplication com a seguinte solicitação para criar o aplicativo:

aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json

O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.

Iniciar o aplicativo

Nesta seção, você usa a ação StartApplication para iniciar o aplicativo.

Para iniciar o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado start_request.json.

    { "ApplicationName": "sliding_window", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }
  2. Execute a ação StartApplication com a solicitação anterior para iniciar o aplicativo:

    aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json

O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.

Interromper o aplicativo

Nesta seção, você usa a ação StopApplication para interromper o aplicativo.

Como interromper o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado stop_request.json.

    { "ApplicationName": "sliding_window" }
  2. Execute a ação StopApplication com a solicitação anterior para interromper o aplicativo:

    aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json

O aplicativo agora está interrompido.

Adicionar uma opção de registro em log do CloudWatch

Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter informações sobre o uso do CloudWatch Logs com seu aplicativo, consulte Configurando o log de aplicativos.

Atualizar propriedades do ambiente

Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.

Para atualizar propriedades de ambiente para o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado update_properties_request.json.

    {"ApplicationName": "sliding_window", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } } }
  2. Execute a ação UpdateApplication com a solicitação anterior para atualizar as propriedades do ambiente:

    aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo

Quando você precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação CLI UpdateApplication.

nota

Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.

Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.

O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Crie recursos dependentes.

{ "ApplicationName": "sliding_window", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }
Limpar recursos da AWS

Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janelas deslizantes.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.

Exemplo: envie dados de transmissão para o Amazon S3 no Scala

nota

A partir da versão 1.15, o Flink não tem mais o Scala. Agora, os aplicativos podem usar a API Java de qualquer versão do Scala. O Flink ainda usa o Scala em alguns componentes importantes internamente, mas não expõe o Scala no carregador de classes do código do usuário. Por isso, os usuários precisam adicionar dependências do Scala em seus arquivos jar.

Para obter mais informações sobre as mudanças do Scala no Flink 1.15, consulte Sem o Scala na versão 1.15.

Neste exercício, você criará um aplicativo de streaming simples que usa o Scala 3.2.0 e a API Java de DataStream do Flink. O aplicativo lê os dados do fluxo do Kinesis, os agrega usando janelas deslizantes e grava os resultados no S3.

nota

Para configurar os pré-requisitos necessários para este exercício, conclua primeiro o exercício Introdução (Scala). Você só precisa criar uma pasta adicional data/ no bucket do Amazon S3 ka-app-code-<username>.

Baixe e examine o código do aplicativo

O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:

  1. Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git.

  2. Duplique o repositório remoto com o seguinte comando:

    git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git
  3. Navegue até o diretório amazon-kinesis-data-analytics-java-examples/scala/S3Sink.

Observe o seguinte sobre o código do aplicativo:

  • Um arquivo build.sbt contém informações sobre a configuração e as dependências do aplicativo, incluindo as bibliotecas do Managed Service for Apache Flink.

  • O arquivo BasicStreamingJob.scala contém o método principal que define a funcionalidade do aplicativo.

  • O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:

    private def createSource: FlinkKinesisConsumer[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val inputProperties = applicationProperties.get("ConsumerConfigProperties") new FlinkKinesisConsumer[String](inputProperties.getProperty(streamNameKey, defaultInputStreamName), new SimpleStringSchema, inputProperties) }

    O aplicativo também usa um StreamingFileSink para gravar em um bucket do Amazon S3:

    def createSink: StreamingFileSink[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val s3SinkPath = applicationProperties.get("ProducerConfigProperties").getProperty("s3.sink.path") StreamingFileSink .forRowFormat(new Path(s3SinkPath), new SimpleStringEncoder[String]("UTF-8")) .build() }
  • O aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.

  • O aplicativo cria conectores de origem e de coletores usando propriedades dinâmicas do aplicativo. As propriedades de runtime do aplicativo para ler e configurar os conectores. Para obter mais informações sobre as propriedades de runtime, consulte Propriedades de runtime.

Compile e faça o upload do código do aplicativo

Nesta seção, você compila e faz o upload do código do aplicativo para um bucket do Amazon S3.

Compilar o código do aplicativo

Use a ferramenta de construção SBT para criar o código Scala para o aplicativo. Para instalar o SBT, consulte Instalar o sbt com a configuração cs. Você também precisa instalar o Java Development Kit (JDK). Consulte Pré-requisitos para concluir os exercícios.

  1. Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Você pode compilar e empacotar seu código com o SBT:

    sbt assembly
  2. Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:

    target/scala-3.2.0/s3-sink-scala-1.0.jar
Faça o upload do código Scala do Apache Flink Streaming

Nesta seção, você cria um bucket do Amazon S3 e faz upload do código do seu aplicativo.

  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione Criar bucket

  3. Insira ka-app-code-<username> no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.

  4. Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.

  5. Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.

  6. Selecione Criar bucket.

  7. Selecione o bucket ka-app-code-<username> e, em seguida, selecione Upload.

  8. Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo s3-sink-scala-1.0.jar, criado na etapa anterior.

  9. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.

O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.

Crie e execute o aplicativo (console)

Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.

Criar o aplicativo
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.

  3. Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:

    • Em Nome do aplicativo, insira MyApplication.

    • Em Descrição, insira My java test app.

    • Em Runtime, selecione Apache Flink.

    • Deixe a versão como Apache Flink versão 1.15.2 (versão recomendada).

  4. Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  5. Selecione Create application (Criar aplicativo).

nota

Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:

  • Política: kinesis-analytics-service-MyApplication-us-west-2

  • perfil: kinesisanalytics-MyApplication-us-west-2

Configure o aplicativo

Siga o procedimento a seguir para configurar o aplicativo.

Configurar o aplicativo
  1. Na página MyApplication, selecione Configure (Configurar).

  2. Na página Configurar aplicativo, forneça o Local do código:

    • Em Bucket do Amazon S3, insira ka-app-code-<username>.

    • Em Caminho do objeto do Amazon S3, insira s3-sink-scala-1.0.jar.

  3. Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM kinesis-analytics-MyApplication-us-west-2.

  4. Em Propriedades, selecione Adicionar grupo.

  5. Insira o seguinte:

    ID do grupo Chave Valor
    ConsumerConfigProperties input.stream.name ExampleInputStream
    ConsumerConfigProperties aws.region us-west-2
    ConsumerConfigProperties flink.stream.initpos LATEST

    Selecione Save (Salvar).

  6. Em Propriedades, selecione Adicionar grupo.

  7. Insira o seguinte:

    ID do grupo Chave Valor
    ProducerConfigProperties s3.sink.path s3a://ka-app-code-<user-name>/data
  8. Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.

  9. Em CloudWatch logging, marque a caixa de seleção Habilitar.

  10. Selecione Atualizar.

nota

Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:

  • Grupo de logs: /aws/kinesis-analytics/MyApplication

  • Fluxo de logs: kinesis-analytics-log-stream

Editar a política do IAM

Edite a política do IAM para adicionar permissões para acessar o bucket do Amazon S3.

Editar a política do IAM para adicionar permissões do bucket do S3
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Selecione Políticas. Selecione a política kinesis-analytics-service-MyApplication-us-west-2 que o console criou na seção anterior.

  3. Na página Resumo, selecione Editar política. Selecione a guia JSON.

  4. Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (012345678901) pelo ID da conta.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:Abort*", "s3:DeleteObject*", "s3:GetObject*", "s3:GetBucket*", "s3:List*", "s3:ListBucket", "s3:PutObject" ], "Resource": [ "arn:aws:s3:::ka-app-code-<username>", "arn:aws:s3:::ka-app-code-<username>/*" ] }, { "Sid": "DescribeLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:*" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:012345678901:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:012345678901:stream/ExampleInputStream" } ] }
Execute o aplicativo

O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.

Interromper o aplicativo

Para interromper o aplicativo, na página Meu aplicativo, selecione Parar. Confirme a ação.

Crie e execute o aplicativo (CLI)

Nesta seção, você usa a AWS Command Line Interface para criar e executar o aplicativo Flink do Managed Service for Apache Flink. Use o comando AWS CLI kinesisanalyticsv2 para criar e interagir com os aplicativos Managed Service para aplicativos Apache Flink.

Criar uma política de permissões
nota

Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.

Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação de ler no fluxo de origem, e outra que concede permissões para ações de gravação no fluxo de coleta. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.

Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos nomes do recurso da Amazon Resources Names (ARNs) (012345678901)pelo ID da sua conta.

JSON
{ "Version":"2012-10-17", "Statement": [ { "Sid": "ReadCode", "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetObjectVersion" ], "Resource": [ "arn:aws:s3:::ka-app-code-username/getting-started-scala-1.0.jar" ] }, { "Sid": "DescribeLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:us-west-2:123456789012:*" ] }, { "Sid": "DescribeLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:us-west-2:123456789012:log-group:/aws/kinesis-analytics/MyApplication:log-stream:*" ] }, { "Sid": "PutLogEvents", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:us-west-2:123456789012:log-group:/aws/kinesis-analytics/MyApplication:log-stream:kinesis-analytics-log-stream" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:123456789012:stream/ExampleInputStream" }, { "Sid": "WriteOutputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:123456789012:stream/ExampleOutputStream" } ] }

Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.

Criar um perfil do IAM

Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.

O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.

Anexe a política de permissões que criou na seção anterior a essa função.

Para criar uma perfil do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. No painel de navegação, selecione Perfis e Criar perfil.

  3. Em Selecionar tipo de identidade de confiança, selecione AWSServiço

  4. Em Selecionar o serviço que usará esta função, selecione Kinesis.

  5. Em Selecione seu caso de uso, selecione Managed Service for Apache Flink.

  6. Selecione Next: Permissions (Próximo: permissões).

  7. Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.

  8. Na página Criar função, insira MF-stream-rw-role para o Nome da função. Selecione Criar função.

    Foi criado um perfil do IAM chamado MF-stream-rw-role. Em seguida, você atualiza as políticas de confiança e de permissões para a função

  9. Anexe a política de permissões à função.

    nota

    Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, você anexa a política que criou na etapa anterior, Crie uma política de permissões.

    1. Na página Resumo, selecione a guia Permissões.

    2. Selecione Attach Policies.

    3. Na caixa de pesquisa, insira AKReadSourceStreamWriteSinkStream (a política criada na seção anterior).

    4. Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.

Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.

Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.

Criar o aplicativo

Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (nome do usuário) pelo sufixo que você selecionou na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta.

{ "ApplicationName": "s3_sink", "ApplicationDescription": "Scala tumbling window application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "s3-sink-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "s3.sink.path" : "s3a://ka-app-code-<username>/data" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }

Execute o CreateApplication com a seguinte solicitação para criar o aplicativo:

aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json

O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.

Iniciar o aplicativo

Nesta seção, você usa a ação StartApplication para iniciar o aplicativo.

Para iniciar o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado start_request.json.

    {{ "ApplicationName": "s3_sink", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }
  2. Execute a ação StartApplication com a solicitação anterior para iniciar o aplicativo:

    aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json

O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.

Interromper o aplicativo

Nesta seção, você usa a ação StopApplication para interromper o aplicativo.

Como interromper o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado stop_request.json.

    { "ApplicationName": "s3_sink" }
  2. Execute a ação StopApplication com a solicitação anterior para interromper o aplicativo:

    aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json

O aplicativo agora está interrompido.

Adicionar uma opção de registro em log do CloudWatch

Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter informações sobre o uso do CloudWatch Logs com seu aplicativo, consulte Configurando o log de aplicativos.

Atualizar propriedades do ambiente

Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.

Para atualizar propriedades de ambiente para o aplicativo
  1. Salve o seguinte código JSON em um arquivo chamado update_properties_request.json.

    {"ApplicationName": "s3_sink", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "s3.sink.path" : "s3a://ka-app-code-<username>/data" } } ] } } }
  2. Execute a ação UpdateApplication com a solicitação anterior para atualizar as propriedades do ambiente:

    aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo

Quando você precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação CLI UpdateApplication.

nota

Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.

Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.

O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Crie recursos dependentes.

{ "ApplicationName": "s3_sink", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "s3-sink-scala-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }
Limpar recursos da AWS

Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janela em cascata.

Exclua o seu aplicativo Managed Service for Apache Flink
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.

  2. No painel do Managed Service for Apache Flink, selecione MyApplication.

  3. Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.

Exclua seus fluxos de dados do Kinesis
  1. Abra o console do Kinesis em https://console.aws.amazon.com/kinesis.

  2. No painel Kinesis Data Streams, selecione ExampleInputStream.

  3. Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.

  4. Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.

Excluir objeto e bucket do Amazon S3
  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. Selecione o bucket ka-app-code-<username>.

  3. Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.

Exclua seus recursos do IAM
  1. Abra o console do IAM em https://console.aws.amazon.com/iam/.

  2. Na barra de navegação, selecione Políticas.

  3. No controle do filtro, insira kinesis.

  4. Selecione a política kinesis-analytics-service-MyApplication-us-west-2.

  5. Selecione Ações da política e, em seguida, Excluir.

  6. Na barra de navegação, selecione Roles (Funções).

  7. Selecione a função kinesis-analytics-MyApplication-us-west-2.

  8. Selecione Excluir função e, em seguida, confirme a exclusão.

Exclua seus recursos do CloudWatch
  1. Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, selecione Logs.

  3. Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.

  4. Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.