Anteriormente, o Amazon Managed Service for Apache Flink (Amazon MSF) era conhecido como Amazon Kinesis Data Analytics for Apache Flink.
Informações sobre a versão anterior do Managed Service for Apache Flink
nota
As versões 1.6, 1.8 e 1.11 do Apache Flink não são suportadas pela comunidade Apache Flink há mais de três anos. Nós emitimos um aviso sobre essa alteração em junho de 2024 e outubro de 2024 e agora encerraremos o suporte para essas versões no Amazon Managed Service for Apache Flink.
-
Em 14 de julho de 2025 interromperemos os aplicativos e os colocaremos em um estado READY. Você poderá reiniciar as aplicações nesse momento e continuar a usá-las normalmente, sujeito aos limites de serviço.
-
A partir de 28 de julho de 2025, desativaremos a capacidade de INICIAR seus aplicativos. Você não poderá mais iniciar nem operar os aplicativos do Flink versão 1.6 a partir desse momento.
Recomendamos atualizar imediatamente todos os aplicativos existentes usando o Apache Flink versão 1.6, 1.8 ou 1.11 para o Apache Flink versão 1.20. Essa é a versão mais recente do Flink com suporte. Você pode atualizar seus aplicativos usando o recurso de atualização de versão in-place no Amazon Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.
Em caso de outras dúvidas ou preocupações, entre em contato conosco em AWS Support
nota
A versão 1.13 do Apache Flink não tem suporte da comunidade Apache Flink há mais de três anos. Agora planejamos encerrar o suporte para essa versão no Amazon Managed Service for Apache Flink em 16 de outubro de 2025. Após essa data, você não poderá mais criar, iniciar ou executar aplicativos usando o Apache Flink versão 1.13 no Amazon Managed Service for Apache Flink.
Você pode atualizar seus aplicativos de forma estável usando o recurso de atualizações de versão in-place no Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.
A versão 1.15.2 é suportada pelo Managed Service for Apache Flink, mas não mais pela comunidade Apache Flink.
Este tópico contém as seguintes seções:
Uso do conector Kinesis Streams para o Apache Flink com versões anteriores do Apache Flink
O conector de fluxos Kinesis para o Apache Flink não estava incluído no Apache Flink antes da versão 1.11. Para que seu aplicativo use o conector Kinesis para o Apache Flink com versões anteriores do Apache Flink, você deve baixar, compilar e instalar a versão do Apache Flink que seu aplicativo usa. Esse conector é usado para consumir dados de um Kinesis Stream usado como fonte do aplicativo ou para gravar dados em um Kinesis Stream usado para saída do aplicativo.
nota
Certifique-se de criar o conector com a versão 0.14.0 do KPL
Para baixar e instalar o código-fonte do Apache Flink versão 1.8.2, faça o seguinte:
Certifique-se de ter o Apache Maven
instalado e que sua variável de ambiente JAVA_HOMEaponte para um JDK em vez de um JRE. Você pode testar a instalação do Apache Maven com o seguinte comando:mvn -versionBaixe o código-fonte do Apache Flink versão 1.8.2:
wget https://archive.apache.org/dist/flink/flink-1.8.2/flink-1.8.2-src.tgzDescompacte o código-fonte do Apache Flink:
tar -xvf flink-1.8.2-src.tgzVá para o diretório do código-fonte do Apache Flink:
cd flink-1.8.2Compile e instale o Apache Flink:
mvn clean install -Pinclude-kinesis -DskipTestsnota
Se você estiver compilando o Flink no Microsoft Windows, precisará adicionar o parâmetro
-Drat.skip=true.
Compilação de aplicativos com o Apache Flink 1.8.2
Esta seção contém informações sobre os componentes que você usa para criar aplicativos do Managed Service for Apache Flink que funcionam com o Apache Flink 1.8.2.
Use as seguintes versões de componentes para os aplicativos do Managed Service for Apache Flink:
| Componente | Versão |
|---|---|
| Java | 1.8 (recomendado) |
| Apache Flink | 1.8.2 |
| Runtime for Flink do Managed Service for Apache Flink (aws-kinesisanalytics-runtime) | 1.0.1 |
| Conectores do Managed Service for Apache Flink (aws-kinesisanalytics-flink) | 1.0.1 |
| Apache Maven | 3.1 |
Para compilar um aplicativo usando o Apache Flink 1.8.2, execute o Maven com o seguinte parâmetro:
mvn package -Dflink.version=1.8.2
Para obter um exemplo de arquivo pom.xml para um aplicativo do Managed Service for Apache Flink que usa o Apache Flink versão 1.8.2, consulte Aplicativo de conceitos básicos do Managed Service for Apache Flink 1.8.2
Para obter informações sobre como criar e usar o código de aplicativo para um aplicativo do Managed Service for Apache Flink, consulte. Cria uma aplicação
Compilação de aplicativos com o Apache Flink 1.6.2
Esta seção contém informações sobre os componentes que você usa para criar aplicativos do Managed Service for Apache Flink que funcionam com o Apache Flink 1.6.2.
Use as seguintes versões de componentes para os aplicativos do Managed Service for Apache Flink:
| Componente | Versão |
|---|---|
| Java | 1.8 (recomendado) |
| AWS SDK do Java | 1.11.379 |
| Apache Flink | 1.6.2 |
| Runtime for Flink do Managed Service for Apache Flink (aws-kinesisanalytics-runtime) | 1.0.1 |
| Conectores do Managed Service for Apache Flink (aws-kinesisanalytics-flink) | 1.0.1 |
| Apache Maven | 3.1 |
| Apache Beam | Não é compatível com o Apache Flink 1.6.2. |
nota
Ao usar o Runtime do Managed Service for Apache Flink versão 1.0.1, você especifica a versão do Apache Flink em seu arquivo pom.xml em vez de usar o parâmetro -Dflink.version ao compilar o código do aplicativo.
Para obter um exemplo de arquivo pom.xml para um aplicativo do Managed Service for Apache Flink que usa o Apache Flink versão 1.6.2, consulte Aplicativo de conceitos básicos do Managed Service for Apache Flink 1.6.2
Para obter informações sobre como criar e usar o código de aplicativo para um aplicativo do Managed Service for Apache Flink, consulte. Cria uma aplicação
Atualização de aplicativos
Para atualizar a versão Apache Flink de um aplicativo Amazon Managed Service for Apache Flink, use o recurso de atualização de versão do Apache Flink in-place usando o AWS CLI, AWS SDK, CloudFormation ou o Console de gerenciamento da AWS. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.
Você pode usar esse recurso com qualquer aplicativo existente que você usa com o Amazon Managed Service for Apache Flink no estado READY ou RUNNING.
Conectores disponíveis no Apache Flink 1.6.2 e 1.8.2
A estrutura do Apache Flink contém conectores para acessar dados de várias fontes.
Para obter informações sobre conectores disponíveis na estrutura do Apache Flink 1.6.2, consulte Conectores (1.6.2)
na Documentação do Apache Flink (1.6.2) . Para obter informações sobre conectores disponíveis na estrutura do Apache Flink 1.8.2, consulte Conectores (1.8.2)
na Documentação do Apache Flink (1.8.2) .
Introdução: Flink 1.13.2
Esta seção apresenta os conceitos fundamentais do Managed Service for Apache Flink e da API DataStream. Ela descreve as opções disponíveis para criar e testar seus aplicativos. Ela também fornece instruções para instalar as ferramentas necessárias para concluir os tutoriais deste guia e criar seu primeiro aplicativo.
Tópicos
Componentes de um aplicativo Managed Service for Apache Flink
Para processar dados, seu aplicativo Managed Service for Apache Flink usa um aplicativo Java/Apache Maven ou Scala que processa a entrada e produz a saída usando o runtime do Apache Flink.
O aplicativo do Managed Service for Apache Flink tem os seguintes componentes:
-
Propriedades de runtime: você pode usar as propriedades de runtime para configurar seu aplicativo sem recompilar o código do aplicativo.
-
Fonte: o aplicativo consome dados usando uma fonte. Um conector de origem lê dados de um fluxo de dados do Kinesis, de um bucket do Amazon S3 etc. Para obter mais informações, consulte Adicione fontes de dados de transmissão.
-
Operadores: o aplicativo processa dados usando um ou mais operadores. Um operador pode transformar, enriquecer ou agregar dados. Para obter mais informações, consulte Operadores.
-
Coletor: o aplicativo produz dados para fontes externas usando coletores. Um conector do coletor grava dados em um fluxo de dados do Kinesis, um fluxo do Firehose, um bucket do Amazon S3 etc. Para obter mais informações, consulte Grave dados usando coletores .
Depois de criar, compilar e empacotar o código da aplicativo, é necessário fazer o upload do pacote do código em um bucket do Amazon Simple Storage Service (Amazon S3). Em seguida, crie um aplicativo do Managed Service for Apache Flink. Você passa na localização do pacote de código, um fluxo de dados do Kinesis como fonte de dados de fluxo e, normalmente, um local de fluxo ou arquivo que recebe os dados processados do aplicativo.
Pré-requisitos para concluir os exercícios
Para concluir as etapas neste guia, é necessário ter o seguinte:
-
Java Development Kit (JDK) versão 11
. Defina a variável do ambiente JAVA_HOMEpara apontar para o local de instalação do JDK. -
Recomenda-se o uso de um ambiente de desenvolvimento (como Eclipse Java Neon
ou IntelliJ Idea ) para desenvolver e compilar seu aplicativo. -
Cliente do Git
. Instale o cliente do Git, se isso ainda não foi feito. -
Apache Maven Compiler Plugin
. Maven deve estar em seu caminho de trabalho. Para testar a instalação do Apache Maven, insira o seguinte: $ mvn -version
Para começar a usar, vá até Configure uma conta da AWS e crie um usuário administrador.
Etapa 1: configurar uma conta da AWS e criar um usuário administrador
Inscrever-se para uma Conta da AWS
Se você ainda não tem uma Conta da AWS, siga as etapas abaixo para criar uma.
Como cadastrar uma Conta da AWS
Abra https://portal.aws.amazon.com/billing/signup
. Siga as instruções online.
Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.
Quando você se inscreve para uma Conta da AWS, um Usuário raiz da conta da AWS é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar tarefas que exigem acesso de usuário-raiz.
A AWS envia um e-mail de confirmação depois que o processo de inscrição é concluído. A qualquer momento, é possível exibir as atividades da conta atual e gerenciar sua conta acessando https://aws.amazon.com/
Criar um usuário com acesso administrativo
Depois de se cadastrar em uma Conta da AWS, proteja seu Usuário raiz da conta da AWS, habilite o AWS IAM Identity Center e crie um usuário administrativo para não usar o usuário-raiz em tarefas cotidianas.
Proteger o Usuário raiz da conta da AWS
-
Faça login no Console de gerenciamento da AWS
como o proprietário da conta ao escolher a opção Usuário-raiz e inserir o endereço de e-mail da Conta da AWS. Na próxima página, insira a senha. Para obter ajuda ao fazer login usando o usuário-raiz, consulte Fazer login como usuário-raiz no Guia do usuário do Início de Sessão da AWS.
-
Habilite a autenticação multifator (MFA) para o usuário-raiz.
Para obter instruções, consulte Habilitar um dispositivo MFA virtual para sua Conta da AWS de usuário-raiz (console) no Guia do usuário do IAM.
Criar um usuário com acesso administrativo
-
Habilita o Centro de Identidade do IAM.
Para obter instruções, consulte Habilitar o AWS IAM Identity Center no Guia do usuário do AWS IAM Identity Center.
-
No Centro de Identidade do IAM, conceda o acesso administrativo a um usuário.
Para obter um tutorial sobre como usar o Diretório do Centro de Identidade do IAM como a fonte de identidade, consulte Configurar o acesso dos usuários com o Diretório do Centro de Identidade do IAM padrão no Guia do usuário do AWS IAM Identity Center.
Iniciar sessão como o usuário com acesso administrativo
-
Para fazer login com o seu usuário do Centro de Identidade do IAM, use o URL de login enviado ao seu endereço de e-mail quando o usuário do Centro de Identidade do IAM foi criado.
Para obter ajuda para fazer login usando um usuário do Centro de Identidade do IAM, consulte Fazer login no portal de acesso da AWS, no Guia do usuário do Início de Sessão da AWS.
Atribuir acesso a usuários adicionais
-
No Centro de Identidade do IAM, crie um conjunto de permissões que siga as práticas recomendadas de aplicação de permissões com privilégio mínimo.
Para obter instruções, consulte Criar um conjunto de permissões no Guia do usuário do AWS IAM Identity Center.
-
Atribua usuários a um grupo e, em seguida, atribua o acesso de autenticação única ao grupo.
Para obter instruções, consulte Adicionar grupos no Guia do usuário do AWS IAM Identity Center.
Conceder acesso programático
Os usuários precisam de acesso programático se quiserem interagir com a AWS de fora do Console de gerenciamento da AWS. A forma de conceder acesso programático depende do tipo de usuário que está acessando a AWS.
Para conceder acesso programático aos usuários, selecione uma das seguintes opções:
| Qual usuário precisa de acesso programático? | Para | Por |
|---|---|---|
|
Identidade da força de trabalho (Usuários gerenciados no Centro de Identidade do IAM) |
Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. |
Siga as instruções da interface que deseja utilizar.
|
| IAM | Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. | Siga as instruções em Usar credenciais temporárias com recursos da AWS no Guia do usuário do IAM. |
| IAM | (Não recomendado) Use credenciais de longo prazo para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. |
Siga as instruções da interface que deseja utilizar.
|
Próxima etapa
Configurar a AWS Command Line Interface (AWS CLI)
Próxima etapa
Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)
Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)
Nesta etapa, você baixa e configura a AWS CLI para uso com o Managed Service for Apache Flink.
nota
Os exercícios de conceitos básicos neste guia pressupõem o uso de credenciais de administrador (adminuser) em sua conta para executar as operações.
nota
Se já tiver a AWS CLI instalada, pode ser necessário atualizá-la para obter as funcionalidades mais recentes. Para obter mais informações, consulte Instalar a AWS Command Line Interface no Guia do usuário da AWS Command Line Interface. Para verificar a versão da AWS CLI, execute o seguinte comando:
aws --version
Os exercícios neste tutorial requerem a seguinte versão da AWS CLI ou posterior:
aws-cli/1.16.63
Para configurar a AWS CLI
-
Faça download e configure a AWS CLI. Para obter instruções, consulte os seguintes tópicos no Guia do usuário do AWS Command Line Interface:
-
Adicione um perfil nomeado para o usuário administrador no arquivo AWS CLI
config. É possível usar esse perfil ao executar os comandos da AWS CLI. Para obter mais informações sobre perfis nomeados, consulte Perfis nomeados no Guia do usuário da AWS Command Line Interface.[profile adminuser] aws_access_key_id =adminuser access key IDaws_secret_access_key =adminuser secret access keyregion =aws-regionPara obter uma lista das regiões da AWS disponíveis, consulte Regiões e endpoints no Referência geral da Amazon Web Services.
nota
O código e os comandos de exemplo neste tutorial usam a região Oeste dos EUA (Oregon). Para usar uma região diferente, altere a região no código e nos comandos deste tutorial para a região que você deseja usar.
-
Verifique a configuração digitando o seguinte comando no prompt de comando:
aws help
Depois de configurar uma conta da AWS e a AWS CLI, avance para o próximo exercício para tentar configurar um aplicativo de exemplo e testar toda a configuração.
Próxima etapa
Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink
Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink
Neste exercício, será criado um aplicativo Managed Service for Apache Flink com fluxos de dados como origem e coletor.
Esta seção contém as seguintes etapas:
Criar dois fluxos de dados do Amazon Kinesis
Antes de criar um aplicativo do Managed Service for Apache Flink para este exercício, crie dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream). O aplicativo usa esses fluxos para os fluxos de origem e de destino do aplicativo.
É possível criar esses fluxos usando o console do Amazon Kinesis ou o comando da AWS CLI a seguir. Para obter instruções sobre o console, consulte Criar e atualizar fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams.
Como criar os fluxos de dados (AWS CLI)
-
Para criar o primeiro fluxo (
ExampleInputStream), use o comandocreate-streamAWS CLI do Amazon Kinesis a seguir.$ aws kinesis create-stream \ --stream-name ExampleInputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser -
Para criar o segundo fluxo que o aplicativo usa para gravar a saída, execute o mesmo comando, alterando o nome da transmissão para
ExampleOutputStream.$ aws kinesis create-stream \ --stream-name ExampleOutputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2')) -
Mais adiante neste tutorial, será executado o script
stock.pypara enviar dados para o aplicativo.$ python stock.py
Baixar e examinar o código Java de fluxo do Apache Flink
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
-
Duplique o repositório remoto usando o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git -
Navegue até o diretório
amazon-kinesis-data-analytics-java-examples/GettingStarted.
Observe o seguinte sobre o código do aplicativo:
-
Um arquivo Project Object Model (pom.xml)
contém informações sobre a configuração e as dependências da aplicação, incluindo as bibliotecas do Managed Service for Apache Flink. -
O arquivo
BasicStreamingJob.javacontém o métodomainque define a funcionalidade do aplicativo. -
O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties)); -
Seu aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto
StreamExecutionEnvironment. -
O aplicativo cria conectores de origem e de destino usando propriedades estáticas. Para usar as propriedades dinâmicas do aplicativo, use os métodos
createSourceFromApplicationPropertiesecreateSinkFromApplicationPropertiespara criar os conectores. Esses métodos leem as propriedades do aplicativo para configurar os conectores.Para obter mais informações sobre as propriedades do runtime, consulte Use as propriedades de runtime.
Compilar o código do aplicativo
Nesta seção, será usado o compilador do Apache Maven para criar o código Java para o aplicativo. Para obter informações sobre como instalar o Apache Maven e o Java Development Kit (JDK), consulte Atenda os pré-requisitos para concluir os exercícios.
Para compilar o código do aplicativo
-
Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Há duas formas de compilar e empacotar o código:
-
Use a ferramenta de linha de comando do Maven. Crie seu arquivo JAR executando o seguinte comando no diretório que contém o arquivo
pom.xml:mvn package -Dflink.version=1.13.2 -
Use o ambiente de desenvolvimento. Consulte a documentação de seu ambiente de desenvolvimento para obter mais detalhes.
nota
O código-fonte fornecido depende de bibliotecas do Java 11.
É possível carregar o pacote como um arquivo JAR, ou pode compactar o pacote e carregá-lo como um arquivo ZIP. Se o aplicativo for criado usando a AWS CLI, é necessário especificar o tipo de conteúdo de código (JAR ou ZIP).
-
-
Se houver erros durante a compilação, verifique se sua variável de ambiente
JAVA_HOMEestá definida corretamente.
Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:
target/aws-kinesis-analytics-java-apps-1.0.jar
Upload do código Java de fluxo do Apache Flink
Nesta seção, será criado um bucket do Amazon Simple Storage Service (Amazon S3) e realizado o upload do código do aplicativo.
Para fazer upload do código do aplicativo
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
Selecione Criar bucket.
-
Insira
ka-app-code-no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.<username> -
Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.
-
Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.
-
Selecione Criar bucket.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Selecione Próximo. -
Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.
nota
Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.
Crie e execute o aplicativo (console)
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Descrição, insira
My java test app. -
Em Runtime, selecione Apache Flink.
-
Deixe o menu suspenso de versão como Apache Flink versão 1.13.
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
aws-kinesis-analytics-java-apps-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Insira o seguinte:
ID do grupo Chave Valor ProducerConfigPropertiesflink.inputstream.initposLATESTProducerConfigPropertiesaws.regionus-west-2ProducerConfigPropertiesAggregationEnabledfalse -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Interromper o aplicativo
Na página MyApplication, selecione Interromper. Confirme a ação.
Atualizar o aplicativo
Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo. Também é possível recarregar o JAR do aplicativo do bucket do Amazon S3 se for necessário atualizar o código do aplicativo.
Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.
Criar e executar a aplicação (AWS CLI)
Nesta seção, você usa a AWS CLI para criar e executar o aplicativo Flink do Managed Service for Apache Flink. O Managed Service for Apache Flink usa o comando kinesisanalyticsv2 AWS CLI para criar e interagir com aplicativos Managed Service for Apache Flink.
Criar uma política de permissões
nota
Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.
Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.
Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) (username) pelo ID da conta.012345678901
Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.
nota
Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.
Criar um perfil do IAM
Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.
O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.
Anexe a política de permissões que criou na seção anterior a essa função.
Para criar uma perfil do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
No painel de navegação, selecione Funções e Criar função.
-
Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.
Selecione Next: Permissions (Próximo: permissões).
-
Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.
-
Na página Criar função, insira
MF-stream-rw-rolepara o Nome da função. Selecione Criar função.Foi criado um perfil do IAM chamado
MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função. -
Anexe a política de permissões à função.
nota
Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.
-
Na página Resumo, selecione a guia Permissões.
-
Selecione Attach Policies.
-
Na caixa de pesquisa, insira
AKReadSourceStreamWriteSinkStream(a política criada na seção anterior). -
Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.
-
Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.
Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.
Crie o aplicativo do Managed Service for Apache Flink
-
Salve o seguinte código JSON em um arquivo chamado
create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket () pelo sufixo selecionado na seção anterior. Substitua o ID da conta de exemplo (username) na função de execução do serviço pelo ID da conta.012345678901{ "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "aws-kinesis-analytics-java-apps-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } } -
Execute a ação
CreateApplicationcom a solicitação anterior para criar o aplicativo:aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json
O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.
Iniciar o aplicativo
Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.
Para iniciar o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
start_request.json.{ "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } } -
Execute a ação
StartApplicationcom a solicitação anterior para iniciar o aplicativo:aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json
O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.
Interromper o aplicativo
Nesta seção, a ação StopApplication será usada para interromper o aplicativo.
Como interromper o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
stop_request.json.{ "ApplicationName": "test" } -
Execute a ação
StopApplicationcom a seguinte solicitação para interromper o aplicativo:aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json
O aplicativo agora está interrompido.
Adicionar uma opção de registro em log do CloudWatch
Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.
Atualizar propriedades do ambiente
Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.
Para atualizar propriedades de ambiente para o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
update_properties_request.json.{"ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } } -
Execute a ação
UpdateApplicationcom a solicitação anterior para atualizar as propriedades do ambiente:aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo
Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.
nota
Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.
Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.
O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Criar dois fluxos de dados do Amazon Kinesis.
{ "ApplicationName": "test", "CurrentApplicationVersionId":1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "aws-kinesis-analytics-java-apps-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }
Próxima etapa
Etapa 4: Limpar os recursos do AWS
Etapa 4: Limpar os recursos do AWS
Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. -
No painel do Managed Service for Apache Flink, selecione MyApplication.
-
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel Kinesis Data Streams, selecione ExampleInputStream.
-
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
-
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
Selecione o bucket ka-app-code-
<username>. -
Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Na barra de navegação, selecione Políticas.
-
No controle do filtro, insira kinesis.
-
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
-
Selecione Ações da política e, em seguida, Excluir.
-
Na barra de navegação, selecione Roles (Funções).
-
Selecione a função kinesis-analytics-MyApplication-us-west-2.
-
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. -
No painel de navegação, selecione Logs.
-
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
-
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Próxima etapa
Etapa 5: Próximas etapas
Agora que você criou e executou um aplicativo básico do Managed Service for Apache Flink, consulte os seguintes recursos para obter soluções mais avançadas de Managed Service for Apache Flink.
A solução de dados de transmissão para o Amazon Kinesis da AWS
: A solução de dados de transmissão para o Amazon Kinesis da AWS configura automaticamente os serviços da AWS necessários para capturar, armazenar, processar e entregar dados de transmissão com facilidade. A solução oferece várias opções para resolver casos de uso de dados de transmissão. A opção Managed Service for Apache Flink fornece um exemplo de ETL de transmissão de ponta a ponta que demonstra um aplicativo do mundo real que executa operações analíticas em dados simulados de táxi de Nova York. A solução configura todos os recursos AWS necessários, como políticas e perfis do IAM, um painel do CloudWatch e alarmes do CloudWatch. Solução de transmissão de dados para o Amazon MSK da AWS
: A solução de transmissão de dados para o Amazon MSK da AWS fornece modelos de AWS CloudFormation onde os dados fluem por produtores, armazenamento de transmissão, consumidores e destinos. Clickstream Lab com Apache Flink e Apache Kafka
: um laboratório completo para casos de uso de clickstream usando Amazon Managed Streaming for Apache Kafka para armazenamento de transmissão e aplicativos Managed Service for Apache Flink for Apache Flink para processamento de fluxos. Workshop do Amazon Managed Service for Apache Flink
: neste workshop, você cria uma arquitetura de transmissão de ponta a ponta para ingerir, analisar e visualizar dados de transmissão quase em tempo real. Você decidiu melhorar as operações de uma empresa de táxi na cidade de Nova York. Você analisa os dados de telemetria de uma frota de táxis na cidade de Nova York quase em tempo real para otimizar as operações da frota. Conheça o Flink: treinamento prático
: Treinamento introdutório oficial do Apache Flink que ajuda você a começar a escrever ETL de transmissão escalável, analytics e aplicativos orientados a eventos. nota
Esteja ciente de que o Managed Service for Apache Flink não é compatível com a versão Apache Flink (1.12) usada neste treinamento. É possível usar o Flink 1.15.2 no Flink Managed Service for Apache Flink.
Introdução: Flink 1.11.1 - obsolescência
nota
As versões 1.6, 1.8 e 1.11 do Apache Flink não são suportadas pela comunidade do Apache Flink há mais de três anos. Planejamos descontinuar essas versões no Amazon Managed Service for Apache Flink em 5 de novembro de 2024. A partir dessa data, você não poderá mais criar novos aplicativos para essas versões do Flink. No momento, ainda é possível continuar executando os aplicativos existentes. Você pode atualizar seus aplicativos de forma estável usando o recurso de atualizações de versão in-place no Amazon Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.
Este tópico contém uma versão do Tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink que usa o Apache Flink 1.11.1.
Esta seção apresenta os conceitos fundamentais do Managed Service for Apache Flink e da API DataStream. Ela descreve as opções disponíveis para criar e testar seus aplicativos. Ela também fornece instruções para instalar as ferramentas necessárias para concluir os tutoriais deste guia e criar seu primeiro aplicativo.
Tópicos
Componentes de um aplicativo Managed Service for Apache Flink
Para processar dados, seu aplicativo Managed Service for Apache Flink usa um aplicativo Java/Apache Maven ou Scala que processa a entrada e produz a saída usando o runtime do Apache Flink.
O Managed Service for Apache Flink tem os seguintes componentes:
-
Propriedades de runtime: você pode usar as propriedades de runtime para configurar seu aplicativo sem recompilar o código do aplicativo.
-
Fonte: o aplicativo consome dados usando uma fonte. Um conector de origem lê dados de um fluxo de dados do Kinesis, de um bucket do Amazon S3 etc. Para obter mais informações, consulte Adicione fontes de dados de transmissão.
-
Operadores: o aplicativo processa dados usando um ou mais operadores. Um operador pode transformar, enriquecer ou agregar dados. Para obter mais informações, consulte Operadores.
-
Coletor: o aplicativo produz dados para fontes externas usando coletores. Um conector do coletor grava dados em um fluxo de dados do Kinesis, um fluxo do Firehose, um bucket do Amazon S3 etc. Para obter mais informações, consulte Grave dados usando coletores .
Depois de criar, compilar e empacotar o código da aplicativo, é necessário fazer o upload do pacote do código em um bucket do Amazon Simple Storage Service (Amazon S3). Em seguida, crie um aplicativo do Managed Service for Apache Flink. Você passa na localização do pacote de código, um fluxo de dados do Kinesis como fonte de dados de fluxo e, normalmente, um local de fluxo ou arquivo que recebe os dados processados do aplicativo.
Pré-requisitos para concluir os exercícios
Para concluir as etapas neste guia, é necessário ter o seguinte:
-
Java Development Kit (JDK) versão 11
. Defina a variável do ambiente JAVA_HOMEpara apontar para o local de instalação do JDK. -
Recomenda-se o uso de um ambiente de desenvolvimento (como Eclipse Java Neon
ou IntelliJ Idea ) para desenvolver e compilar seu aplicativo. -
Cliente do Git
. Instale o cliente do Git, se isso ainda não foi feito. -
Apache Maven Compiler Plugin
. Maven deve estar em seu caminho de trabalho. Para testar a instalação do Apache Maven, insira o seguinte: $ mvn -version
Para começar a usar, vá até Configure uma conta da AWS e crie um usuário administrador.
Etapa 1: configurar uma conta da AWS e criar um usuário administrador
Inscrever-se para uma Conta da AWS
Se você ainda não tem uma Conta da AWS, siga as etapas abaixo para criar uma.
Como cadastrar uma Conta da AWS
Abra https://portal.aws.amazon.com/billing/signup
. Siga as instruções online.
Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.
Quando você se inscreve para uma Conta da AWS, um Usuário raiz da conta da AWS é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar tarefas que exigem acesso de usuário-raiz.
A AWS envia um e-mail de confirmação depois que o processo de inscrição é concluído. A qualquer momento, é possível exibir as atividades da conta atual e gerenciar sua conta acessando https://aws.amazon.com/
Criar um usuário com acesso administrativo
Depois de se cadastrar em uma Conta da AWS, proteja seu Usuário raiz da conta da AWS, habilite o AWS IAM Identity Center e crie um usuário administrativo para não usar o usuário-raiz em tarefas cotidianas.
Proteger o Usuário raiz da conta da AWS
-
Faça login no Console de gerenciamento da AWS
como o proprietário da conta ao escolher a opção Usuário-raiz e inserir o endereço de e-mail da Conta da AWS. Na próxima página, insira a senha. Para obter ajuda ao fazer login usando o usuário-raiz, consulte Fazer login como usuário-raiz no Guia do usuário do Início de Sessão da AWS.
-
Habilite a autenticação multifator (MFA) para o usuário-raiz.
Para obter instruções, consulte Habilitar um dispositivo MFA virtual para sua Conta da AWS de usuário-raiz (console) no Guia do usuário do IAM.
Criar um usuário com acesso administrativo
-
Habilita o Centro de Identidade do IAM.
Para obter instruções, consulte Habilitar o AWS IAM Identity Center no Guia do usuário do AWS IAM Identity Center.
-
No Centro de Identidade do IAM, conceda o acesso administrativo a um usuário.
Para obter um tutorial sobre como usar o Diretório do Centro de Identidade do IAM como a fonte de identidade, consulte Configurar o acesso dos usuários com o Diretório do Centro de Identidade do IAM padrão no Guia do usuário do AWS IAM Identity Center.
Iniciar sessão como o usuário com acesso administrativo
-
Para fazer login com o seu usuário do Centro de Identidade do IAM, use o URL de login enviado ao seu endereço de e-mail quando o usuário do Centro de Identidade do IAM foi criado.
Para obter ajuda para fazer login usando um usuário do Centro de Identidade do IAM, consulte Fazer login no portal de acesso da AWS, no Guia do usuário do Início de Sessão da AWS.
Atribuir acesso a usuários adicionais
-
No Centro de Identidade do IAM, crie um conjunto de permissões que siga as práticas recomendadas de aplicação de permissões com privilégio mínimo.
Para obter instruções, consulte Criar um conjunto de permissões no Guia do usuário do AWS IAM Identity Center.
-
Atribua usuários a um grupo e, em seguida, atribua o acesso de autenticação única ao grupo.
Para obter instruções, consulte Adicionar grupos no Guia do usuário do AWS IAM Identity Center.
Conceder acesso programático
Os usuários precisam de acesso programático se quiserem interagir com a AWS de fora do Console de gerenciamento da AWS. A forma de conceder acesso programático depende do tipo de usuário que está acessando a AWS.
Para conceder acesso programático aos usuários, selecione uma das seguintes opções:
| Qual usuário precisa de acesso programático? | Para | Por |
|---|---|---|
|
Identidade da força de trabalho (Usuários gerenciados no Centro de Identidade do IAM) |
Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. |
Siga as instruções da interface que deseja utilizar.
|
| IAM | Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. | Siga as instruções em Usar credenciais temporárias com recursos da AWS no Guia do usuário do IAM. |
| IAM | (Não recomendado) Use credenciais de longo prazo para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. |
Siga as instruções da interface que deseja utilizar.
|
Próxima etapa
Configurar a AWS Command Line Interface (AWS CLI)
Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)
Nesta etapa, você baixa e configura a AWS CLI para uso com o Managed Service for Apache Flink.
nota
Os exercícios de conceitos básicos neste guia pressupõem o uso de credenciais de administrador (adminuser) em sua conta para executar as operações.
nota
Se já tiver a AWS CLI instalada, pode ser necessário atualizá-la para obter as funcionalidades mais recentes. Para obter mais informações, consulte Instalar a AWS Command Line Interface no Guia do usuário da AWS Command Line Interface. Para verificar a versão da AWS CLI, execute o seguinte comando:
aws --version
Os exercícios neste tutorial requerem a seguinte versão da AWS CLI ou posterior:
aws-cli/1.16.63
Para configurar a AWS CLI
-
Faça download e configure a AWS CLI. Para obter instruções, consulte os seguintes tópicos no Guia do usuário do AWS Command Line Interface:
-
Adicione um perfil nomeado para o usuário administrador no arquivo AWS CLI
config. É possível usar esse perfil ao executar os comandos da AWS CLI. Para obter mais informações sobre perfis nomeados, consulte Perfis nomeados no Guia do usuário da AWS Command Line Interface.[profile adminuser] aws_access_key_id =adminuser access key IDaws_secret_access_key =adminuser secret access keyregion =aws-regionPara obter uma lista das regiões da AWS disponíveis, consulte Regiões e endpoints no Referência geral da Amazon Web Services.
nota
O código e os comandos de exemplo neste tutorial usam a região Oeste dos EUA (Oregon). Para usar uma região diferente, altere a região no código e nos comandos deste tutorial para a região que você deseja usar.
-
Verifique a configuração digitando o seguinte comando no prompt de comando:
aws help
Depois de configurar uma conta da AWS e a AWS CLI, avance para o próximo exercício para tentar configurar um aplicativo de exemplo e testar toda a configuração.
Próxima etapa
Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink
Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink
Neste exercício, será criado um aplicativo Managed Service for Apache Flink com fluxos de dados como origem e coletor.
Esta seção contém as seguintes etapas:
Criar dois fluxos de dados do Amazon Kinesis
Antes de criar um aplicativo do Managed Service for Apache Flink para este exercício, crie dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream). O aplicativo usa esses fluxos para os fluxos de origem e de destino do aplicativo.
É possível criar esses fluxos usando o console do Amazon Kinesis ou o comando da AWS CLI a seguir. Para obter instruções sobre o console, consulte Criar e atualizar fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams.
Como criar os fluxos de dados (AWS CLI)
-
Para criar o primeiro fluxo (
ExampleInputStream), use o comandocreate-streamAWS CLI do Amazon Kinesis a seguir.$ aws kinesis create-stream \ --stream-name ExampleInputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser -
Para criar o segundo fluxo que o aplicativo usa para gravar a saída, execute o mesmo comando, alterando o nome da transmissão para
ExampleOutputStream.$ aws kinesis create-stream \ --stream-name ExampleOutputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { "EVENT_TIME": datetime.datetime.now().isoformat(), "TICKER": random.choice(["AAPL", "AMZN", "MSFT", "INTC", "TBV"]), "PRICE": round(random.random() * 100, 2), } def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey" ) if __name__ == "__main__": generate(STREAM_NAME, boto3.client("kinesis")) -
Mais adiante neste tutorial, será executado o script
stock.pypara enviar dados para o aplicativo.$ python stock.py
Baixar e examinar o código Java de fluxo do Apache Flink
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
-
Duplique o repositório remoto usando o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git -
Navegue até o diretório
amazon-kinesis-data-analytics-java-examples/GettingStarted.
Observe o seguinte sobre o código do aplicativo:
-
Um arquivo Project Object Model (pom.xml)
contém informações sobre a configuração e as dependências da aplicação, incluindo as bibliotecas do Managed Service for Apache Flink. -
O arquivo
BasicStreamingJob.javacontém o métodomainque define a funcionalidade do aplicativo. -
O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties)); -
Seu aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto
StreamExecutionEnvironment. -
O aplicativo cria conectores de origem e de destino usando propriedades estáticas. Para usar as propriedades dinâmicas do aplicativo, use os métodos
createSourceFromApplicationPropertiesecreateSinkFromApplicationPropertiespara criar os conectores. Esses métodos leem as propriedades do aplicativo para configurar os conectores.Para obter mais informações sobre as propriedades do runtime, consulte Use as propriedades de runtime.
Compilar o código do aplicativo
Nesta seção, será usado o compilador do Apache Maven para criar o código Java para o aplicativo. Para obter informações sobre como instalar o Apache Maven e o Java Development Kit (JDK), consulte Atenda os pré-requisitos para concluir os exercícios.
Para compilar o código do aplicativo
-
Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Há duas formas de compilar e empacotar o código:
-
Use a ferramenta de linha de comando do Maven. Crie seu arquivo JAR executando o seguinte comando no diretório que contém o arquivo
pom.xml:mvn package -Dflink.version=1.11.3 -
Use o ambiente de desenvolvimento. Consulte a documentação de seu ambiente de desenvolvimento para obter mais detalhes.
nota
O código-fonte fornecido depende de bibliotecas do Java 11. Certifique-se de que a versão Java do seu projeto seja 11.
É possível carregar o pacote como um arquivo JAR, ou pode compactar o pacote e carregá-lo como um arquivo ZIP. Se o aplicativo for criado usando a AWS CLI, é necessário especificar o tipo de conteúdo de código (JAR ou ZIP).
-
-
Se houver erros durante a compilação, verifique se sua variável de ambiente
JAVA_HOMEestá definida corretamente.
Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:
target/aws-kinesis-analytics-java-apps-1.0.jar
Upload do código Java de fluxo do Apache Flink
Nesta seção, será criado um bucket do Amazon Simple Storage Service (Amazon S3) e realizado o upload do código do aplicativo.
Para fazer upload do código do aplicativo
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
Selecione Criar bucket.
-
Insira
ka-app-code-no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.<username> -
Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.
-
Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.
-
Selecione Criar bucket.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Selecione Próximo. -
Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.
nota
Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.
Crie e execute o aplicativo (console)
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Descrição, insira
My java test app. -
Em Runtime, selecione Apache Flink.
-
Deixe o menu suspenso de versão como Apache Flink versão 1.11 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
aws-kinesis-analytics-java-apps-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Propriedades, ID do grupo, insira
ProducerConfigProperties. -
Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor ProducerConfigPropertiesflink.inputstream.initposLATESTProducerConfigPropertiesaws.regionus-west-2ProducerConfigPropertiesAggregationEnabledfalse -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Interromper o aplicativo
Na página MyApplication, selecione Interromper. Confirme a ação.
Atualizar o aplicativo
Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo. Também é possível recarregar o JAR do aplicativo do bucket do Amazon S3 se for necessário atualizar o código do aplicativo.
Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.
Criar e executar a aplicação (AWS CLI)
Nesta seção, você usa o AWS CLI para criar e executar o aplicativo Managed Service for Apache Flink. Um Managed Service for Apache Flink usa o kinesisanalyticsv2 AWS CLI comando para criar e interagir com o Managed Service for Apache Flink.
Criar uma política de permissões
nota
Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.
Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.
Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) (username) pelo ID da conta.012345678901
Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.
nota
Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.
Criar um perfil do IAM
Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.
O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.
Anexe a política de permissões que criou na seção anterior a essa função.
Para criar uma perfil do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
No painel de navegação, selecione Funções e Criar função.
-
Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.
Selecione Next: Permissions (Próximo: permissões).
-
Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.
-
Na página Criar função, insira
MF-stream-rw-rolepara o Nome da função. Selecione Criar função.Foi criado um perfil do IAM chamado
MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função. -
Anexe a política de permissões à função.
nota
Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.
-
Na página Resumo, selecione a guia Permissões.
-
Selecione Attach Policies.
-
Na caixa de pesquisa, insira
AKReadSourceStreamWriteSinkStream(a política criada na seção anterior). -
Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.
-
Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.
Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.
Crie o aplicativo do Managed Service for Apache Flink
-
Salve o seguinte código JSON em um arquivo chamado
create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket () pelo sufixo selecionado na seção anterior. Substitua o ID da conta de exemplo (username) na função de execução do serviço pelo ID da conta.012345678901{ "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_11", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "aws-kinesis-analytics-java-apps-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } } -
Execute a ação
CreateApplicationcom a solicitação anterior para criar o aplicativo:aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json
O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.
Iniciar o aplicativo
Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.
Para iniciar o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
start_request.json.{ "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } } -
Execute a ação
StartApplicationcom a solicitação anterior para iniciar o aplicativo:aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json
O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.
Interromper o aplicativo
Nesta seção, a ação StopApplication será usada para interromper o aplicativo.
Como interromper o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
stop_request.json.{ "ApplicationName": "test" } -
Execute a ação
StopApplicationcom a seguinte solicitação para interromper o aplicativo:aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json
O aplicativo agora está interrompido.
Adicionar uma opção de registro em log do CloudWatch
Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.
Atualizar propriedades do ambiente
Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.
Para atualizar propriedades de ambiente para o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
update_properties_request.json.{"ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } } -
Execute a ação
UpdateApplicationcom a solicitação anterior para atualizar as propriedades do ambiente:aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo
Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.
nota
Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.
Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.
O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Criar dois fluxos de dados do Amazon Kinesis.
{ "ApplicationName": "test", "CurrentApplicationVersionId":1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "aws-kinesis-analytics-java-apps-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }
Próxima etapa
Etapa 4: Limpar os recursos do AWS
Etapa 4: Limpar os recursos do AWS
Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. -
No painel do Managed Service for Apache Flink, selecione MyApplication.
-
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel Kinesis Data Streams, selecione ExampleInputStream.
-
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
-
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
Selecione o bucket ka-app-code-
<username>. -
Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Na barra de navegação, selecione Políticas.
-
No controle do filtro, insira kinesis.
-
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
-
Selecione Ações da política e, em seguida, Excluir.
-
Na barra de navegação, selecione Roles (Funções).
-
Selecione a função kinesis-analytics-MyApplication-us-west-2.
-
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. -
No painel de navegação, selecione Logs.
-
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
-
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Próxima etapa
Etapa 5: Próximas etapas
Agora que você criou e executou um aplicativo básico do Managed Service for Apache Flink, consulte os seguintes recursos para obter soluções mais avançadas de Managed Service for Apache Flink.
A solução de dados de transmissão para o Amazon Kinesis da AWS
: A solução de dados de transmissão para o Amazon Kinesis da AWS configura automaticamente os serviços da AWS necessários para capturar, armazenar, processar e entregar dados de transmissão com facilidade. A solução oferece várias opções para resolver casos de uso de dados de transmissão. A opção Managed Service for Apache Flink fornece um exemplo de ETL de transmissão de ponta a ponta que demonstra um aplicativo do mundo real que executa operações analíticas em dados simulados de táxi de Nova York. A solução configura todos os recursos AWS necessários, como políticas e perfis do IAM, um painel do CloudWatch e alarmes do CloudWatch. Solução de transmissão de dados para o Amazon MSK da AWS
: A solução de transmissão de dados para o Amazon MSK da AWS fornece modelos de AWS CloudFormation onde os dados fluem por produtores, armazenamento de transmissão, consumidores e destinos. Clickstream Lab com Apache Flink e Apache Kafka
: um laboratório completo para casos de uso de clickstream usando Amazon Managed Streaming for Apache Kafka para armazenamento de transmissão e aplicativos Managed Service for Apache Flink for Apache Flink para processamento de fluxos. Workshop do Amazon Managed Service for Apache Flink
: neste workshop, você cria uma arquitetura de transmissão de ponta a ponta para ingerir, analisar e visualizar dados de transmissão quase em tempo real. Você decidiu melhorar as operações de uma empresa de táxi na cidade de Nova York. Você analisa os dados de telemetria de uma frota de táxis na cidade de Nova York quase em tempo real para otimizar as operações da frota. Conheça o Flink: treinamento prático
: Treinamento introdutório oficial do Apache Flink que ajuda você a começar a escrever ETL de transmissão escalável, analytics e aplicativos orientados a eventos. nota
Esteja ciente de que o Managed Service for Apache Flink não é compatível com a versão Apache Flink (1.12) usada neste treinamento. É possível usar o Flink 1.15.2 no Flink Managed Service for Apache Flink.
Exemplos de código do Apache Flink
: um repositório do GitHub com uma grande variedade de exemplos de aplicativos do Apache Flink.
Introdução: Flink 1.8.2 - obsolescência
nota
As versões 1.6, 1.8 e 1.11 do Apache Flink não são suportadas pela comunidade do Apache Flink há mais de três anos. Planejamos descontinuar essas versões no Amazon Managed Service for Apache Flink em 5 de novembro de 2024. A partir dessa data, você não poderá mais criar novos aplicativos para essas versões do Flink. No momento, ainda é possível continuar executando os aplicativos existentes. Você pode atualizar seus aplicativos de forma estável usando o recurso de atualizações de versão in-place no Amazon Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.
Este tópico contém uma versão do Tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink que usa o Apache Flink 1.8.2.
Tópicos
Componentes do aplicativo do Managed Service for Apache Flink
Para processar dados, seu aplicativo Managed Service for Apache Flink usa um aplicativo Java/Apache Maven ou Scala que processa a entrada e produz a saída usando o runtime do Apache Flink.
O Managed Service for Apache Flink tem os seguintes componentes:
-
Propriedades de runtime: você pode usar as propriedades de runtime para configurar seu aplicativo sem recompilar o código do aplicativo.
-
Fonte: o aplicativo consome dados usando uma fonte. Um conector de origem lê dados de um fluxo de dados do Kinesis, de um bucket do Amazon S3 etc. Para obter mais informações, consulte Adicione fontes de dados de transmissão.
-
Operadores: o aplicativo processa dados usando um ou mais operadores. Um operador pode transformar, enriquecer ou agregar dados. Para obter mais informações, consulte Operadores.
-
Coletor: o aplicativo produz dados para fontes externas usando coletores. Um conector do coletor grava dados em um fluxo de dados do Kinesis, um fluxo do Firehose, um bucket do Amazon S3 etc. Para obter mais informações, consulte Grave dados usando coletores .
Depois de criar, compilar e empacotar o código da aplicativo, é necessário fazer o upload do pacote do código em um bucket do Amazon Simple Storage Service (Amazon S3). Em seguida, crie um aplicativo do Managed Service for Apache Flink. Você passa na localização do pacote de código, um fluxo de dados do Kinesis como fonte de dados de fluxo e, normalmente, um local de fluxo ou arquivo que recebe os dados processados do aplicativo.
Pré-requisitos para concluir os exercícios
Para concluir as etapas neste guia, é necessário ter o seguinte:
-
Java Development Kit (JDK) versão 8
. Defina a variável do ambiente JAVA_HOMEpara apontar para o local de instalação do JDK. -
Para usar o conector Apache Flink Kinesis neste tutorial, você deve baixar e instalar o Apache Flink. Para obter detalhes, consulte Uso do conector Kinesis Streams para o Apache Flink com versões anteriores do Apache Flink.
-
Recomenda-se o uso de um ambiente de desenvolvimento (como Eclipse Java Neon
ou IntelliJ Idea ) para desenvolver e compilar seu aplicativo. -
Cliente do Git
. Instale o cliente do Git, se isso ainda não foi feito. -
Apache Maven Compiler Plugin
. Maven deve estar em seu caminho de trabalho. Para testar a instalação do Apache Maven, insira o seguinte: $ mvn -version
Para começar a usar, vá até Etapa 1: configurar uma conta da AWS e criar um usuário administrador.
Etapa 1: configurar uma conta da AWS e criar um usuário administrador
Inscrever-se para uma Conta da AWS
Se você ainda não tem uma Conta da AWS, siga as etapas abaixo para criar uma.
Como cadastrar uma Conta da AWS
Abra https://portal.aws.amazon.com/billing/signup
. Siga as instruções online.
Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.
Quando você se inscreve para uma Conta da AWS, um Usuário raiz da conta da AWS é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar tarefas que exigem acesso de usuário-raiz.
A AWS envia um e-mail de confirmação depois que o processo de inscrição é concluído. A qualquer momento, é possível exibir as atividades da conta atual e gerenciar sua conta acessando https://aws.amazon.com/
Criar um usuário com acesso administrativo
Depois de se cadastrar em uma Conta da AWS, proteja seu Usuário raiz da conta da AWS, habilite o AWS IAM Identity Center e crie um usuário administrativo para não usar o usuário-raiz em tarefas cotidianas.
Proteger o Usuário raiz da conta da AWS
-
Faça login no Console de gerenciamento da AWS
como o proprietário da conta ao escolher a opção Usuário-raiz e inserir o endereço de e-mail da Conta da AWS. Na próxima página, insira a senha. Para obter ajuda ao fazer login usando o usuário-raiz, consulte Fazer login como usuário-raiz no Guia do usuário do Início de Sessão da AWS.
-
Habilite a autenticação multifator (MFA) para o usuário-raiz.
Para obter instruções, consulte Habilitar um dispositivo MFA virtual para sua Conta da AWS de usuário-raiz (console) no Guia do usuário do IAM.
Criar um usuário com acesso administrativo
-
Habilita o Centro de Identidade do IAM.
Para obter instruções, consulte Habilitar o AWS IAM Identity Center no Guia do usuário do AWS IAM Identity Center.
-
No Centro de Identidade do IAM, conceda o acesso administrativo a um usuário.
Para obter um tutorial sobre como usar o Diretório do Centro de Identidade do IAM como a fonte de identidade, consulte Configurar o acesso dos usuários com o Diretório do Centro de Identidade do IAM padrão no Guia do usuário do AWS IAM Identity Center.
Iniciar sessão como o usuário com acesso administrativo
-
Para fazer login com o seu usuário do Centro de Identidade do IAM, use o URL de login enviado ao seu endereço de e-mail quando o usuário do Centro de Identidade do IAM foi criado.
Para obter ajuda para fazer login usando um usuário do Centro de Identidade do IAM, consulte Fazer login no portal de acesso da AWS, no Guia do usuário do Início de Sessão da AWS.
Atribuir acesso a usuários adicionais
-
No Centro de Identidade do IAM, crie um conjunto de permissões que siga as práticas recomendadas de aplicação de permissões com privilégio mínimo.
Para obter instruções, consulte Criar um conjunto de permissões no Guia do usuário do AWS IAM Identity Center.
-
Atribua usuários a um grupo e, em seguida, atribua o acesso de autenticação única ao grupo.
Para obter instruções, consulte Adicionar grupos no Guia do usuário do AWS IAM Identity Center.
Conceder acesso programático
Os usuários precisam de acesso programático se quiserem interagir com a AWS de fora do Console de gerenciamento da AWS. A forma de conceder acesso programático depende do tipo de usuário que está acessando a AWS.
Para conceder acesso programático aos usuários, selecione uma das seguintes opções:
| Qual usuário precisa de acesso programático? | Para | Por |
|---|---|---|
|
Identidade da força de trabalho (Usuários gerenciados no Centro de Identidade do IAM) |
Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. |
Siga as instruções da interface que deseja utilizar.
|
| IAM | Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. | Siga as instruções em Usar credenciais temporárias com recursos da AWS no Guia do usuário do IAM. |
| IAM | (Não recomendado) Use credenciais de longo prazo para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. |
Siga as instruções da interface que deseja utilizar.
|
Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)
Nesta etapa, você baixa e configura a AWS CLI para uso com o Managed Service for Apache Flink.
nota
Os exercícios de conceitos básicos neste guia pressupõem o uso de credenciais de administrador (adminuser) em sua conta para executar as operações.
nota
Se já tiver a AWS CLI instalada, pode ser necessário atualizá-la para obter as funcionalidades mais recentes. Para obter mais informações, consulte Instalar a AWS Command Line Interface no Guia do usuário da AWS Command Line Interface. Para verificar a versão da AWS CLI, execute o seguinte comando:
aws --version
Os exercícios neste tutorial requerem a seguinte versão da AWS CLI ou posterior:
aws-cli/1.16.63
Para configurar a AWS CLI
-
Faça download e configure a AWS CLI. Para obter instruções, consulte os seguintes tópicos no Guia do usuário do AWS Command Line Interface:
-
Adicione um perfil nomeado para o usuário administrador no arquivo AWS CLI
config. É possível usar esse perfil ao executar os comandos da AWS CLI. Para obter mais informações sobre perfis nomeados, consulte Perfis nomeados no Guia do usuário da AWS Command Line Interface.[profile adminuser] aws_access_key_id =adminuser access key IDaws_secret_access_key =adminuser secret access keyregion =aws-regionPara obter uma lista das regiões disponíveis, consulte Regiões e endpoints no Referência geral da Amazon Web Services.
nota
O código e os comandos de exemplo neste tutorial usam a região Oeste dos EUA (Oregon). Para usar uma região AWS diferente, altere a região no código e nos comandos deste tutorial para a região que você deseja usar.
-
Verifique a configuração digitando o seguinte comando no prompt de comando:
aws help
Depois de configurar uma conta da AWS e a AWS CLI, avance para o próximo exercício para tentar configurar um aplicativo de exemplo e testar toda a configuração.
Próxima etapa
Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink
Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink
Neste exercício, será criado um aplicativo Managed Service for Apache Flink com fluxos de dados como origem e coletor.
Esta seção contém as seguintes etapas:
Criar dois fluxos de dados do Amazon Kinesis
Antes de criar um aplicativo do Managed Service for Apache Flink para este exercício, crie dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream). O aplicativo usa esses fluxos para os fluxos de origem e de destino do aplicativo.
É possível criar esses fluxos usando o console do Amazon Kinesis ou o comando da AWS CLI a seguir. Para obter instruções sobre o console, consulte Criar e atualizar fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams.
Como criar os fluxos de dados (AWS CLI)
-
Para criar o primeiro fluxo (
ExampleInputStream), use o comandocreate-streamAWS CLI do Amazon Kinesis a seguir.$ aws kinesis create-stream \ --stream-name ExampleInputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser -
Para criar o segundo fluxo que o aplicativo usa para gravar a saída, execute o mesmo comando, alterando o nome da transmissão para
ExampleOutputStream.$ aws kinesis create-stream \ --stream-name ExampleOutputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { "EVENT_TIME": datetime.datetime.now().isoformat(), "TICKER": random.choice(["AAPL", "AMZN", "MSFT", "INTC", "TBV"]), "PRICE": round(random.random() * 100, 2), } def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey" ) if __name__ == "__main__": generate(STREAM_NAME, boto3.client("kinesis")) -
Mais adiante neste tutorial, será executado o script
stock.pypara enviar dados para o aplicativo.$ python stock.py
Baixar e examinar o código Java de fluxo do Apache Flink
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
-
Duplique o repositório remoto usando o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git -
Navegue até o diretório
amazon-kinesis-data-analytics-java-examples/GettingStarted_1_8.
Observe o seguinte sobre o código do aplicativo:
-
Um arquivo Project Object Model (pom.xml)
contém informações sobre a configuração e as dependências da aplicação, incluindo as bibliotecas do Managed Service for Apache Flink. -
O arquivo
BasicStreamingJob.javacontém o métodomainque define a funcionalidade do aplicativo. -
O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties)); -
Seu aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto
StreamExecutionEnvironment. -
O aplicativo cria conectores de origem e de destino usando propriedades estáticas. Para usar as propriedades dinâmicas do aplicativo, use os métodos
createSourceFromApplicationPropertiesecreateSinkFromApplicationPropertiespara criar os conectores. Esses métodos leem as propriedades do aplicativo para configurar os conectores.Para obter mais informações sobre as propriedades do runtime, consulte Use as propriedades de runtime.
Compilar o código do aplicativo
Nesta seção, será usado o compilador do Apache Maven para criar o código Java para o aplicativo. Para obter informações sobre como instalar o Apache Maven e o Java Development Kit (JDK), consulte Pré-requisitos para concluir os exercícios.
nota
Para usar o conector Kinesis com versões do Apache Flink anteriores à 1.11, você precisa baixar, compilar e instalar o Apache Maven. Para obter mais informações, consulte Uso do conector Kinesis Streams para o Apache Flink com versões anteriores do Apache Flink.
Para compilar o código do aplicativo
-
Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Há duas formas de compilar e empacotar o código:
-
Use a ferramenta de linha de comando do Maven. Crie seu arquivo JAR executando o seguinte comando no diretório que contém o arquivo
pom.xml:mvn package -Dflink.version=1.8.2 -
Use o ambiente de desenvolvimento. Consulte a documentação de seu ambiente de desenvolvimento para obter mais detalhes.
nota
O código-fonte fornecido depende de bibliotecas do Java 1.8. Certifique-se de que a versão Java do seu projeto seja 1.8.
É possível carregar o pacote como um arquivo JAR, ou pode compactar o pacote e carregá-lo como um arquivo ZIP. Se o aplicativo for criado usando a AWS CLI, é necessário especificar o tipo de conteúdo de código (JAR ou ZIP).
-
-
Se houver erros durante a compilação, verifique se sua variável de ambiente
JAVA_HOMEestá definida corretamente.
Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:
target/aws-kinesis-analytics-java-apps-1.0.jar
Upload do código Java de fluxo do Apache Flink
Nesta seção, será criado um bucket do Amazon Simple Storage Service (Amazon S3) e realizado o upload do código do aplicativo.
Para fazer upload do código do aplicativo
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
Selecione Criar bucket.
-
Insira
ka-app-code-no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.<username> -
Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.
-
Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.
-
Selecione Criar bucket.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Selecione Próximo. -
Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.
nota
Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.
Crie e execute o aplicativo (console)
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Descrição, insira
My java test app. -
Em Runtime, selecione Apache Flink.
-
Deixe o menu suspenso da versão como Apache Flink 1.8 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
aws-kinesis-analytics-java-apps-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor ProducerConfigPropertiesflink.inputstream.initposLATESTProducerConfigPropertiesaws.regionus-west-2ProducerConfigPropertiesAggregationEnabledfalse -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Execute o aplicativo
-
Na página MyApplication, selecione Executar. Confirme a ação.
-
Quando o aplicativo estiver em execução, atualize a página. O console mostra o Gráfico do aplicativo.
Interromper o aplicativo
Na página MyApplication, selecione Interromper. Confirme a ação.
Atualizar o aplicativo
Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo. Também é possível recarregar o JAR do aplicativo do bucket do Amazon S3 se for necessário atualizar o código do aplicativo.
Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.
Criar e executar a aplicação (AWS CLI)
Nesta seção, você usa a AWS CLI para criar e executar o aplicativo Flink do Managed Service for Apache Flink. O Managed Service for Apache Flink usa o comando kinesisanalyticsv2 AWS CLI para criar e interagir com aplicativos Managed Service for Apache Flink.
Criar uma política de permissões
nota
Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.
Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.
Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) (username) pelo ID da conta.012345678901
Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.
nota
Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.
Criar um perfil do IAM
Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.
O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.
Anexe a política de permissões que criou na seção anterior a essa função.
Para criar uma perfil do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
No painel de navegação, selecione Funções e Criar função.
-
Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.
Selecione Next: Permissions (Próximo: permissões).
-
Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.
-
Na página Criar função, insira
MF-stream-rw-rolepara o Nome da função. Selecione Criar função.Foi criado um perfil do IAM chamado
MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função. -
Anexe a política de permissões à função.
nota
Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.
-
Na página Resumo, selecione a guia Permissões.
-
Selecione Attach Policies.
-
Na caixa de pesquisa, insira
AKReadSourceStreamWriteSinkStream(a política criada na seção anterior). -
Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.
-
Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.
Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.
Crie o aplicativo do Managed Service for Apache Flink
-
Salve o seguinte código JSON em um arquivo chamado
create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket () pelo sufixo selecionado na seção anterior. Substitua o ID da conta de exemplo (username) na função de execução do serviço pelo ID da conta.012345678901{ "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_8", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "aws-kinesis-analytics-java-apps-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } } -
Execute a ação
CreateApplicationcom a solicitação anterior para criar o aplicativo:aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json
O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.
Iniciar o aplicativo
Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.
Para iniciar o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
start_request.json.{ "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } } -
Execute a ação
StartApplicationcom a solicitação anterior para iniciar o aplicativo:aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json
O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.
Interromper o aplicativo
Nesta seção, a ação StopApplication será usada para interromper o aplicativo.
Como interromper o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
stop_request.json.{ "ApplicationName": "test" } -
Execute a ação
StopApplicationcom a seguinte solicitação para interromper o aplicativo:aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json
O aplicativo agora está interrompido.
Adicionar uma opção de registro em log do CloudWatch
Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.
Atualizar propriedades do ambiente
Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.
Para atualizar propriedades de ambiente para o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
update_properties_request.json.{"ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } } -
Execute a ação
UpdateApplicationcom a solicitação anterior para atualizar as propriedades do ambiente:aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo
Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.
nota
Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.
Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.
O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Criar dois fluxos de dados do Amazon Kinesis.
{ "ApplicationName": "test", "CurrentApplicationVersionId":1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "aws-kinesis-analytics-java-apps-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }
Próxima etapa
Etapa 4: Limpar os recursos do AWS
Etapa 4: Limpar os recursos do AWS
Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. -
No painel do Managed Service for Apache Flink, selecione MyApplication.
-
Selecione Configurar.
-
Na seção Snapshots, selecione Desativar e, em seguida, selecione Atualizar.
-
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel Kinesis Data Streams, selecione ExampleInputStream.
-
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
-
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
Selecione o bucket ka-app-code-
<username>. -
Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Na barra de navegação, selecione Políticas.
-
No controle do filtro, insira kinesis.
-
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
-
Selecione Ações da política e, em seguida, Excluir.
-
Na barra de navegação, selecione Roles (Funções).
-
Selecione a função kinesis-analytics-MyApplication-us-west-2.
-
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. -
No painel de navegação, selecione Logs.
-
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
-
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Introdução: Flink 1.6.2 - obsolescência
nota
As versões 1.6, 1.8 e 1.11 do Apache Flink não são suportadas pela comunidade do Apache Flink há mais de três anos. Planejamos descontinuar essas versões no Amazon Managed Service for Apache Flink em 5 de novembro de 2024. A partir dessa data, você não poderá mais criar novos aplicativos para essas versões do Flink. No momento, ainda é possível continuar executando os aplicativos existentes. Você pode atualizar seus aplicativos de forma estável usando o recurso de atualizações de versão in-place no Amazon Managed Service for Apache Flink. Para obter mais informações, consulte Use atualizações de versão in-place para o Apache Flink.
Este tópico contém uma versão do Tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink que usa o Apache Flink 1.6.2.
Tópicos
Componentes de um aplicativo Managed Service for Apache Flink
Para processar dados, seu aplicativo Managed Service for Apache Flink usa um aplicativo Java/Apache Maven ou Scala que processa a entrada e produz a saída usando o runtime do Apache Flink.
um Managed Service for Apache Flink tem os seguintes componentes:
-
Propriedades de runtime: você pode usar as propriedades de runtime para configurar seu aplicativo sem recompilar o código do aplicativo.
-
Fonte: o aplicativo consome dados usando uma fonte. Um conector de origem lê dados de um fluxo de dados do Kinesis, de um bucket do Amazon S3 etc. Para obter mais informações, consulte Adicione fontes de dados de transmissão.
-
Operadores: o aplicativo processa dados usando um ou mais operadores. Um operador pode transformar, enriquecer ou agregar dados. Para obter mais informações, consulte Operadores.
-
Coletor: o aplicativo produz dados para fontes externas usando coletores. Um conector do coletor grava dados em um fluxo de dados do Kinesis, um fluxo do Firehose, um bucket do Amazon S3 etc. Para obter mais informações, consulte Grave dados usando coletores .
Depois de criar, compilar e empacotar o seu aplicativo, é necessário fazer o upload do pacote do código em um bucket do Amazon Simple Storage Service (Amazon S3). Em seguida, crie um aplicativo do Managed Service for Apache Flink. Você passa na localização do pacote de código, um fluxo de dados do Kinesis como fonte de dados de fluxo e, normalmente, um local de fluxo ou arquivo que recebe os dados processados do aplicativo.
Pré-requisitos para concluir os exercícios
Para concluir as etapas neste guia, é necessário ter o seguinte:
-
Java Development Kit
(JDK) versão 8. Defina a variável do ambiente JAVA_HOMEpara apontar para o local de instalação do JDK. -
Recomenda-se o uso de um ambiente de desenvolvimento (como Eclipse Java Neon
ou IntelliJ Idea ) para desenvolver e compilar seu aplicativo. -
Cliente do Git.
Instale o cliente do Git, se isso ainda não foi feito. -
Apache Maven Compiler Plugin
. Maven deve estar em seu caminho de trabalho. Para testar a instalação do Apache Maven, insira o seguinte: $ mvn -version
Para começar a usar, vá até Etapa 1: configurar uma conta da AWS e criar um usuário administrador.
Etapa 1: configurar uma conta da AWS e criar um usuário administrador
Inscrever-se para uma Conta da AWS
Se você ainda não tem uma Conta da AWS, siga as etapas abaixo para criar uma.
Como cadastrar uma Conta da AWS
Abra https://portal.aws.amazon.com/billing/signup
. Siga as instruções online.
Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.
Quando você se inscreve para uma Conta da AWS, um Usuário raiz da conta da AWS é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar tarefas que exigem acesso de usuário-raiz.
A AWS envia um e-mail de confirmação depois que o processo de inscrição é concluído. A qualquer momento, é possível exibir as atividades da conta atual e gerenciar sua conta acessando https://aws.amazon.com/
Criar um usuário com acesso administrativo
Depois de se cadastrar em uma Conta da AWS, proteja seu Usuário raiz da conta da AWS, habilite o AWS IAM Identity Center e crie um usuário administrativo para não usar o usuário-raiz em tarefas cotidianas.
Proteger o Usuário raiz da conta da AWS
-
Faça login no Console de gerenciamento da AWS
como o proprietário da conta ao escolher a opção Usuário-raiz e inserir o endereço de e-mail da Conta da AWS. Na próxima página, insira a senha. Para obter ajuda ao fazer login usando o usuário-raiz, consulte Fazer login como usuário-raiz no Guia do usuário do Início de Sessão da AWS.
-
Habilite a autenticação multifator (MFA) para o usuário-raiz.
Para obter instruções, consulte Habilitar um dispositivo MFA virtual para sua Conta da AWS de usuário-raiz (console) no Guia do usuário do IAM.
Criar um usuário com acesso administrativo
-
Habilita o Centro de Identidade do IAM.
Para obter instruções, consulte Habilitar o AWS IAM Identity Center no Guia do usuário do AWS IAM Identity Center.
-
No Centro de Identidade do IAM, conceda o acesso administrativo a um usuário.
Para obter um tutorial sobre como usar o Diretório do Centro de Identidade do IAM como a fonte de identidade, consulte Configurar o acesso dos usuários com o Diretório do Centro de Identidade do IAM padrão no Guia do usuário do AWS IAM Identity Center.
Iniciar sessão como o usuário com acesso administrativo
-
Para fazer login com o seu usuário do Centro de Identidade do IAM, use o URL de login enviado ao seu endereço de e-mail quando o usuário do Centro de Identidade do IAM foi criado.
Para obter ajuda para fazer login usando um usuário do Centro de Identidade do IAM, consulte Fazer login no portal de acesso da AWS, no Guia do usuário do Início de Sessão da AWS.
Atribuir acesso a usuários adicionais
-
No Centro de Identidade do IAM, crie um conjunto de permissões que siga as práticas recomendadas de aplicação de permissões com privilégio mínimo.
Para obter instruções, consulte Criar um conjunto de permissões no Guia do usuário do AWS IAM Identity Center.
-
Atribua usuários a um grupo e, em seguida, atribua o acesso de autenticação única ao grupo.
Para obter instruções, consulte Adicionar grupos no Guia do usuário do AWS IAM Identity Center.
Conceder acesso programático
Os usuários precisam de acesso programático se quiserem interagir com a AWS de fora do Console de gerenciamento da AWS. A forma de conceder acesso programático depende do tipo de usuário que está acessando a AWS.
Para conceder acesso programático aos usuários, selecione uma das seguintes opções:
| Qual usuário precisa de acesso programático? | Para | Por |
|---|---|---|
|
Identidade da força de trabalho (Usuários gerenciados no Centro de Identidade do IAM) |
Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. |
Siga as instruções da interface que deseja utilizar.
|
| IAM | Use credenciais temporárias para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. | Siga as instruções em Usar credenciais temporárias com recursos da AWS no Guia do usuário do IAM. |
| IAM | (Não recomendado) Use credenciais de longo prazo para assinar solicitações programáticas para a AWS CLI, os SDKs da AWS ou as APIs da AWS. |
Siga as instruções da interface que deseja utilizar.
|
Etapa 2: Configurar a AWS Command Line Interface (AWS CLI)
Nesta etapa, você baixa e configura a AWS CLI para uso com um Managed Service for Apache Flink.
nota
Os exercícios de conceitos básicos neste guia pressupõem o uso de credenciais de administrador (adminuser) em sua conta para executar as operações.
nota
Se já tiver a AWS CLI instalada, pode ser necessário atualizá-la para obter as funcionalidades mais recentes. Para obter mais informações, consulte Instalar a AWS Command Line Interface no Guia do usuário da AWS Command Line Interface. Para verificar a versão da AWS CLI, execute o seguinte comando:
aws --version
Os exercícios neste tutorial requerem a seguinte versão da AWS CLI ou posterior:
aws-cli/1.16.63
Para configurar a AWS CLI
-
Faça download e configure a AWS CLI. Para obter instruções, consulte os seguintes tópicos no Guia do usuário do AWS Command Line Interface:
-
Adicione um perfil nomeado para o usuário administrador no arquivo AWS CLI
config. É possível usar esse perfil ao executar os comandos da AWS CLI. Para obter mais informações sobre perfis nomeados, consulte Perfis nomeados no Guia do usuário da AWS Command Line Interface.[profile adminuser] aws_access_key_id =adminuser access key IDaws_secret_access_key =adminuser secret access keyregion =aws-regionPara obter uma lista das regiões da AWS disponíveis, consulte Regiões e endpoints no Referência geral da Amazon Web Services.
nota
O código e os comandos de exemplo neste tutorial usam a região Oeste dos EUA (Oregon). Para usar uma região diferente, altere a região no código e nos comandos deste tutorial para a região que você deseja usar.
-
Verifique a configuração digitando o seguinte comando no prompt de comando:
aws help
Depois de configurar uma conta da AWS e a AWS CLI, avance para o próximo exercício para tentar configurar um aplicativo de exemplo e testar toda a configuração.
Próxima etapa
Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink
Etapa 3: criar e executar um aplicativo Managed Service for Apache Flink
Neste exercício, será criado um aplicativo Managed Service for Apache Flink com fluxos de dados como origem e coletor.
Esta seção contém as seguintes etapas:
Criar dois fluxos de dados do Amazon Kinesis
Antes de criar um aplicativo do Managed Service for Apache Flink para este exercício, crie dois fluxos de dados do Kinesis (ExampleInputStream e ExampleOutputStream). O aplicativo usa esses fluxos para os fluxos de origem e de destino do aplicativo.
É possível criar esses fluxos usando o console do Amazon Kinesis ou o comando da AWS CLI a seguir. Para obter instruções sobre o console, consulte Criar e atualizar fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams.
Como criar os fluxos de dados (AWS CLI)
-
Para criar o primeiro fluxo (
ExampleInputStream), use o comandocreate-streamAWS CLI do Amazon Kinesis a seguir.$ aws kinesis create-stream \ --stream-name ExampleInputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser -
Para criar o segundo fluxo que o aplicativo usa para gravar a saída, execute o mesmo comando, alterando o nome da transmissão para
ExampleOutputStream.$ aws kinesis create-stream \ --stream-name ExampleOutputStream \ --shard-count 1 \ --region us-west-2 \ --profile adminuser
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { "EVENT_TIME": datetime.datetime.now().isoformat(), "TICKER": random.choice(["AAPL", "AMZN", "MSFT", "INTC", "TBV"]), "PRICE": round(random.random() * 100, 2), } def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey" ) if __name__ == "__main__": generate(STREAM_NAME, boto3.client("kinesis")) -
Mais adiante neste tutorial, será executado o script
stock.pypara enviar dados para o aplicativo.$ python stock.py
Baixar e examinar o código Java de fluxo do Apache Flink
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Duplique o repositório remoto usando o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/GettingStarted_1_6.
Observe o seguinte sobre o código do aplicativo:
Um arquivo Project Object Model (pom.xml)
contém informações sobre a configuração e as dependências do aplicativo, incluindo as bibliotecas do Managed Service for Apache Flink. O arquivo
BasicStreamingJob.javacontém o métodomainque define a funcionalidade do aplicativo.O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));Seu aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto
StreamExecutionEnvironment.O aplicativo cria conectores de origem e de destino usando propriedades estáticas. Para usar as propriedades dinâmicas do aplicativo, use os métodos
createSourceFromApplicationPropertiesecreateSinkFromApplicationPropertiespara criar os conectores. Esses métodos leem as propriedades do aplicativo para configurar os conectores.Para obter mais informações sobre as propriedades do runtime, consulte Use as propriedades de runtime.
Compilar o código do aplicativo
Nesta seção, será usado o compilador do Apache Maven para criar o código Java para o aplicativo. Para obter informações sobre como instalar o Apache Maven e o Java Development Kit (JDK), consulte Pré-requisitos para concluir os exercícios.
nota
Para usar o conector do Kinesis com versões do Apache Flink anteriores a 1.11, você precisa baixar o código-fonte do conector e compilá-lo conforme descrito na documentação do Apache Flink
Para compilar o código do aplicativo
-
Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Há duas formas de compilar e empacotar o código:
Use a ferramenta de linha de comando do Maven. Crie seu arquivo JAR executando o seguinte comando no diretório que contém o arquivo
pom.xml:mvn packagenota
O parâmetro -Dflink.version não é necessário para o runtime do Managed Service for Apache Flink versão 1.0.1; ele só é necessário para a versão 1.1.0 e posterior. Para obter mais informações, consulte Especifique a versão do Apache Flink do seu aplicativo.
Use o ambiente de desenvolvimento. Consulte a documentação de seu ambiente de desenvolvimento para obter mais detalhes.
É possível carregar o pacote como um arquivo JAR, ou pode compactar o pacote e carregá-lo como um arquivo ZIP. Se o aplicativo for criado usando a AWS CLI, é necessário especificar o tipo de conteúdo de código (JAR ou ZIP).
-
Se houver erros durante a compilação, verifique se sua variável de ambiente
JAVA_HOMEestá definida corretamente.
Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:
target/aws-kinesis-analytics-java-apps-1.0.jar
Upload do código Java de fluxo do Apache Flink
Nesta seção, será criado um bucket do Amazon Simple Storage Service (Amazon S3) e realizado o upload do código do aplicativo.
Para fazer upload do código do aplicativo
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
Selecione Criar bucket.
-
Insira
ka-app-code-no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.<username> -
Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.
-
Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.
-
Selecione Criar bucket.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Selecione Próximo. -
Na etapa Definir permissões, mantenha as configurações como estão. Selecione Próximo.
-
Na etapa Definir propriedades, mantenha as configurações como estão. Escolha Carregar.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.
nota
Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.
Crie e execute o aplicativo (console)
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Descrição, insira
My java test app. -
Em Runtime, selecione Apache Flink.
nota
O Managed Service for Apache Flink usa o Apache Flink versão 1.8.2 ou 1.6.2.
Altere o pulldown da versão para Apache Flink 1.6.
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
java-getting-started-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor ProducerConfigPropertiesflink.inputstream.initposLATESTProducerConfigPropertiesaws.regionus-west-2ProducerConfigPropertiesAggregationEnabledfalse -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Execute o aplicativo
-
Na página MyApplication, selecione Executar. Confirme a ação.
-
Quando o aplicativo estiver em execução, atualize a página. O console mostra o Gráfico do aplicativo.
Interromper o aplicativo
Na página MyApplication, selecione Interromper. Confirme a ação.
Atualizar o aplicativo
Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo. Também é possível recarregar o JAR do aplicativo do bucket do Amazon S3 se for necessário atualizar o código do aplicativo.
Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.
Criar e executar a aplicação (AWS CLI)
Nesta seção, você usa a AWS CLI para criar e executar o aplicativo Flink do Managed Service for Apache Flink. O Managed Service for Apache Flink usa o comando kinesisanalyticsv2 AWS CLI para criar e interagir com aplicativos Managed Service for Apache Flink.
Criar uma política de permissões
Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.
Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) (username) pelo ID da conta.012345678901
Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.
nota
Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.
Criar um perfil do IAM
Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.
O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.
Anexe a política de permissões que criou na seção anterior a essa função.
Para criar uma perfil do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
No painel de navegação, selecione Funções e Criar função.
-
Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.
Selecione Next: Permissions (Próximo: permissões).
-
Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.
-
Na página Criar função, insira
MF-stream-rw-rolepara o Nome da função. Selecione Criar função.Foi criado um perfil do IAM chamado
MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função. -
Anexe a política de permissões à função.
nota
Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.
-
Na página Resumo, selecione a guia Permissões.
-
Selecione Attach Policies.
-
Na caixa de pesquisa, insira
AKReadSourceStreamWriteSinkStream(a política criada na seção anterior). -
Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.
-
Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.
Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.
Crie o aplicativo do Managed Service for Apache Flink
-
Salve o seguinte código JSON em um arquivo chamado
create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket () pelo sufixo selecionado na seção anterior. Substitua o ID da conta de exemplo (username) na função de execução do serviço pelo ID da conta.012345678901{ "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_6", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "java-getting-started-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } } -
Execute a ação
CreateApplicationcom a solicitação anterior para criar o aplicativo:aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json
O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.
Iniciar o aplicativo
Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.
Para iniciar o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
start_request.json.{ "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } } -
Execute a ação
StartApplicationcom a solicitação anterior para iniciar o aplicativo:aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json
O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.
Interromper o aplicativo
Nesta seção, a ação StopApplication será usada para interromper o aplicativo.
Como interromper o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
stop_request.json.{ "ApplicationName": "test" } -
Execute a ação
StopApplicationcom a seguinte solicitação para interromper o aplicativo:aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json
O aplicativo agora está interrompido.
Adicionar uma opção de registro em log do CloudWatch
Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.
Atualizar propriedades do ambiente
Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.
Para atualizar propriedades de ambiente para o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
update_properties_request.json.{"ApplicationName": "test", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "flink.stream.initpos" : "LATEST", "aws.region" : "us-west-2", "AggregationEnabled" : "false" } }, { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2" } } ] } } } -
Execute a ação
UpdateApplicationcom a solicitação anterior para atualizar as propriedades do ambiente:aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo
Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.
Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3. O aplicativo será reiniciado com o novo pacote de código.
O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Criar dois fluxos de dados do Amazon Kinesis.
{ "ApplicationName": "test", "CurrentApplicationVersionId":1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "java-getting-started-1.0.jar" } } } } }
Etapa 4: Limpar os recursos do AWS
Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel do Managed Service for Apache Flink, selecione MyApplication.
Selecione Configurar.
Na seção Snapshots, selecione Desativar e, em seguida, selecione Atualizar.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplos de versões anteriores (legadas) do Managed Service for Apache Flink
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
Esta seção apresenta exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink. Eles incluem código de exemplo e instruções passo a passo para ajudar você a criar aplicativos do Managed Service for Apache Flink e testar seus resultados.
Antes de explorar esses exemplos, recomendamos que você analise em primeiro lugar o seguinte :
nota
Esses exemplos pressupõem que você esteja usando a região Oeste dos EUA (Oregon) (us-west-2). Se você estiver usando uma região diferente, atualize o código, os comandos e o perfil do IAM do aplicativo de forma adequada.
Exemplos de API DataStream
Os exemplos a seguir demonstram como criar aplicativos usando a API DataStream do Apache Flink.
Tópicos
Exemplo: janela em cascata
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
Neste exercício, você cria um aplicativo Managed Service for Apache Flink que agrega dados usando uma janela em cascata. A agregação está habilitada por padrão no Flink. Para desativá-la, use o seguinte:
sink.producer.aggregation-enabled' = 'false'
nota
Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Este tópico contém as seguintes seções:
Crie recursos dependentes
Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:
Dois fluxos de dados do Kinesis (
ExampleInputStreameExampleOutputStream)Um bucket do Amazon S3 para armazenar o código do aplicativo (
ka-app-code-)<username>
Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:
Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seu fluxo de dados
ExampleInputStreameExampleOutputStream.Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como
ka-app-code-.<username>
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2')) -
Execute o script
stock.py:$ python stock.pyMantenha o script em execução enquanto você conclui o restante do tutorial.
Baixe e examine o código do aplicativo
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/TumblingWindow.
O código do aplicativo está localizado no arquivo TumblingWindowStreamingJob.java. Observe o seguinte sobre o código do aplicativo:
O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));Inclua a seguinte declaração de importação:
import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows; //flink 1.13 onwardO aplicativo usa o operador
timeWindowpara encontrar a contagem dos valores de cada símbolo de ação em uma janela em cascata de cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:input.flatMap(new Tokenizer()) // Tokenizer for generating words .keyBy(0) // Logically partition the stream for each word .window(TumblingProcessingTimeWindows.of(Time.seconds(5))) //Flink 1.13 onward .sum(1) // Sum the number of words per partition .map(value -> value.f0 + "," + value.f1.toString() + "\n") .addSink(createSinkFromStaticConfig());
Compilar o código do aplicativo
Para compilar o aplicativo, faça o seguinte:
Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Compile o aplicativo com o seguinte comando:
mvn package -Dflink.version=1.15.3nota
O código-fonte fornecido depende de bibliotecas do Java 11.
A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).
Upload do código Java de fluxo do Apache Flink
Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink.
nota
O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.
Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
aws-kinesis-analytics-java-apps-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.
Execute o aplicativo
-
Na página MyApplication, selecione Executar. Deixe a opção Executar sem snapshot selecionada e confirme a ação.
-
Quando o aplicativo estiver em execução, atualize a página. O console mostra o Gráfico do aplicativo.
Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janela em cascata.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplo: janela deslizante
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
nota
Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Este tópico contém as seguintes seções:
Crie recursos dependentes
Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:
Dois fluxos de dados do Kinesis (
ExampleInputStreameExampleOutputStream).Um bucket do Amazon S3 para armazenar o código do aplicativo (
ka-app-code-)<username>
Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:
Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seus fluxos de dados
ExampleInputStreameExampleOutputStream.Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como
ka-app-code-.<username>
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { "EVENT_TIME": datetime.datetime.now().isoformat(), "TICKER": random.choice(["AAPL", "AMZN", "MSFT", "INTC", "TBV"]), "PRICE": round(random.random() * 100, 2), } def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey" ) if __name__ == "__main__": generate(STREAM_NAME, boto3.client("kinesis")) -
Execute o script
stock.py:$ python stock.pyMantenha o script em execução enquanto você conclui o restante do tutorial.
Baixe e examine o código do aplicativo
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/SlidingWindow.
O código do aplicativo está localizado no arquivo SlidingWindowStreamingJobWithParallelism.java. Observe o seguinte sobre o código do aplicativo:
O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));O aplicativo usa o operador
timeWindowpara descobrir o valor mínimo para cada símbolo de ação em uma janela de dez segundos que desliza por cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:Inclua a seguinte declaração de importação:
import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows; //flink 1.13 onwardO aplicativo usa o operador
timeWindowpara encontrar a contagem dos valores de cada símbolo de ação em uma janela em cascata de cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:input.flatMap(new Tokenizer()) // Tokenizer for generating words .keyBy(0) // Logically partition the stream for each word .window(TumblingProcessingTimeWindows.of(Time.seconds(5))) //Flink 1.13 onward .sum(1) // Sum the number of words per partition .map(value -> value.f0 + "," + value.f1.toString() + "\n") .addSink(createSinkFromStaticConfig());
Compilar o código do aplicativo
Para compilar o aplicativo, faça o seguinte:
Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Compile o aplicativo com o seguinte comando:
mvn package -Dflink.version=1.15.3nota
O código-fonte fornecido depende de bibliotecas do Java 11.
A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).
Upload do código Java de fluxo do Apache Flink
Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink.
Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
aws-kinesis-analytics-java-apps-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.
Configure o paralelismo do aplicativo
Este exemplo de aplicativo usa a execução paralela de tarefas. O código do aplicativo a seguir define o paralelismo do operador min:
.setParallelism(3) // Set parallelism for the min operator
O paralelismo do aplicativo não pode ser maior do que o paralelismo provisionado, que tem um padrão de 1. Para aumentar o paralelismo do seu aplicativo, use a seguinte ação AWS CLI:
aws kinesisanalyticsv2 update-application --application-name MyApplication --current-application-version-id <VersionId> --application-configuration-update "{\"FlinkApplicationConfigurationUpdate\": { \"ParallelismConfigurationUpdate\": {\"ParallelismUpdate\": 5, \"ConfigurationTypeUpdate\": \"CUSTOM\" }}}"
Você pode recuperar o ID da versão atual do aplicativo usando as ações DescribeApplication ou ListApplications.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janelas deslizantes.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplo: gravação em um bucket do Amazon S3
Neste exercício, você cria um Managed Service for Apache Flink que tem um fluxo de dados do Kinesis como origem e um bucket do Amazon S3 como coletor. Usando o coletor, você pode conferir a saída do aplicativo no console do Amazon S3.
nota
Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Este tópico contém as seguintes seções:
Crie recursos dependentes
Antes de criar um Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:
-
Um fluxo de dados do Kinesis (
ExampleInputStream). -
Um bucket do Amazon S3 para armazenar o código e saída do aplicativo (
ka-app-code-)<username>
nota
O Managed Service for Apache Flink não pode gravar dados no Amazon S3 com a criptografia do lado do servidor habilitada no Managed Service for Apache Flink.
Você pode criar o fluxo de dados do Kinesis e um bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:
-
Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seu fluxo de dados
ExampleInputStream. -
Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como
ka-app-code-. Crie duas pastas (<username>codeedata) no bucket do Amazon S3.
O aplicativo cria os seguintes recursos do CloudWatch, se eles ainda não existirem:
-
Um grupo de logs chamado
/AWS/KinesisAnalytics-java/MyApplication. -
Um fluxo de logs chamado
kinesis-analytics-log-stream.
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2')) -
Execute o script
stock.py:$ python stock.pyMantenha o script em execução enquanto você conclui o restante do tutorial.
Baixe e examine o código do aplicativo
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
-
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. -
Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.git -
Navegue até o diretório
amazon-kinesis-data-analytics-java-examples/S3Sink.
O código do aplicativo está localizado no arquivo S3StreamingSinkJob.java. Observe o seguinte sobre o código do aplicativo:
-
O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties)); -
Você precisa incluir a seguinte declaração de importação:
import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows; -
O aplicativo usa um coletor do Apache Flink S3 para gravar no Amazon S3.
O coletor lê mensagens em uma janela em cascata, codifica mensagens em objetos de bucket do S3 e envia os objetos codificados para o coletor do S3. O código a seguir codifica objetos para envio ao Amazon S3:
input.map(value -> { // Parse the JSON JsonNode jsonNode = jsonParser.readValue(value, JsonNode.class); return new Tuple2<>(jsonNode.get("ticker").toString(), 1); }).returns(Types.TUPLE(Types.STRING, Types.INT)) .keyBy(v -> v.f0) // Logically partition the stream for each word .window(TumblingProcessingTimeWindows.of(Time.minutes(1))) .sum(1) // Count the appearances by ticker per partition .map(value -> value.f0 + " count: " + value.f1.toString() + "\n") .addSink(createS3SinkFromStaticConfig());
nota
O aplicativo usa um objeto StreamingFileSink Flink para gravar no Amazon S3. Para obter mais informações sobre o StreamingFileSink, consulte StreamingFileSink
Modifique o código do aplicativo
Nesta seção, você modifica o código do aplicativo para gravar a saída em seu bucket do Amazon S3.
Atualize a linha a seguir com seu nome de usuário para especificar o local de saída do aplicativo:
private static final String s3SinkPath = "s3a://ka-app-code-<username>/data";
Compilar o código do aplicativo
Para compilar o aplicativo, faça o seguinte:
-
Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
-
Compile o aplicativo com o seguinte comando:
mvn package -Dflink.version=1.15.3
A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).
nota
O código-fonte fornecido depende de bibliotecas do Java 11.
Upload do código Java de fluxo do Apache Flink
Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>, navegue até a pasta do código e selecione Upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. -
Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink.
Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink.
-
Deixe a versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso ao fluxo de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta. Substitua <username> pelo seu nome de usuário.{ "Sid": "S3", "Effect": "Allow", "Action": [ "s3:Abort*", "s3:DeleteObject*", "s3:GetObject*", "s3:GetBucket*", "s3:List*", "s3:ListBucket", "s3:PutObject" ], "Resource": [ "arn:aws:s3:::ka-app-code-<username>", "arn:aws:s3:::ka-app-code-<username>/*" ] }, { "Sid": "ListCloudwatchLogGroups", "Effect": "Allow", "Action": [ "logs:DescribeLogGroups" ], "Resource": [ "arn:aws:logs:region:account-id:log-group:*" ] }, { "Sid": "ListCloudwatchLogStreams", "Effect": "Allow", "Action": [ "logs:DescribeLogStreams" ], "Resource": [ "arn:aws:logs:region:account-id:log-group:%LOG_GROUP_PLACEHOLDER%:log-stream:*" ] }, { "Sid": "PutCloudwatchLogs", "Effect": "Allow", "Action": [ "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:region:account-id:log-group:%LOG_GROUP_PLACEHOLDER%:log-stream:%LOG_STREAM_PLACEHOLDER%" ] }, { "Sid": "ReadInputStream", "Effect": "Allow", "Action": "kinesis:*", "Resource": "arn:aws:kinesis:us-west-2:] }012345678901:stream/ExampleInputStream" },
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
code/aws-kinesis-analytics-java-apps-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.
Execute o aplicativo
-
Na página MyApplication, selecione Executar. Deixe a opção Executar sem snapshot selecionada e confirme a ação.
-
Quando o aplicativo estiver em execução, atualize a página. O console mostra o Gráfico do aplicativo.
Verifique a saída do aplicativo
No console do Amazon S3, abra a pasta de dados em seu bucket do S3.
Depois de alguns minutos, os objetos contendo dados agregados do aplicativo serão apresentados.
nota
A agregação está habilitada por padrão no Flink. Para desativá-la, use o seguinte:
sink.producer.aggregation-enabled' = 'false'
Opcional: personalize a fonte e o coletor
Nesta seção, você personaliza as configurações dos objetos de origem e coletor.
nota
Depois de alterar as seções do código descritas nas seções a seguir, faça o seguinte para recarregar o código do aplicativo:
-
Repita as etapas da seção Compilar o código do aplicativo para compilar o código atualizado do aplicativo.
-
Repita as etapas da seção Upload do código Java de fluxo do Apache Flink para fazer o upload do código atualizado do aplicativo.
-
Na página do aplicativo no console, selecione Configure e, em seguida, selecione Update (Atualizar) para recarregar o código do aplicativo atualizado em seu aplicativo.
Esta seção contém as seguintes seções:
Configure o particionamento de dados
Nesta seção, você configura os nomes das pastas que o coletor de arquivos de streaming cria no bucket do S3. Para isso, adicione um atribuidor de bucket ao coletor de arquivos de streaming.
Para personalizar os nomes das pastas criados no bucket do S3, faça o seguinte:
-
Adicione as seguintes declarações de importação ao início do arquivo
S3StreamingSinkJob.java:import org.apache.flink.streaming.api.functions.sink.filesystem.rollingpolicies.DefaultRollingPolicy; import org.apache.flink.streaming.api.functions.sink.filesystem.bucketassigners.DateTimeBucketAssigner; -
Atualize o método
createS3SinkFromStaticConfig()no código para que fique como se segue:private static StreamingFileSink<String> createS3SinkFromStaticConfig() { final StreamingFileSink<String> sink = StreamingFileSink .forRowFormat(new Path(s3SinkPath), new SimpleStringEncoder<String>("UTF-8")).withBucketAssigner(new DateTimeBucketAssigner("yyyy-MM-dd--HH")) .withRollingPolicy(DefaultRollingPolicy.create().build()).build(); return sink; }
O exemplo de código anterior usa o DateTimeBucketAssigner com um formato de data personalizado para criar pastas no bucket do S3. O DateTimeBucketAssigner usa o sistema de horário atual para criar nomes para os buckets. Se você quiser criar um atribuidor de bucket personalizado para personalizar ainda mais os nomes das pastas criadas, você pode criar uma classe que implemente o BucketAssigner.getBucketId.
Uma implementação personalizada do BucketAssigner pode usar o parâmetro Contexto
Configure a frequência de leitura
Nesta seção, você configura a frequência das leituras no fluxo de origem.
Por padrão, o consumidor do Kinesis Streams lê o fluxo de origem cinco vezes por segundo. Essa frequência causará problemas se houver mais de um cliente lendo o fluxo ou se o aplicativo precisar tentar ler um registro novamente. Você pode evitar esses problemas definindo a frequência de leitura do consumidor.
Para definir a frequência de leitura do consumidor do Kinesis, você define a configuração SHARD_GETRECORDS_INTERVAL_MILLIS.
O exemplo de código a seguir define a configuração SHARD_GETRECORDS_INTERVAL_MILLIS para um segundo:
kinesisConsumerConfig.setProperty(ConsumerConfigConstants.SHARD_GETRECORDS_INTERVAL_MILLIS, "1000");
Configure o buffer de gravação
Nesta seção, você define a frequência de gravação e outras configurações do coletor.
Por padrão, o aplicativo grava no bucket de destino a cada minuto. Você pode alterar esse intervalo e outras configurações configurando o objeto DefaultRollingPolicy.
nota
O coletor de arquivos de streaming do Apache Flink grava em seu bucket de saída toda vez que o aplicativo cria um ponto de verificação. Por padrão, o aplicativo cria um ponto de verificação a cada minuto. Para aumentar o intervalo de gravação do coletor do S3, você também deve aumentar o intervalo do ponto de verificação.
Para configurar o objeto DefaultRollingPolicy, faça o seguinte:
-
Aumente a
CheckpointIntervalconfiguração do aplicativo. A entrada a seguir para a ação UpdateApplication define o intervalo do ponto de verificação para dez minutos:{ "ApplicationConfigurationUpdate": { "FlinkApplicationConfigurationUpdate": { "CheckpointConfigurationUpdate": { "ConfigurationTypeUpdate" : "CUSTOM", "CheckpointIntervalUpdate": 600000 } } }, "ApplicationName": "MyApplication", "CurrentApplicationVersionId":5}Para usar o código anterior, especifique a versão atual do aplicativo. Você pode recuperar o ID da versão atual do aplicativo usando a ação ListApplications.
-
Adicione a seguinte declaração de importação ao início do arquivo
S3StreamingSinkJob.java:import java.util.concurrent.TimeUnit; -
Atualize o método
createS3SinkFromStaticConfigno arquivoS3StreamingSinkJob.javapara que fique como se segue:private static StreamingFileSink<String> createS3SinkFromStaticConfig() { final StreamingFileSink<String> sink = StreamingFileSink .forRowFormat(new Path(s3SinkPath), new SimpleStringEncoder<String>("UTF-8")).withBucketAssigner(new DateTimeBucketAssigner("yyyy-MM-dd--HH")) .withRollingPolicy( DefaultRollingPolicy.create() .withRolloverInterval(TimeUnit.MINUTES.toMillis(8)) .withInactivityInterval(TimeUnit.MINUTES.toMillis(5)) .withMaxPartSize(1024 * 1024 * 1024) .build()).build(); return sink; }O exemplo de código anterior define a frequência de gravações no bucket do Amazon S3 em oito minutos.
Para obter mais informações sobre como configurar o coletor de arquivos de streaming do Apache Flink, consulte Formatos codificados por linha
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar os recursos AWS que você criou no tutorial do Amazon S3.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione MyApplication.
-
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seu fluxo de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. -
No painel Kinesis Data Streams, selecione ExampleInputStream.
-
Na página ExampleInputStream, selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Exclua seus objetos e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
Selecione o bucket ka-app-code-
<username>. -
Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Na barra de navegação, selecione Políticas.
-
No controle do filtro, insira kinesis.
-
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
-
Selecione Ações da política e, em seguida, Excluir.
-
Na barra de navegação, selecione Funções.
-
Selecione a função kinesis-analytics-MyApplication-us-west-2.
-
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. -
Na barra de navegação, selecione Logs.
-
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
-
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Tutorial: uso de um aplicativo Managed Service for Apache Flink para replicar dados de um tópico em um cluster MSK para outro em uma VPC
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
O tutorial a seguir demonstra como criar uma VPC da Amazon com um cluster do Amazon MSK e dois tópicos e como criar um aplicativo Managed Service for Apache Flink que lê um tópico do Amazon MSK e grava em outro.
nota
Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Este tutorial contém as seguintes seções:
Crie uma Amazon VPC com um cluster Amazon MSK
Para criar um exemplo de VPC e de cluster do Amazon MSK para acessar a partir de um aplicativo Managed Service for Apache Flink, siga o tutorial Conceitos básicos do uso do Amazon MSK.
Ao concluir o tutorial, observe o seguinte:
Na Etapa 3: Crie um tópico, repita o comando
kafka-topics.sh --createpara criar um tópico de destino chamadoAWSKafkaTutorialTopicDestination:bin/kafka-topics.sh --create --zookeeperZooKeeperConnectionString--replication-factor 3 --partitions 1 --topic AWSKafkaTutorialTopicDestinationRegistre a lista de servidores bootstrap do seu cluster. Você pode obter a lista de servidores bootstrap com o seguinte comando (substitua
ClusterArnpelo ARN do seu cluster do MSK):aws kafka get-bootstrap-brokers --region us-west-2 --cluster-arnClusterArn{... "BootstrapBrokerStringTls": "b-2.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094,b-1.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094,b-3.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094" }Ao seguir as etapas dos tutoriais, certifique-se de usar a região AWS selecionada no código, nos comandos e nas entradas do console.
Crie o código do aplicativo
Nesta seção, você baixará e compilará o arquivo JAR do aplicativo. Recomendamos usar o Java 11.
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitO código do aplicativo está localizado no arquivo
amazon-kinesis-data-analytics-java-examples/KafkaConnectors/KafkaGettingStartedJob.java. Você pode examinar o código para se familiarizar com a estrutura do código do aplicativo Managed Service for Apache Flink.Use a ferramenta Maven de linha de comando ou seu ambiente de desenvolvimento preferido para criar o arquivo JAR. Para compilar o arquivo JAR usando a ferramenta Maven de linha de comando, digite o seguinte:
mvn package -Dflink.version=1.15.3Se a compilação for feita com sucesso, o seguinte arquivo será criado:
target/KafkaGettingStartedJob-1.0.jarnota
O código-fonte fornecido depende de bibliotecas do Java 11. Se você estiver usando um ambiente de desenvolvimento,
Upload do código Java de fluxo do Apache Flink
Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
nota
Se você excluiu o bucket do Amazon S3 no tutorial de introdução, siga a etapa Faça upload do arquivo JAR do código do aplicativo novamente.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
KafkaGettingStartedJob-1.0.jar, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink..
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink 1.15.2.
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
KafkaGettingStartedJob-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2.nota
Quando você especifica recursos do aplicativo usando o console (como o CloudWatch Logs ou um Amazon VPC), o console modifica sua função de execução do aplicativo para conceder permissão para acessar esses recursos.
-
Em Propriedades, selecione Adicionar grupo. Insira as seguintes propriedades:
ID do grupo Chave Valor KafkaSourcetópico AWSKafkaTutorialTopic KafkaSourcebootstrap.servers A lista de servidores bootstrap que você salvou anteriormenteKafkaSourcesecurity.protocol SSL KafkaSourcessl.truststore.location /usr/lib/jvm/java-11-amazon-corretto/lib/security/cacerts KafkaSourcessl.truststore.password changeit nota
O ssl.truststore.password para o certificado padrão é “changeit”; você não precisa alterar esse valor se estiver usando o certificado padrão.
Selecione Adicionar grupo novamente. Insira as seguintes propriedades:
ID do grupo Chave Valor KafkaSinktópico AWSKafkaTutorialTopicDestination KafkaSinkbootstrap.servers A lista de servidores bootstrap que você salvou anteriormenteKafkaSinksecurity.protocol SSL KafkaSinkssl.truststore.location /usr/lib/jvm/java-11-amazon-corretto/lib/security/cacerts KafkaSinkssl.truststore.password changeit KafkaSinktransaction.timeout.ms 1000 O código do aplicativo lê as propriedades do aplicativo acima para configurar a origem e o coletor usados para interagir com sua VPC e com o cluster do Amazon MSK. Para obter mais informações sobre usar as propriedades, consulte Use as propriedades de runtime.
-
Em Snapshots, selecione Desativar. Isso facilitará a atualização do aplicativo sem carregar dados inválidos do estado do aplicativo.
-
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em CloudWatch logging, marque a caixa de seleção Habilitar.
-
Na seção Nuvem privada virtual (VPC), selecione a VPC a ser associada ao aplicativo. Selecione as sub-redes e o grupo de segurança associados à sua VPC os quais você deseja que o aplicativo use para acessar os recursos da VPC.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Esse fluxo de logs é usado para monitorar o aplicativo.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Teste a aplicação
Nesta seção, você grava registros no tópico de origem. O aplicativo lê registros do tópico de origem e os grava no tópico de destino. Você verifica se o aplicativo está funcionando gravando registros no tópico de origem e lendo registros do tópico de destino.
Para escrever e ler registros dos tópicos, siga as etapas de Etapa 6: Produza e consuma dados no tutorial de Introdução ao uso do Amazon MSK.
Para ler o tópico de destino, use o nome do tópico de destino em vez do nome do tópico de origem em sua segunda conexão com o cluster:
bin/kafka-console-consumer.sh --bootstrap-serverBootstrapBrokerString--consumer.config client.properties --topic AWSKafkaTutorialTopicDestination --from-beginning
Se nenhum registro aparecer no tópico de destino, consulte a seção Não é possível acessar recursos em uma VPC no tópico Solucionar problemas do Managed Service for Apache Flink.
Exemplo: use um consumidor EFO com um fluxo de dados do Kinesis
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
Neste exercício, você cria um aplicativo Managed Service for Apache Flink que lê a partir de um fluxo de dados do Kinesis usando um consumidor Enhanced Fan-Out (EFO). Se um consumidor do Kinesis usa o EFO, o serviço Kinesis Data Streams fornece sua própria largura de banda dedicada, em vez de fazer com que o consumidor compartilhe a largura de banda fixa do stream com os outros consumidores que estão lendo o stream.
Para obter mais informações sobre como usar o EFO com o consumidor Kinesis, consulte FLIP-128: distribuição avançada para consumidores da Kinesis
O aplicativo que você cria neste exemplo usa o conector AWS Kinesis (flink-connector-kinesis) 1.15.3.
nota
Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Este tópico contém as seguintes seções:
Crie recursos dependentes
Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:
Dois fluxos de dados do Kinesis (
ExampleInputStreameExampleOutputStream)Um bucket do Amazon S3 para armazenar o código do aplicativo (
ka-app-code-)<username>
Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:
Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seu fluxo de dados
ExampleInputStreameExampleOutputStream.Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como
ka-app-code-.<username>
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2')) -
Execute o script
stock.py:$ python stock.pyMantenha o script em execução enquanto você conclui o restante do tutorial.
Baixe e examine o código do aplicativo
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/EfoConsumer.
O código do aplicativo está localizado no arquivo EfoApplication.java. Observe o seguinte sobre o código do aplicativo:
Você habilita o consumidor EFO definindo os seguintes parâmetros no consumidor do Kinesis:
RECORD_PUBLISHER_TYPE: defina esse parâmetro como EFO para que seu aplicativo use um consumidor EFO para acessar os dados do Kinesis Data Stream.
EFO_CONSUMER_NAME: defina esse parâmetro como um valor de sequência de caracteres que é exclusivo entre os consumidores desse fluxo. A reutilização de um nome de consumidor no mesmo Kinesis Data Stream fará com que o consumidor anterior que usava esse nome seja excluído.
O exemplo de código a seguir demonstra como atribuir valores às propriedades de configuração do consumidor para usar um consumidor EFO para ler o fluxo de origem:
consumerConfig.putIfAbsent(RECORD_PUBLISHER_TYPE, "EFO"); consumerConfig.putIfAbsent(EFO_CONSUMER_NAME, "basic-efo-flink-app");
Compilar o código do aplicativo
Para compilar o aplicativo, faça o seguinte:
Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Compile o aplicativo com o seguinte comando:
mvn package -Dflink.version=1.15.3nota
O código-fonte fornecido depende de bibliotecas do Java 11.
A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).
Upload do código Java de fluxo do Apache Flink
Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
aws-kinesis-analytics-java-apps-1.0.jar, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink.
nota
O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.
Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.nota
Essas permissões concedem ao aplicativo a capacidade de acessar o consumidor EFO.
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
aws-kinesis-analytics-java-apps-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Propriedades, selecione Criar grupo.
-
Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor ConsumerConfigPropertiesflink.stream.recordpublisherEFOConsumerConfigPropertiesflink.stream.efo.consumernamebasic-efo-flink-appConsumerConfigPropertiesINPUT_STREAMExampleInputStreamConsumerConfigPropertiesflink.inputstream.initposLATESTConsumerConfigPropertiesAWS_REGIONus-west-2 -
Em Propriedades, selecione Criar grupo.
-
Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor ProducerConfigPropertiesOUTPUT_STREAMExampleOutputStreamProducerConfigPropertiesAWS_REGIONus-west-2ProducerConfigPropertiesAggregationEnabledfalse -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.
Você também pode verificar o nome do seu consumidor (basic-efo-flink-app) no console do Kinesis Data Streams, na guia Enhanced fan-out do fluxo de dados.
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar AWS recursos criados no tutorial Janela EFO.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplo: gravação no Firehose
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
Neste exercício, você cria um aplicativo Managed Service for Apache Flink que tem um fluxo de dados do Kinesis como fonte e um fluxo do Firehose como coletor. Usando o coletor, você pode conferir a saída do aplicativo em um bucket do Amazon S3.
nota
Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Esta seção contém as seguintes etapas:
Crie recursos dependentes
Antes de criar um Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:
Um fluxo de dados do Kinesis (
ExampleInputStream)Um fluxo do Firehose no qual o aplicativo grava o resultado em (
ExampleDeliveryStream).Um bucket do Amazon S3 para armazenar o código do aplicativo (
ka-app-code-)<username>
É possível criar o fluxo do Kinesis, os buckets do Amazon S3 e o fluxo do Firehose usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:
Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seu fluxo de dados
ExampleInputStream.Criação de um fluxo de entrega do Amazon Kinesis Firehose Data no Guia do desenvolvedor do Amazon Data Firehose. Dê um nome ao fluxo do Firehose
ExampleDeliveryStream. Ao criar o fluxo do Firehose, crie também o destino no S3 e o perfil do IAM do fluxo.Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como
ka-app-code-.<username>
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2')) -
Execute o script
stock.py:$ python stock.pyMantenha o script em execução enquanto você conclui o restante do tutorial.
Baixar e examinar o código Java de fluxo do Apache Flink
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/FirehoseSink.
O código do aplicativo está localizado no arquivo FirehoseSinkStreamingJob.java. Observe o seguinte sobre o código do aplicativo:
O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));O aplicativo usa um coletor do Firehose para gravar dados em um fluxo do Firehose. O trecho a seguir cria o coletor do Firehose:
private static KinesisFirehoseSink<String> createFirehoseSinkFromStaticConfig() { Properties sinkProperties = new Properties(); sinkProperties.setProperty(AWS_REGION, region); return KinesisFirehoseSink.<String>builder() .setFirehoseClientProperties(sinkProperties) .setSerializationSchema(new SimpleStringSchema()) .setDeliveryStreamName(outputDeliveryStreamName) .build(); }
Compilar o código do aplicativo
Para compilar o aplicativo, faça o seguinte:
Instale o Java e o Maven, caso ainda não o tenha feito. Para obter mais informações, consulte Conclua os pré-requisitos exigidos no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
Para usar o conector Kinesis no aplicativo a seguir, você precisa baixar, compilar e instalar o Apache Maven. Para obter mais informações, consulte Uso do conector Kinesis Streams para o Apache Flink com versões anteriores do Apache Flink.
Compile o aplicativo com o seguinte comando:
mvn package -Dflink.version=1.15.3nota
O código-fonte fornecido depende de bibliotecas do Java 11.
A compilação do aplicativo cria o arquivo JAR do aplicativo (target/aws-kinesis-analytics-java-apps-1.0.jar).
Upload do código Java de fluxo do Apache Flink
Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.
Para fazer upload do código do aplicativo
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
No console, selecione o bucket ka-app-code-
<username>e selecione Upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
java-getting-started-1.0.jar, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
É possível criar e executar um aplicativo Managed Service for Apache Flink usando o console ou a AWS CLI.
nota
Ao criar o aplicativo usando o console, os recursos do AWS Identity and Access Management (IAM) e do Amazon CloudWatch Logs também são criados. Ao criar o aplicativo usando a AWS CLI, esses recursos devem ser criados separadamente.
Crie e execute o aplicativo (console)
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Descrição, insira
My java test app. -
Em Runtime, selecione Apache Flink.
nota
O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.
Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Quando você cria o aplicativo usando o console, você tem a opção de criar um perfil e uma política do IAM para o seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso ao fluxo de dados do Kinesis e ao fluxo do Firehose.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua todas as ocorrências do exemplo de IDs de conta (
012345678901) pelo ID da conta.
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
java-getting-started-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Interromper o aplicativo
Na página MyApplication, selecione Interromper. Confirme a ação.
Atualizar o aplicativo
Usando o console, é possível atualizar configurações do aplicativo, como as propriedades do aplicativo, as configurações de monitoramento e a localização ou o nome do arquivo JAR do aplicativo.
Na página MyApplication, selecione Configure (Configurar). Atualize as configurações do aplicativo e selecione Atualizar.
nota
Para atualizar o código do aplicativo no console, você deve alterar o nome do objeto do JAR, usar um bucket do S3 diferente ou usar o AWS CLI conforme descrito na seção Atualizar o código do aplicativo. Se o nome do arquivo ou o bucket não mudar, o código do aplicativo não será recarregado quando você selecionar Atualizar na página Configure.
Criar e executar a aplicação (AWS CLI)
Nesta seção, você usa a AWS CLI para criar e executar o aplicativo Flink do Managed Service for Apache Flink.
Criar uma política de permissões
Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação read no fluxo de origem, e outra que concede permissões para ações write no fluxo de destino. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.
Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário que você usará para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos Nomes de recurso da Amazon (ARNs) () pelo ID da conta.012345678901
Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.
nota
Para acessar outros serviços da Amazon, você pode usar o AWS SDK para Java. O Managed Service for Apache Flink define automaticamente as credenciais exigidas pelo SDK como as credenciais do perfil do IAM associado a seu aplicativo. Não é necessária nenhuma etapa adicional.
Criar um perfil do IAM
Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.
O Managed Service for Apache Flink não pode acessar seu fluxo se não tiver permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink a permissão de assumir a função. A política de permissões determina o que o Managed Service for Apache Flink pode fazer depois de assumir a função.
Anexe a política de permissões que criou na seção anterior a essa função.
Para criar uma perfil do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
No painel de navegação, selecione Funções e Criar função.
-
Em Selecionar tipo de identidade de confiança, selecione Serviço da AWS. Em Selecionar o serviço que usará esta função, selecione Kinesis. Em Selecionar seu caso de uso, selecione Kinesis Analytics.
Selecione Next: Permissions (Próximo: permissões).
-
Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.
-
Na página Criar função, insira
MF-stream-rw-rolepara o Nome da função. Selecione Criar função.Foi criado um perfil do IAM chamado
MF-stream-rw-role. Em seguida, atualize as políticas de confiança e de permissões para a função. -
Anexe a política de permissões à função.
nota
Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, anexe a política criada na etapa anterior, Criar uma política de permissões.
-
Na página Resumo, selecione a guia Permissões.
-
Selecione Attach Policies.
-
Na caixa de pesquisa, insira
AKReadSourceStreamWriteSinkStream(a política criada na seção anterior). -
Selecione a política AKReadSourceStreamWriteSinkStream e selecione Anexar política.
-
Agora você criou a função de execução de serviço que seu aplicativo usará para acessar os recursos. Anote o ARN da nova função.
Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.
Crie o aplicativo do Managed Service for Apache Flink
-
Salve o seguinte código JSON em um arquivo chamado
create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket pelo sufixo que você selecionou na seçãoCrie recursos dependentes (ka-app-code-). Substitua o ID da conta de exemplo (<username>012345678901) na função de execução do serviço pelo ID da conta.{ "ApplicationName": "test", "ApplicationDescription": "my java test app", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "java-getting-started-1.0.jar" } }, "CodeContentType": "ZIPFILE" } } } } -
Execute a ação
CreateApplicationcom a solicitação anterior para criar o aplicativo:aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json
O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.
Iniciar o aplicativo
Nesta seção, a ação StartApplication será usada para iniciar o aplicativo.
Para iniciar o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
start_request.json.{ "ApplicationName": "test", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } } -
Execute a ação
StartApplicationcom a solicitação anterior para iniciar o aplicativo:aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json
O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.
Interromper o aplicativo
Nesta seção, a ação StopApplication será usada para interromper o aplicativo.
Como interromper o aplicativo
-
Salve o seguinte código JSON em um arquivo chamado
stop_request.json.{ "ApplicationName": "test" } -
Execute a ação
StopApplicationcom a seguinte solicitação para interromper o aplicativo:aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json
O aplicativo agora está interrompido.
Adicionar uma opção de registro em log do CloudWatch
Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter mais informações sobre o uso de CloudWatch Logs com seu aplicativo, consulte Configure o registro em log do aplicativo no Managed Service for Apache Flink.
Atualizar o código do aplicativo
Quando precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação UpdateApplicationAWS CLI.
Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3.
O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Crie recursos dependentes.
{ "ApplicationName": "test", "CurrentApplicationVersionId":1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "java-getting-started-1.0.jar" } } } } }
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar os recursos AWS criados no tutorial Introdução.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Selecione Configurar.
Na seção Snapshots, selecione Desativar e, em seguida, selecione Atualizar.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seu fluxo de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Exclua seu fluxo do Firehose
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel do Firehose, selecione ExampleDeliveryStream.
Na página ExampleDeliveryStream, selecione Excluir fluxo do Firehose e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Se você criou um bucket do Amazon S3 para o destino do fluxo do Firehose, exclua esse bucket também.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Se você criou uma nova política para o fluxo do Firehose, exclua essa política também.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Se você criou uma nova função para o fluxo do Firehose, exclua essa função também.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplo: leia a partir de um fluxo do Kinesis em outra conta
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
Este exemplo demonstra como criar um Managed Service para o aplicativo Apache Flink que lê dados de um fluxo do Kinesis em uma conta diferente. Neste exemplo, você usará uma conta para o fluxo de origem do Kinesis e uma segunda conta para o aplicativo Managed Service for Apache Flink e para o fluxo de dados do coletor do Kinesis.
Este tópico contém as seguintes seções:
Pré-requisitos
Neste tutorial, você modifica o exemplo da Introdução para ler dados de um fluxo do Kinesis em uma conta diferente. Conclua o tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink antes de continuar.
Você precisa de duas AWS contas para concluir este tutorial: uma para o fluxo de origem e outra para o aplicativo e o fluxo do coletor. Use a conta AWS que você usou para o tutorial da Introdução para o aplicativo e o fluxo do coletor. Use uma conta AWS diferente para o fluxo de origem.
Configuração
Você acessará suas duas contas AWS usando perfis nomeados. Modifique suas AWS credenciais e arquivos de configuração para incluir dois perfis que contenham a região e as informações de conexão de suas duas contas.
O arquivo de credencial de exemplo a seguir contém dois perfis nomeados, ka-source-stream-account-profile e ka-sink-stream-account-profile. Use a conta que você usou no tutorial da Introdução para a conta do fluxo do coletor.
[ka-source-stream-account-profile] aws_access_key_id=AKIAIOSFODNN7EXAMPLE aws_secret_access_key=wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY [ka-sink-stream-account-profile] aws_access_key_id=AKIAI44QH8DHBEXAMPLE aws_secret_access_key=je7MtGbClwBF/2Zp9Utk/h3yCo8nvbEXAMPLEKEY
O arquivo de configuração de exemplo a seguir contém os mesmos perfis nomeados com informações de região e formato de saída.
[profile ka-source-stream-account-profile] region=us-west-2 output=json [profile ka-sink-stream-account-profile] region=us-west-2 output=json
nota
Este tutorial não usa o ka-sink-stream-account-profile. Ele está incluído como um exemplo de como acessar duas contas AWS diferentes usando perfis.
Para obter mais informações sobre perfis nomeados com o AWS CLI, consulte Perfis nomeados na documentação AWS Command Line Interface.
Crie um fluxo do Kinesis da fonte
Nesta seção, você criará o fluxo do Kinesis na conta de origem.
Use o comando a seguir para criar o fluxo do Kinesis que o aplicativo usará como entrada. Observe que o parâmetro --profile especifica qual perfil de conta usar.
$ aws kinesis create-stream \ --stream-name SourceAccountExampleInputStream \ --shard-count 1 \ --profile ka-source-stream-account-profile
Crie e atualize os perfis e políticas do IAM
Para permitir o acesso a objetos em todas as contas AWS, você deve crias um perfil e uma política do IAM na conta de origem. Em seguida, você modifica a política do IAM na conta do coletor. Para obter mais informações sobre como criar perfis e políticas do IAM, consulte os seguintes tópicos no AWS Identity and Access ManagementGuia do usuário:
Perfis e políticas da conta do coletor
Edite a
kinesis-analytics-service-MyApplication-us-west-2política do tutorial da Introdução. Essa política permite que o perfil da conta de origem seja assumido para ler o fluxo de origem.nota
Quando você usa o console para criar seu aplicativo, o console cria uma política chamada
kinesis-analytics-service-e um perfil chamado<application name>-<application region>kinesisanalytics-.<application name>-<application region>Adicione a seção destacada abaixo à política. Substitua o exemplo de ID de conta (
SOURCE01234567) pelo ID da conta que você usará para o fluxo de origem.Abra o perfil
kinesis-analytics-MyApplication-us-west-2e anote o nome do recurso da Amazon (ARN). Ele será necessário na próxima seção. O ARN do perfil é semelhante ao seguinte.arn:aws:iam::SINK012345678:role/service-role/kinesis-analytics-MyApplication-us-west-2
Perfis e políticas da conta de fonte
Crie uma política na conta de origem chamada
KA-Source-Stream-Policy. Use o seguinte JSON para a política. Substitua o número da conta de exemplo pelo número da conta de origem.Crie um perfil na conta de origem chamado
MF-Source-Stream-Role. Faça o seguinte para criar o perfil usando o caso de uso do Managed Flink:No console de gerenciamento do IAM, selecione Criar perfil.
Na página Criar perfil, selecione AWSServiço. Na lista de serviços, selecione Kinesis.
Na seção Selecione seu caso de uso, selecione Managed Service for Apache Flink.
Selecione Next: Permissions (Próximo: permissões).
Adicione a política de permissões
KA-Source-Stream-Policyque criada na etapa anterior. Selecione Next: Tags (Próximo: tags).Selecione Next: Review (Próximo: revisar).
Nomeie a função
KA-Source-Stream-Role. Seu aplicativo usará esse perfil para acessar o fluxo de origem.
Adicione o
kinesis-analytics-MyApplication-us-west-2ARN da conta do coletor à relação de confiança doKA-Source-Stream-Roleperfil na conta de origem:Abra o
KA-Source-Stream-Roleno console do IAM.Selecione a guia Relacionamentos de confiança.
Selecione Edit trust relationship (Editar relação de confiança).
Use o código a seguir para a relação de confiança. Substitua o exemplo de IDs de conta (
) pelo ID da conta do coletor.SINK012345678
Atualize o script Python
Nesta seção, você atualiza o script Python que gera dados de amostra para usar no perfil da conta de origem.
Atualize o script stock.py com as seguintes alterações destacadas.
import json import boto3 import random import datetimeimport os os.environ['AWS_PROFILE'] ='ka-source-stream-account-profile' os.environ['AWS_DEFAULT_REGION'] = 'us-west-2'kinesis = boto3.client('kinesis') def getReferrer(): data = {} now = datetime.datetime.now() str_now = now.isoformat() data['event_time'] = str_now data['ticker'] = random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']) price = random.random() * 100 data['price'] = round(price, 2) return data while True: data = json.dumps(getReferrer()) print(data) kinesis.put_record( StreamName="SourceAccountExampleInputStream", Data=data, PartitionKey="partitionkey")
Atualize o aplicativo Java
Nesta seção, você atualiza o código do aplicativo Java para assumir a função da conta de origem ao ler o fluxo de origem.
Faça as alterações a seguir no arquivo BasicStreamingJob.java. Substitua o exemplo do número da conta de origem (SOURCE01234567) pelo número da conta de origem.
package com.amazonaws.services.managed-flink; import com.amazonaws.services.managed-flink.runtime.KinesisAnalyticsRuntime; import org.apache.flink.api.common.serialization.SimpleStringSchema; import org.apache.flink.streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.connectors.kinesis.FlinkKinesisConsumer; import org.apache.flink.streaming.connectors.kinesis.FlinkKinesisProducer; import org.apache.flink.streaming.connectors.kinesis.config.ConsumerConfigConstants;import org.apache.flink.streaming.connectors.kinesis.config.AWSConfigConstants;import java.io.IOException; import java.util.Map; import java.util.Properties; /** * A basic Managed Service for Apache Flink for Java application with Kinesis data streams * as source and sink. */ public class BasicStreamingJob { private static final String region = "us-west-2"; private static final String inputStreamName ="SourceAccountExampleInputStream";private static final String outputStreamName = ExampleOutputStream;private static final String roleArn = "arn:aws:iam::SOURCE01234567:role/KA-Source-Stream-Role"; private static final String roleSessionName = "ksassumedrolesession";private static DataStream<String> createSourceFromStaticConfig(StreamExecutionEnvironment env) { Properties inputProperties = new Properties();inputProperties.setProperty(AWSConfigConstants.AWS_CREDENTIALS_PROVIDER, "ASSUME_ROLE"); inputProperties.setProperty(AWSConfigConstants.AWS_ROLE_ARN, roleArn); inputProperties.setProperty(AWSConfigConstants.AWS_ROLE_SESSION_NAME, roleSessionName);inputProperties.setProperty(ConsumerConfigConstants.AWS_REGION, region); inputProperties.setProperty(ConsumerConfigConstants.STREAM_INITIAL_POSITION, "LATEST"); return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties)); } private static KinesisStreamsSink<String> createSinkFromStaticConfig() { Properties outputProperties = new Properties(); outputProperties.setProperty(AWSConfigConstants.AWS_REGION, region); return KinesisStreamsSink.<String>builder() .setKinesisClientProperties(outputProperties) .setSerializationSchema(new SimpleStringSchema()) .setStreamName(outputProperties.getProperty("OUTPUT_STREAM", "ExampleOutputStream")) .setPartitionKeyGenerator(element -> String.valueOf(element.hashCode())) .build(); } public static void main(String[] args) throws Exception { // set up the streaming execution environment final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); DataStream<String> input = createSourceFromStaticConfig(env); input.addSink(createSinkFromStaticConfig()); env.execute("Flink Streaming Java API Skeleton"); } }
Compile, faça o upload e execute o aplicativo
Faça o seguinte para atualizar e executar o aplicativo:
Compile o aplicativo novamente executando o comando a seguir no diretório com o arquivo
pom.xml.mvn package -Dflink.version=1.15.3Exclua o arquivo JAR anterior do seu bucket do Amazon Simple Storage Service (Amazon S3) e, em seguida, faça o upload do novo arquivo
aws-kinesis-analytics-java-apps-1.0.jarno bucket do Amazon S3.Na página do aplicativo no console Managed Service for Apache Flink, selecione Configurar, Atualizar para recarregar o arquivo JAR do aplicativo.
Execute o script
stock.pypara enviar dados para o fluxo de origem.python stock.py
Agora, o aplicativo lê dados do fluxo do Kinesis na outra conta.
Você pode ver se o aplicativo está funcionando verificando a métrica PutRecords.Bytes do fluxo ExampleOutputStream. Se houver atividade no fluxo de saída, o aplicativo está funcionando corretamente.
Tutorial: como usar um armazenamento confiável personalizado com o Amazon MSK
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
APIs de fonte de dados atuais
Se você estiver usando as APIs da fonte de dados atual, seu aplicativo poderá aproveitar o utilitário Amazon MSK Config Providers descrito aqui
... // define names of config providers: builder.setProperty("config.providers", "secretsmanager,s3import"); // provide implementation classes for each provider: builder.setProperty("config.providers.secretsmanager.class", "com.amazonaws.kafka.config.providers.SecretsManagerConfigProvider"); builder.setProperty("config.providers.s3import.class", "com.amazonaws.kafka.config.providers.S3ImportConfigProvider"); String region = appProperties.get(Helpers.S3_BUCKET_REGION_KEY).toString(); String keystoreS3Bucket = appProperties.get(Helpers.KEYSTORE_S3_BUCKET_KEY).toString(); String keystoreS3Path = appProperties.get(Helpers.KEYSTORE_S3_PATH_KEY).toString(); String truststoreS3Bucket = appProperties.get(Helpers.TRUSTSTORE_S3_BUCKET_KEY).toString(); String truststoreS3Path = appProperties.get(Helpers.TRUSTSTORE_S3_PATH_KEY).toString(); String keystorePassSecret = appProperties.get(Helpers.KEYSTORE_PASS_SECRET_KEY).toString(); String keystorePassSecretField = appProperties.get(Helpers.KEYSTORE_PASS_SECRET_FIELD_KEY).toString(); // region, etc.. builder.setProperty("config.providers.s3import.param.region", region); // properties builder.setProperty("ssl.truststore.location", "${s3import:" + region + ":" + truststoreS3Bucket + "/" + truststoreS3Path + "}"); builder.setProperty("ssl.keystore.type", "PKCS12"); builder.setProperty("ssl.keystore.location", "${s3import:" + region + ":" + keystoreS3Bucket + "/" + keystoreS3Path + "}"); builder.setProperty("ssl.keystore.password", "${secretsmanager:" + keystorePassSecret + ":" + keystorePassSecretField + "}"); builder.setProperty("ssl.key.password", "${secretsmanager:" + keystorePassSecret + ":" + keystorePassSecretField + "}"); ...
Mais detalhes e uma explicação passo a passo podem ser encontrados aqui
APIs herdadas do SourceFunction
Se você estiver usando as APIs herdadas do SourceFunction, seu aplicativo usará esquemas personalizados de serialização e desserialização que substituem o método open para carregar o truststore personalizado. Isso torna o truststore disponível para o aplicativo após o aplicativo ser reiniciado ou substituído pelos encadeamentos.
O truststore personalizado é recuperado e armazenado usando o seguinte código:
public static void initializeKafkaTruststore() { ClassLoader classLoader = Thread.currentThread().getContextClassLoader(); URL inputUrl = classLoader.getResource("kafka.client.truststore.jks"); File dest = new File("/tmp/kafka.client.truststore.jks"); try { FileUtils.copyURLToFile(inputUrl, dest); } catch (Exception ex) { throw new FlinkRuntimeException("Failed to initialize Kakfa truststore", ex); } }
nota
O Apache Flink exige que o truststore esteja no formato JKS
nota
Para configurar os pré-requisitos necessários para este exercício, em primeiro lugar conclua o exercício. Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink
O tutorial a seguir demonstra como se conectar com segurança (criptografia em trânsito) a um cluster do Kafka que usa certificados de servidor emitidos por uma autoridade de certificação (CA) personalizada, privada ou, até mesmo, auto-hospedada.
Para conectar qualquer cliente do Kafka de forma segura via TLS a um cluster do Kafka, o cliente do Kafka (como o exemplo do aplicativo Flink) deve confiar em toda a cadeia de confiança apresentada pelos certificados de servidor do cluster do Kafka (da AC emissora até a AC de nível raiz). Como exemplo de um armazenamento confiável personalizado, usaremos um cluster do Amazon MSK com a autenticação TLS mútua (MTLS) habilitada. Isso significa que os nós do cluster do MSK usam certificados de servidor emitidos por uma Autoridade de Certificação Privada do AWS Certificate Manager que é privada na sua conta e região e, portanto, não é confiável para o armazenamento confiável padrão do Java Virtual Machine (JVM) que executa o aplicativo Flink.
nota
-
Um keystore é usado para armazenar a chave privada e os certificados de identidade que um aplicativo deve apresentar ao servidor ou ao cliente para verificação.
-
Um armazenamento confiável é usado para armazenar certificados de Autoridades Certificadas (AC) que verificam o certificado apresentado pelo servidor em uma conexão SSL.
Você também pode usar a técnica deste tutorial para interações entre um aplicativo Managed Service for Apache Flink e outras fontes do Apache Kafka, como:
Um cluster personalizado do Apache Kafka hospedado em AWS (Amazon EC2
ou Amazon EKS ) Um cluster do Confluent Kafka
hospedado em AWS Um cluster on-premises do Kafka acessado por meio de AWS Direct Connect
ou uma VPN
Este tutorial contém as seguintes seções:
Crie uma VPC com um cluster do Amazon MSK
Para criar um exemplo de VPC e de cluster do Amazon MSK para acessar a partir de um aplicativo Managed Service for Apache Flink, siga o tutorial Conceitos básicos do uso do Amazon MSK.
Ao concluir o tutorial, faça também o seguinte:
Na Etapa 3: Crie um tópico, repita o comando
kafka-topics.sh --createpara criar um tópico de destino chamadoAWSKafkaTutorialTopicDestination:bin/kafka-topics.sh --create --bootstrap-serverZooKeeperConnectionString--replication-factor 3 --partitions 1 --topic AWSKafkaTutorialTopicDestinationnota
Se o comando
kafka-topics.shretornar umZooKeeperClientTimeoutException, verifique se o grupo de segurança do cluster do Kafka tem uma regra de entrada para permitir todo o tráfego do endereço IP privado da instância do cliente.Registre a lista de servidores bootstrap do seu cluster. Você pode obter a lista de servidores bootstrap com o seguinte comando (substitua
ClusterArnpelo ARN do seu cluster do MSK):aws kafka get-bootstrap-brokers --region us-west-2 --cluster-arnClusterArn{... "BootstrapBrokerStringTls": "b-2.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094,b-1.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094,b-3.awskafkatutorialcluste.t79r6y.c4.kafka.us-west-2.amazonaws.com:9094" }Ao seguir as etapas deste tutorial e dos tutoriais de pré-requisito, certifique-se de usar a região AWS selecionada no seu código, nos comandos e nas entradas do console.
Crie um armazenamento confiável personalizado e aplique-o ao seu cluster
Nesta seção, você cria uma autoridade de certificação (CA) personalizada, a usa para gerar um truststore personalizado e a aplica ao seu cluster do MSK.
Para criar e aplicar seu truststore personalizado, siga o tutorial de Autenticação do cliente no Guia do desenvolvedor do Amazon Managed Streaming for Apache Kafka.
Crie o código do aplicativo
Nesta seção, você baixa e compila o arquivo JAR do aplicativo.
O código de aplicativo Java deste exemplo está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitO código do aplicativo está localizado no
amazon-kinesis-data-analytics-java-examples/CustomKeystore. Você pode examinar o código para se familiarizar com a estrutura do código do Managed Service for Apache Flink.Use a ferramenta Maven de linha de comando ou seu ambiente de desenvolvimento preferido para criar o arquivo JAR. Para compilar o arquivo JAR usando a ferramenta Maven de linha de comando, insira o seguinte:
mvn package -Dflink.version=1.15.3Se a compilação for feita com sucesso, o seguinte arquivo será criado:
target/flink-app-1.0-SNAPSHOT.jarnota
O código-fonte fornecido depende de bibliotecas do Java 11.
Upload do código Java de fluxo do Apache Flink
Nesta seção, você faz o upload do código do seu aplicativo no bucket do Amazon S3 que você criou no tutorial Tutorial: conceitos básicos no uso da API DataStream no Managed Service for Apache Flink.
nota
Se você excluiu o bucket do Amazon S3 no tutorial de introdução, siga a etapa Faça upload do arquivo JAR do código do aplicativo novamente.
-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
flink-app-1.0-SNAPSHOT.jar, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink 1.15.2.
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
flink-app-1.0-SNAPSHOT.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2.nota
Quando você especifica recursos do aplicativo usando o console (como Logs ou uma VPC), o console modifica sua função de execução do aplicativo para conceder permissão para acessar esses recursos.
-
Em Propriedades, selecione Adicionar grupo. Insira as seguintes propriedades:
ID do grupo Chave Valor KafkaSourcetópico AWSKafkaTutorialTopic KafkaSourcebootstrap.servers A lista de servidores bootstrap que você salvou anteriormenteKafkaSourcesecurity.protocol SSL KafkaSourcessl.truststore.location /usr/lib/jvm/java-11-amazon-corretto/lib/security/cacerts KafkaSourcessl.truststore.password changeit nota
O ssl.truststore.password para o certificado padrão é “changeit”; você não precisa alterar esse valor se estiver usando o certificado padrão.
Selecione Adicionar grupo novamente. Insira as seguintes propriedades:
ID do grupo Chave Valor KafkaSinktópico AWSKafkaTutorialTopicDestination KafkaSinkbootstrap.servers A lista de servidores bootstrap que você salvou anteriormenteKafkaSinksecurity.protocol SSL KafkaSinkssl.truststore.location /usr/lib/jvm/java-11-amazon-corretto/lib/security/cacerts KafkaSinkssl.truststore.password changeit KafkaSinktransaction.timeout.ms 1000 O código do aplicativo lê as propriedades do aplicativo acima para configurar a origem e o coletor usados para interagir com sua VPC e com o cluster do Amazon MSK. Para obter mais informações sobre usar as propriedades, consulte Use as propriedades de runtime.
-
Em Snapshots, selecione Desativar. Isso facilitará a atualização do aplicativo sem carregar dados inválidos do estado do aplicativo.
-
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em CloudWatch logging, marque a caixa de seleção Habilitar.
-
Na seção Nuvem privada virtual (VPC), selecione a VPC a ser associada ao aplicativo. Selecione as sub-redes e o grupo de segurança associados à sua VPC os quais você deseja que o aplicativo use para acessar os recursos da VPC.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Esse fluxo de logs é usado para monitorar o aplicativo.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Teste a aplicação
Nesta seção, você grava registros no tópico de origem. O aplicativo lê registros do tópico de origem e os grava no tópico de destino. Você verifica se o aplicativo está funcionando gravando registros no tópico de origem e lendo registros do tópico de destino.
Para escrever e ler registros dos tópicos, siga as etapas de Etapa 6: Produza e consuma dados no tutorial de Introdução ao uso do Amazon MSK.
Para ler o tópico de destino, use o nome do tópico de destino em vez do nome do tópico de origem em sua segunda conexão com o cluster:
bin/kafka-console-consumer.sh --bootstrap-serverBootstrapBrokerString--consumer.config client.properties --topic AWSKafkaTutorialTopicDestination --from-beginning
Se nenhum registro aparecer no tópico de destino, consulte a seção Não é possível acessar recursos em uma VPC no tópico Solucionar problemas do Managed Service for Apache Flink.
Exemplos de Python
Os exemplos a seguir demonstram como criar aplicativos usando o Python com a API de tabelas do Apache Flink.
Tópicos
Exemplo: criação de uma janela em cascata em Python
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
Neste exercício, você cria um aplicativo Python Managed Service for Apache Flink que agrega dados usando uma janela em cascata.
nota
Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: introdução ao uso do Python no Managed Service for Apache Flink.
Este tópico contém as seguintes seções:
Crie recursos dependentes
Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:
Dois fluxos de dados do Kinesis (
ExampleInputStreameExampleOutputStream)Um bucket do Amazon S3 para armazenar o código do aplicativo (
ka-app-code-)<username>
Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:
Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seus fluxos de dados
ExampleInputStreameExampleOutputStream.Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como
ka-app-code-.<username>
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
nota
O script do Python nesta seção usa o AWS CLI. Você deve configurar seu AWS CLI para usar as credenciais da sua conta e a região padrão. Para configurar o seu AWS CLI, digite o seguinte:
aws configure
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2')) -
Execute o script
stock.py:$ python stock.pyMantenha o script em execução enquanto você conclui o restante do tutorial.
Baixe e examine o código do aplicativo
O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/python/TumblingWindow.
O código do aplicativo está localizado no arquivo tumbling-windows.py. Observe o seguinte sobre o código do aplicativo:
O aplicativo usa uma origem de tabela do Kinesis para ler o fluxo de origem. O trecho a seguir chama a função
create_tablepara criar a origem de tabela Kinesis:table_env.execute_sql( create_input_table(input_table_name, input_stream, input_region, stream_initpos) )A função
create_tableusa um comando SQL para criar uma tabela que é apoiada pela origem de transmissão:def create_input_table(table_name, stream_name, region, stream_initpos): return """ CREATE TABLE {0} ( ticker VARCHAR(6), price DOUBLE, event_time TIMESTAMP(3), WATERMARK FOR event_time AS event_time - INTERVAL '5' SECOND ) PARTITIONED BY (ticker) WITH ( 'connector' = 'kinesis', 'stream' = '{1}', 'aws.region' = '{2}', 'scan.stream.initpos' = '{3}', 'format' = 'json', 'json.timestamp-format.standard' = 'ISO-8601' ) """.format(table_name, stream_name, region, stream_initpos)O aplicativo usa o operador
Tumblepara agregar registros em uma janela em cascata especificada e retornar os registros agregados como um objeto de tabela:tumbling_window_table = ( input_table.window( Tumble.over("10.seconds").on("event_time").alias("ten_second_window") ) .group_by("ticker, ten_second_window") .select("ticker, price.min as price, to_string(ten_second_window.end) as event_time")O aplicativo usa o conector Kinesis Flink, do
flink-sql-connector-kinesis-1.15.2.jar.
Comprima e faça upload do código Python de transmissão do Apache Flink
Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.
Use seu aplicativo de compressão preferido para comprimir os arquivos
tumbling-windows.pyeflink-sql-connector-kinesis-1.15.2.jar. Nomeie o arquivo comomyapp.zip.-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
myapp.zip, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink.
nota
O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.
Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
myapp.zip.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Propriedades, selecione Adicionar grupo.
-
Insira o seguinte:
ID do grupo Chave Valor consumer.config.0input.stream.nameExampleInputStreamconsumer.config.0aws.regionus-west-2consumer.config.0scan.stream.initposLATESTSelecione Save (Salvar).
Em Propriedades, selecione Adicionar grupo novamente.
Insira o seguinte:
ID do grupo Chave Valor producer.config.0output.stream.nameExampleOutputStreamproducer.config.0aws.regionus-west-2producer.config.0shard.count1Em Propriedades, selecione Adicionar grupo novamente. Em ID do grupo, digite
kinesis.analytics.flink.run.options. Esse grupo de propriedades especiais informa ao aplicativo onde encontrar seus recursos de código. Para obter mais informações, consulte Especifique seus arquivos de código.Insira o seguinte:
ID do grupo Chave Valor kinesis.analytics.flink.run.optionspythontumbling-windows.pykinesis.analytics.flink.run.optionsjarfileflink-sql-connector-kinesis-1.15.2.jar-
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janela em cascata.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplo: criação de uma janela deslizante em Python
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
nota
Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: introdução ao uso do Python no Managed Service for Apache Flink.
Este tópico contém as seguintes seções:
Crie recursos dependentes
Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:
Dois fluxos de dados do Kinesis (
ExampleInputStreameExampleOutputStream)Um bucket do Amazon S3 para armazenar o código do aplicativo (
ka-app-code-)<username>
Você pode criar os fluxos do Kinesis e o bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:
Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seus fluxos de dados
ExampleInputStreameExampleOutputStream.Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como
ka-app-code-.<username>
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
nota
O script do Python nesta seção usa o AWS CLI. Você deve configurar seu AWS CLI para usar as credenciais da sua conta e a região padrão. Para configurar o seu AWS CLI, digite o seguinte:
aws configure
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2')) -
Execute o script
stock.py:$ python stock.pyMantenha o script em execução enquanto você conclui o restante do tutorial.
Baixe e examine o código do aplicativo
O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/>amazon-kinesis-data-analytics-java-examplesNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/python/SlidingWindow.
O código do aplicativo está localizado no arquivo sliding-windows.py. Observe o seguinte sobre o código do aplicativo:
O aplicativo usa uma origem de tabela do Kinesis para ler o fluxo de origem. O trecho a seguir chama a função
create_input_tablepara criar a origem de tabela Kinesis:table_env.execute_sql( create_input_table(input_table_name, input_stream, input_region, stream_initpos) )A função
create_input_tableusa um comando SQL para criar uma tabela que é apoiada pela origem de transmissão:def create_input_table(table_name, stream_name, region, stream_initpos): return """ CREATE TABLE {0} ( ticker VARCHAR(6), price DOUBLE, event_time TIMESTAMP(3), WATERMARK FOR event_time AS event_time - INTERVAL '5' SECOND ) PARTITIONED BY (ticker) WITH ( 'connector' = 'kinesis', 'stream' = '{1}', 'aws.region' = '{2}', 'scan.stream.initpos' = '{3}', 'format' = 'json', 'json.timestamp-format.standard' = 'ISO-8601' ) """.format(table_name, stream_name, region, stream_initpos) }O aplicativo usa o operador
Slidepara agregar registros em uma janela deslizante especificada e retornar os registros agregados como um objeto de tabela:sliding_window_table = ( input_table .window( Slide.over("10.seconds") .every("5.seconds") .on("event_time") .alias("ten_second_window") ) .group_by("ticker, ten_second_window") .select("ticker, price.min as price, to_string(ten_second_window.end) as event_time") )O aplicativo usa o conector Kinesis Flink, do arquivo flink-sql-connector-kinesis-1.15.2.jar
.
Comprima e faça upload do código Python de transmissão do Apache Flink
Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.
Esta seção descreve como empacotar seu aplicativo Python.
Use seu aplicativo de compressão preferido para comprimir os arquivos
sliding-windows.pyeflink-sql-connector-kinesis-1.15.2.jar. Nomeie o arquivo comomyapp.zip.-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
myapp.zip, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink.
nota
O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.
Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
myapp.zip.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Propriedades, selecione Adicionar grupo.
-
Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor consumer.config.0input.stream.nameExampleInputStreamconsumer.config.0aws.regionus-west-2consumer.config.0scan.stream.initposLATESTSelecione Save (Salvar).
Em Propriedades, selecione Adicionar grupo novamente.
Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor producer.config.0output.stream.nameExampleOutputStreamproducer.config.0aws.regionus-west-2producer.config.0shard.count1Em Propriedades, selecione Adicionar grupo novamente. Em ID do grupo, digite
kinesis.analytics.flink.run.options. Esse grupo de propriedades especiais informa ao aplicativo onde encontrar seus recursos de código. Para obter mais informações, consulte Especifique seus arquivos de código.Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor kinesis.analytics.flink.run.optionspythonsliding-windows.pykinesis.analytics.flink.run.optionsjarfileflink-sql-connector-kinesis_1.15.2.jar-
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janelas deslizantes.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplo: envie dados de transmissão para o Amazon S3 em Python
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
Neste exercício, você cria um aplicativo Managed Service for Apache Flink em Python que transmite dados para um coletor do Amazon Simple Storage Service.
nota
Para configurar os pré-requisitos necessários para este exercício, primeiro conclua o exercício Tutorial: introdução ao uso do Python no Managed Service for Apache Flink.
Este tópico contém as seguintes seções:
Crie recursos dependentes
Antes de criar um aplicativo Managed Service for Apache Flink para este exercício, você cria os seguintes recursos dependentes:
Um fluxo de dados do Kinesis (
ExampleInputStream)Um bucket do Amazon S3 para armazenar o código e saída do aplicativo (
ka-app-code-)<username>
nota
O Managed Service for Apache Flink não pode gravar dados no Amazon S3 com a criptografia do lado do servidor habilitada no Managed Service for Apache Flink.
Você pode criar o fluxo de dados do Kinesis e um bucket do Amazon S3 usando o console. Para obter instruções sobre como criar esses recursos, consulte os tópicos a seguir:
Criando e atualizando fluxos de dados no Guia do desenvolvedor do Amazon Kinesis Data Streams. Nomeie seu fluxo de dados
ExampleInputStream.Para obter instruções, consulte Como criar um bucket do S3? no Guia do usuário do Amazon Simple Storage Service. Dê ao bucket do Amazon S3 um nome globalmente exclusivo anexando seu nome de login, como
ka-app-code-.<username>
Gravação de registros de amostra no fluxo de entrada
Nesta seção, será usado um script Python para gravar registros de amostra no fluxo para o aplicativo processar.
nota
Essa seção requer AWS SDK for Python (Boto)
nota
O script do Python nesta seção usa o AWS CLI. Você deve configurar seu AWS CLI para usar as credenciais da sua conta e a região padrão. Para configurar o seu AWS CLI, digite o seguinte:
aws configure
-
Crie um arquivo denominado
stock.pycom o conteúdo a seguir:import datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2')) -
Execute o script
stock.py:$ python stock.pyMantenha o script em execução enquanto você conclui o restante do tutorial.
Baixe e examine o código do aplicativo
O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/python/S3Sink.
O código do aplicativo está localizado no arquivo streaming-file-sink.py. Observe o seguinte sobre o código do aplicativo:
O aplicativo usa uma origem de tabela do Kinesis para ler o fluxo de origem. O trecho a seguir chama a função
create_source_tablepara criar a origem de tabela Kinesis:table_env.execute_sql( create_source_table(input_table_name, input_stream, input_region, stream_initpos) )A função
create_source_tableusa um comando SQL para criar uma tabela que é apoiada pela fonte de streamingimport datetime import json import random import boto3 STREAM_NAME = "ExampleInputStream" def get_data(): return { 'event_time': datetime.datetime.now().isoformat(), 'ticker': random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV']), 'price': round(random.random() * 100, 2)} def generate(stream_name, kinesis_client): while True: data = get_data() print(data) kinesis_client.put_record( StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey") if __name__ == '__main__': generate(STREAM_NAME, boto3.client('kinesis', region_name='us-west-2'))O aplicativo usa o conector
filesystempara enviar registros para um bucket do Amazon S3:def create_sink_table(table_name, bucket_name): return """ CREATE TABLE {0} ( ticker VARCHAR(6), price DOUBLE, event_time VARCHAR(64) ) PARTITIONED BY (ticker) WITH ( 'connector'='filesystem', 'path'='s3a://{1}/', 'format'='json', 'sink.partition-commit.policy.kind'='success-file', 'sink.partition-commit.delay' = '1 min' ) """.format(table_name, bucket_name)O aplicativo usa o conector Kinesis Flink, do arquivo flink-sql-connector-kinesis-1.15.2.jar
.
Comprima e faça upload do código Python de transmissão do Apache Flink
Nesta seção, você faz o upload do seu aplicativo no bucket do Amazon S3 que você criou na seção Crie recursos dependentes.
Use seu aplicativo de compressão preferido para comprimir os arquivos
streaming-file-sink.pye flink-sql-connector-kinesis-1.15.2.jar. Nomeie o arquivo como myapp.zip.-
No console do Amazon S3, selecione o bucket ka-app-code-
<username>e selecione Fazer upload. -
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
myapp.zip, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Criar e executar a aplicação do Managed Service for Apache Flink
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Runtime, selecione Apache Flink.
nota
O Managed Service for Apache Flink usa o Apache Flink versão 1.15.2.
Deixe o menu suspenso de versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Configure o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
myapp.zip.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Propriedades, selecione Adicionar grupo.
-
Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor consumer.config.0input.stream.nameExampleInputStreamconsumer.config.0aws.regionus-west-2consumer.config.0scan.stream.initposLATESTSelecione Save (Salvar).
Em Propriedades, selecione Adicionar grupo novamente. Em ID do grupo, digite
kinesis.analytics.flink.run.options. Esse grupo de propriedades especiais informa ao aplicativo onde encontrar seus recursos de código. Para obter mais informações, consulte Especifique seus arquivos de código.Insira as seguintes propriedades e valores de aplicativo:
ID do grupo Chave Valor kinesis.analytics.flink.run.optionspythonstreaming-file-sink.pykinesis.analytics.flink.run.optionsjarfileS3Sink/lib/flink-sql-connector-kinesis-1.15.2.jarEm Propriedades, selecione Adicionar grupo novamente. Em ID do grupo, digite
sink.config.0. Esse grupo de propriedades especiais informa ao aplicativo onde encontrar seus recursos de código. Para obter mais informações, consulte Especifique seus arquivos de código.Insira as seguintes propriedades e valores do aplicativo: (substitua o
bucket-namepelo nome real do seu bucket do Amazon S3).ID do grupo Chave Valor sink.config.0output.bucket.namebucket-name-
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em Registro em log do CloudWatch, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Esse fluxo de logs é usado para monitorar o aplicativo. Esse não é o mesmo fluxo de logs que o aplicativo usa para enviar resultados.
Editar a política do IAM
Edite a política do IAM para adicionar permissões de acesso aos fluxos de dados do Kinesis.
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Você pode verificar as métricas do Managed Service for Apache Flink no console do CloudWatch para confirmar que o aplicativo está funcionando.
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janelas deslizantes.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seu fluxo de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Exclua seus objetos e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplos do Scala
Os exemplos a seguir demonstram como criar aplicativos usando o Scala com o Apache Flink.
Tópicos
Exemplo: criação de uma janela em cascata no Scala
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
nota
A partir da versão 1.15, o Flink não tem mais o Scala. Agora, os aplicativos podem usar a API Java de qualquer versão do Scala. O Flink ainda usa o Scala em alguns componentes importantes internamente, mas não expõe o Scala no carregador de classes do código do usuário. Por isso, os usuários precisam adicionar dependências do Scala em seus arquivos jar.
Para obter mais informações sobre as mudanças do Scala no Flink 1.15, consulte Sem o Scala na versão 1.15
Neste exercício, você criará um aplicativo de streaming simples que usa o Scala 3.2.0 e a API Java de DataStream do Flink. O aplicativo lê os dados do fluxo do Kinesis, os agrega usando janelas deslizantes e grava os resultados no fluxo de saída do Kinesis.
nota
Para configurar os pré-requisitos necessários para este exercício, conclua primeiro o exercício Introdução (Scala).
Este tópico contém as seguintes seções:
Baixe e examine o código do aplicativo
O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/scala/TumblingWindow.
Observe o seguinte sobre o código do aplicativo:
Um arquivo
build.sbtcontém informações sobre a configuração e as dependências do aplicativo, incluindo as bibliotecas do Managed Service for Apache Flink.O arquivo
BasicStreamingJob.scalacontém o método principal que define a funcionalidade do aplicativo.O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
private def createSource: FlinkKinesisConsumer[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val inputProperties = applicationProperties.get("ConsumerConfigProperties") new FlinkKinesisConsumer[String](inputProperties.getProperty(streamNameKey, defaultInputStreamName), new SimpleStringSchema, inputProperties) }O aplicativo também usa um coletor do Kinesis para gravar no fluxo de resultados. O trecho a seguir cria o coletor do Kinesis:
private def createSink: KinesisStreamsSink[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val outputProperties = applicationProperties.get("ProducerConfigProperties") KinesisStreamsSink.builder[String] .setKinesisClientProperties(outputProperties) .setSerializationSchema(new SimpleStringSchema) .setStreamName(outputProperties.getProperty(streamNameKey, defaultOutputStreamName)) .setPartitionKeyGenerator((element: String) => String.valueOf(element.hashCode)) .build }O aplicativo usa o operador de janela para encontrar a contagem de valores para cada símbolo de ação em uma janela em cascata de cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:
environment.addSource(createSource) .map { value => val jsonNode = jsonParser.readValue(value, classOf[JsonNode]) new Tuple2[String, Int](jsonNode.get("ticker").toString, 1) } .returns(Types.TUPLE(Types.STRING, Types.INT)) .keyBy(v => v.f0) // Logically partition the stream for each ticker .window(TumblingProcessingTimeWindows.of(Time.seconds(10))) .sum(1) // Sum the number of tickers per partition .map { value => value.f0 + "," + value.f1.toString + "\n" } .sinkTo(createSink)O aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.
O aplicativo cria conectores de origem e de coletores usando propriedades dinâmicas do aplicativo. As propriedades de runtime do aplicativo para ler e configurar os conectores. Para obter mais informações sobre as propriedades de runtime, consulte Propriedades de runtime.
Compile e faça o upload do código do aplicativo
Nesta seção, você compila e faz o upload do código do aplicativo para um bucket do Amazon S3.
Compilar o código do aplicativo
Use a ferramenta de construção SBT
Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Você pode compilar e empacotar seu código com o SBT:
sbt assembly-
Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:
target/scala-3.2.0/tumbling-window-scala-1.0.jar
Faça o upload do código Scala do Apache Flink Streaming
Nesta seção, você cria um bucket do Amazon S3 e faz upload do código do seu aplicativo.
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione Criar bucket
Insira
ka-app-code-<username>no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.
Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.
Selecione Criar bucket.
Selecione o bucket
ka-app-code-<username>e, em seguida, selecione Upload.-
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
tumbling-window-scala-1.0.jar, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Crie e execute o aplicativo (console)
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Descrição, insira
My Scala test app. -
Em Runtime, selecione Apache Flink.
-
Deixe a versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Configure o aplicativo
Siga o procedimento a seguir para configurar o aplicativo.
Configurar o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
tumbling-window-scala-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Propriedades, selecione Adicionar grupo.
-
Insira o seguinte:
ID do grupo Chave Valor ConsumerConfigPropertiesinput.stream.nameExampleInputStreamConsumerConfigPropertiesaws.regionus-west-2ConsumerConfigPropertiesflink.stream.initposLATESTSelecione Save (Salvar).
Em Propriedades, selecione Adicionar grupo novamente.
Insira o seguinte:
ID do grupo Chave Valor ProducerConfigPropertiesoutput.stream.nameExampleOutputStreamProducerConfigPropertiesaws.regionus-west-2-
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em CloudWatch logging, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Editar a política do IAM
Edite a política do IAM para adicionar permissões para acessar o bucket do Amazon S3.
Editar a política do IAM para adicionar permissões do bucket do S3
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Interromper o aplicativo
Para interromper o aplicativo, na página Meu aplicativo, selecione Parar. Confirme a ação.
Crie e execute o aplicativo (CLI)
Nesta seção, você usa a AWS Command Line Interface para criar e executar o aplicativo Flink do Managed Service for Apache Flink. Use o comando AWS CLI kinesisanalyticsv2 para criar e interagir com os aplicativos Managed Service para aplicativos Apache Flink.
Criar uma política de permissões
nota
Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.
Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação de ler no fluxo de origem, e outra que concede permissões para ações de gravação no fluxo de coleta. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.
Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos nomes do recurso da Amazon Resources Names (ARNs) (012345678901)pelo ID da sua conta. A função MF-stream-rw-role de execução do serviço deve ser adaptada à função específica do cliente.
{ "ApplicationName": "tumbling_window", "ApplicationDescription": "Scala tumbling window application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "tumbling-window-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }
Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.
Criar um perfil do IAM
Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.
O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.
Anexe a política de permissões que criou na seção anterior a essa função.
Para criar uma perfil do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. No painel de navegação, selecione Perfis e Criar perfil.
Em Selecionar tipo de identidade de confiança, selecione AWSServiço
Em Selecionar o serviço que usará esta função, selecione Kinesis.
Em Selecione seu caso de uso, selecione Managed Service for Apache Flink.
Selecione Next: Permissions (Próximo: permissões).
Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.
Na página Criar função, insira
MF-stream-rw-rolepara o Nome da função. Selecione Criar função.Foi criado um perfil do IAM chamado
MF-stream-rw-role. Em seguida, você atualiza as políticas de confiança e de permissões para a funçãoAnexe a política de permissões à função.
nota
Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, você anexa a política que criou na etapa anterior, Crie uma política de permissões.
Na página Resumo, selecione a guia Permissões.
Selecione Attach Policies.
Na caixa de pesquisa, insira
AKReadSourceStreamWriteSinkStream(a política criada na seção anterior).Selecione a política
AKReadSourceStreamWriteSinkStreame selecione Anexar política.
Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.
Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.
Criar o aplicativo
Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (nome do usuário) pelo sufixo que você selecionou na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta. O ServiceExecutionRole deve incluir o perfil do usuário do IAM que você criou na seção anterior.
"ApplicationName": "tumbling_window", "ApplicationDescription": "Scala getting started application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "tumbling-window-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }
Execute o CreateApplication com a seguinte solicitação para criar o aplicativo:
aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json
O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.
Iniciar o aplicativo
Nesta seção, você usa a ação StartApplication para iniciar o aplicativo.
Para iniciar o aplicativo
Salve o seguinte código JSON em um arquivo chamado
start_request.json.{ "ApplicationName": "tumbling_window", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }Execute a ação
StartApplicationcom a solicitação anterior para iniciar o aplicativo:aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json
O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.
Interromper o aplicativo
Nesta seção, você usa a ação StopApplication para interromper o aplicativo.
Como interromper o aplicativo
Salve o seguinte código JSON em um arquivo chamado
stop_request.json.{ "ApplicationName": "tumbling_window" }Execute a ação
StopApplicationcom a solicitação anterior para interromper o aplicativo:aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json
O aplicativo agora está interrompido.
Adicionar uma opção de registro em log do CloudWatch
Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter informações sobre o uso do CloudWatch Logs com seu aplicativo, consulte Configurando o log de aplicativos.
Atualizar propriedades do ambiente
Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.
Para atualizar propriedades de ambiente para o aplicativo
Salve o seguinte código JSON em um arquivo chamado
update_properties_request.json.{"ApplicationName": "tumbling_window", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } } }Execute a ação
UpdateApplicationcom a solicitação anterior para atualizar as propriedades do ambiente:aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo
Quando você precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação CLI UpdateApplication.
nota
Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.
Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.
O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Crie recursos dependentes.
{ "ApplicationName": "tumbling_window", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "tumbling-window-scala-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janela em cascata.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplo: criação de uma janela deslizante em Scala
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
nota
A partir da versão 1.15, o Flink não tem mais o Scala. Agora, os aplicativos podem usar a API Java de qualquer versão do Scala. O Flink ainda usa o Scala em alguns componentes importantes internamente, mas não expõe o Scala no carregador de classes do código do usuário. Por isso, os usuários precisam adicionar dependências do Scala em seus arquivos jar.
Para obter mais informações sobre as mudanças do Scala no Flink 1.15, consulte Sem o Scala na versão 1.15
Neste exercício, você criará um aplicativo de streaming simples que usa o Scala 3.2.0 e a API Java de DataStream do Flink. O aplicativo lê os dados do fluxo do Kinesis, os agrega usando janelas deslizantes e grava os resultados no fluxo de saída do Kinesis.
nota
Para configurar os pré-requisitos necessários para este exercício, conclua primeiro o exercício Introdução (Scala).
Este tópico contém as seguintes seções:
Baixe e examine o código do aplicativo
O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/scala/SlidingWindow.
Observe o seguinte sobre o código do aplicativo:
Um arquivo
build.sbtcontém informações sobre a configuração e as dependências do aplicativo, incluindo as bibliotecas do Managed Service for Apache Flink.O arquivo
BasicStreamingJob.scalacontém o método principal que define a funcionalidade do aplicativo.O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
private def createSource: FlinkKinesisConsumer[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val inputProperties = applicationProperties.get("ConsumerConfigProperties") new FlinkKinesisConsumer[String](inputProperties.getProperty(streamNameKey, defaultInputStreamName), new SimpleStringSchema, inputProperties) }O aplicativo também usa um coletor do Kinesis para gravar no fluxo de resultados. O trecho a seguir cria o coletor do Kinesis:
private def createSink: KinesisStreamsSink[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val outputProperties = applicationProperties.get("ProducerConfigProperties") KinesisStreamsSink.builder[String] .setKinesisClientProperties(outputProperties) .setSerializationSchema(new SimpleStringSchema) .setStreamName(outputProperties.getProperty(streamNameKey, defaultOutputStreamName)) .setPartitionKeyGenerator((element: String) => String.valueOf(element.hashCode)) .build }O aplicativo usa o operador de janela para encontrar a contagem de valores para cada símbolo de ação em uma janela de dez segundos que desliza por cinco segundos. O código a seguir cria o operador e envia os dados agregados para um novo coletor de fluxo de dados do Kinesis:
environment.addSource(createSource) .map { value => val jsonNode = jsonParser.readValue(value, classOf[JsonNode]) new Tuple2[String, Double](jsonNode.get("ticker").toString, jsonNode.get("price").asDouble) } .returns(Types.TUPLE(Types.STRING, Types.DOUBLE)) .keyBy(v => v.f0) // Logically partition the stream for each word .window(SlidingProcessingTimeWindows.of(Time.seconds(10), Time.seconds(5))) .min(1) // Calculate minimum price per ticker over the window .map { value => value.f0 + String.format(",%.2f", value.f1) + "\n" } .sinkTo(createSink)O aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.
O aplicativo cria conectores de origem e de coletores usando propriedades dinâmicas do aplicativo. As propriedades de runtime do aplicativo para ler e configurar os conectores. Para obter mais informações sobre as propriedades de runtime, consulte Propriedades de runtime.
Compile e faça o upload do código do aplicativo
Nesta seção, você compila e faz o upload do código do aplicativo para um bucket do Amazon S3.
Compilar o código do aplicativo
Use a ferramenta de construção SBT
Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Você pode compilar e empacotar seu código com o SBT:
sbt assembly-
Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:
target/scala-3.2.0/sliding-window-scala-1.0.jar
Faça o upload do código Scala do Apache Flink Streaming
Nesta seção, você cria um bucket do Amazon S3 e faz upload do código do seu aplicativo.
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione Criar bucket
Insira
ka-app-code-<username>no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.
Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.
Selecione Criar bucket.
Selecione o bucket
ka-app-code-<username>e, em seguida, selecione Upload.-
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
sliding-window-scala-1.0.jar, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Crie e execute o aplicativo (console)
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Descrição, insira
My Scala test app. -
Em Runtime, selecione Apache Flink.
-
Deixe a versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Configure o aplicativo
Siga o procedimento a seguir para configurar o aplicativo.
Configurar o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
sliding-window-scala-1.0.jar..
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Propriedades, selecione Adicionar grupo.
-
Insira o seguinte:
ID do grupo Chave Valor ConsumerConfigPropertiesinput.stream.nameExampleInputStreamConsumerConfigPropertiesaws.regionus-west-2ConsumerConfigPropertiesflink.stream.initposLATESTSelecione Save (Salvar).
Em Propriedades, selecione Adicionar grupo novamente.
Insira o seguinte:
ID do grupo Chave Valor ProducerConfigPropertiesoutput.stream.nameExampleOutputStreamProducerConfigPropertiesaws.regionus-west-2-
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em CloudWatch logging, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Editar a política do IAM
Edite a política do IAM para adicionar permissões para acessar o bucket do Amazon S3.
Editar a política do IAM para adicionar permissões do bucket do S3
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Interromper o aplicativo
Para interromper o aplicativo, na página Meu aplicativo, selecione Parar. Confirme a ação.
Crie e execute o aplicativo (CLI)
Nesta seção, você usa a AWS Command Line Interface para criar e executar o aplicativo Flink do Managed Service for Apache Flink. Use o comando AWS CLI kinesisanalyticsv2 para criar e interagir com os aplicativos Managed Service para aplicativos Apache Flink.
Criar uma política de permissões
nota
Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.
Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação de ler no fluxo de origem, e outra que concede permissões para ações de gravação no fluxo de coleta. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.
Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos nomes do recurso da Amazon Resources Names (ARNs) (012345678901)pelo ID da sua conta.
{ "ApplicationName": "sliding_window", "ApplicationDescription": "Scala sliding window application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "sliding-window-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }
Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.
Criar um perfil do IAM
Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.
O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.
Anexe a política de permissões que criou na seção anterior a essa função.
Para criar uma perfil do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. No painel de navegação, selecione Perfis e Criar perfil.
Em Selecionar tipo de identidade de confiança, selecione AWSServiço
Em Selecionar o serviço que usará esta função, selecione Kinesis.
Em Selecione seu caso de uso, selecione Managed Service for Apache Flink.
Selecione Next: Permissions (Próximo: permissões).
Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.
Na página Criar função, insira
MF-stream-rw-rolepara o Nome da função. Selecione Criar função.Foi criado um perfil do IAM chamado
MF-stream-rw-role. Em seguida, você atualiza as políticas de confiança e de permissões para a funçãoAnexe a política de permissões à função.
nota
Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, você anexa a política que criou na etapa anterior, Crie uma política de permissões.
Na página Resumo, selecione a guia Permissões.
Selecione Attach Policies.
Na caixa de pesquisa, insira
AKReadSourceStreamWriteSinkStream(a política criada na seção anterior).Selecione a política
AKReadSourceStreamWriteSinkStreame selecione Anexar política.
Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.
Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.
Criar o aplicativo
Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (nome do usuário) pelo sufixo que você selecionou na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta.
{ "ApplicationName": "sliding_window", "ApplicationDescription": "Scala sliding_window application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "sliding-window-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }
Execute o CreateApplication com a seguinte solicitação para criar o aplicativo:
aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json
O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.
Iniciar o aplicativo
Nesta seção, você usa a ação StartApplication para iniciar o aplicativo.
Para iniciar o aplicativo
Salve o seguinte código JSON em um arquivo chamado
start_request.json.{ "ApplicationName": "sliding_window", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }Execute a ação
StartApplicationcom a solicitação anterior para iniciar o aplicativo:aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json
O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.
Interromper o aplicativo
Nesta seção, você usa a ação StopApplication para interromper o aplicativo.
Como interromper o aplicativo
Salve o seguinte código JSON em um arquivo chamado
stop_request.json.{ "ApplicationName": "sliding_window" }Execute a ação
StopApplicationcom a solicitação anterior para interromper o aplicativo:aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json
O aplicativo agora está interrompido.
Adicionar uma opção de registro em log do CloudWatch
Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter informações sobre o uso do CloudWatch Logs com seu aplicativo, consulte Configurando o log de aplicativos.
Atualizar propriedades do ambiente
Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.
Para atualizar propriedades de ambiente para o aplicativo
Salve o seguinte código JSON em um arquivo chamado
update_properties_request.json.{"ApplicationName": "sliding_window", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleOutputStream" } } ] } } }Execute a ação
UpdateApplicationcom a solicitação anterior para atualizar as propriedades do ambiente:aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo
Quando você precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação CLI UpdateApplication.
nota
Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.
Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.
O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Crie recursos dependentes.
{ "ApplicationName": "sliding_window", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janelas deslizantes.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.
Exemplo: envie dados de transmissão para o Amazon S3 no Scala
nota
Para obter exemplos atuais, consulte Exemplos de como criar e trabalhar com aplicativos no Managed Service for Apache Flink..
nota
A partir da versão 1.15, o Flink não tem mais o Scala. Agora, os aplicativos podem usar a API Java de qualquer versão do Scala. O Flink ainda usa o Scala em alguns componentes importantes internamente, mas não expõe o Scala no carregador de classes do código do usuário. Por isso, os usuários precisam adicionar dependências do Scala em seus arquivos jar.
Para obter mais informações sobre as mudanças do Scala no Flink 1.15, consulte Sem o Scala na versão 1.15
Neste exercício, você criará um aplicativo de streaming simples que usa o Scala 3.2.0 e a API Java de DataStream do Flink. O aplicativo lê os dados do fluxo do Kinesis, os agrega usando janelas deslizantes e grava os resultados no S3.
nota
Para configurar os pré-requisitos necessários para este exercício, conclua primeiro o exercício Introdução (Scala). Você só precisa criar uma pasta adicional data/ no bucket do Amazon S3 ka-app-code-<username>.
Este tópico contém as seguintes seções:
Baixe e examine o código do aplicativo
O código Python do aplicativo desta amostra está disponível no GitHub. Para fazer download do código do aplicativo, faça o seguinte:
Instale o cliente do Git, se isso ainda não foi feito. Para obter mais informações, consulte Instalando o Git
. Duplique o repositório remoto com o seguinte comando:
git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-examples.gitNavegue até o diretório
amazon-kinesis-data-analytics-java-examples/scala/S3Sink.
Observe o seguinte sobre o código do aplicativo:
Um arquivo
build.sbtcontém informações sobre a configuração e as dependências do aplicativo, incluindo as bibliotecas do Managed Service for Apache Flink.O arquivo
BasicStreamingJob.scalacontém o método principal que define a funcionalidade do aplicativo.O aplicativo usa uma origem do Kinesis para ler o fluxo de origem. O trecho a seguir cria a origem do Kinesis:
private def createSource: FlinkKinesisConsumer[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val inputProperties = applicationProperties.get("ConsumerConfigProperties") new FlinkKinesisConsumer[String](inputProperties.getProperty(streamNameKey, defaultInputStreamName), new SimpleStringSchema, inputProperties) }O aplicativo também usa um StreamingFileSink para gravar em um bucket do Amazon S3:
def createSink: StreamingFileSink[String] = { val applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties val s3SinkPath = applicationProperties.get("ProducerConfigProperties").getProperty("s3.sink.path") StreamingFileSink .forRowFormat(new Path(s3SinkPath), new SimpleStringEncoder[String]("UTF-8")) .build() }O aplicativo cria conectores de origem e de destino para acessar recursos externos usando um objeto StreamExecutionEnvironment.
O aplicativo cria conectores de origem e de coletores usando propriedades dinâmicas do aplicativo. As propriedades de runtime do aplicativo para ler e configurar os conectores. Para obter mais informações sobre as propriedades de runtime, consulte Propriedades de runtime.
Compile e faça o upload do código do aplicativo
Nesta seção, você compila e faz o upload do código do aplicativo para um bucket do Amazon S3.
Compilar o código do aplicativo
Use a ferramenta de construção SBT
Para usar o seu código de aplicativo, compile-o e empacote-o em um arquivo JAR. Você pode compilar e empacotar seu código com o SBT:
sbt assembly-
Se o aplicativo for compilado com êxito, o arquivo a seguir é criado:
target/scala-3.2.0/s3-sink-scala-1.0.jar
Faça o upload do código Scala do Apache Flink Streaming
Nesta seção, você cria um bucket do Amazon S3 e faz upload do código do seu aplicativo.
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione Criar bucket
Insira
ka-app-code-<username>no campo Nome do bucket. Adicione um sufixo para o nome do bucket, como o nome do usuário, para torná-lo globalmente exclusivo. Selecione Próximo.Na etapa Configurar opções, mantenha as configurações como estão e selecione Próximo.
Na etapa Definir permissões, mantenha as configurações como estão e selecione Próximo.
Selecione Criar bucket.
Selecione o bucket
ka-app-code-<username>e, em seguida, selecione Upload.-
Na etapa Selecionar arquivos, selecione Adicionar arquivos. Navegue até o arquivo
s3-sink-scala-1.0.jar, criado na etapa anterior. Você não precisa alterar nenhuma das configurações para o objeto, em seguida, selecione Upload.
O código passa a ser armazenado em um bucket do Amazon S3 que pode ser acessado pelo aplicativo.
Crie e execute o aplicativo (console)
Siga estas etapas para criar, configurar, atualizar e executar o aplicativo usando o console.
Criar o aplicativo
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
-
No painel do Managed Service for Apache Flink, selecione Criar aplicativo de analytics.
-
Na página Managed Service for Apache Flink - Criar aplicativo, forneça os detalhes do aplicativo da seguinte forma:
-
Em Nome do aplicativo, insira
MyApplication. -
Em Descrição, insira
My java test app. -
Em Runtime, selecione Apache Flink.
-
Deixe a versão como Apache Flink versão 1.15.2 (versão recomendada).
-
-
Em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Selecione Create application (Criar aplicativo).
nota
Ao criar um aplicativo Managed Service for Apache Flink usando o console, você tem a opção de ter um perfil do IAM e uma política criada para seu aplicativo. O aplicativo usa essa função e política para acessar os recursos dependentes. Esses recursos do IAM são nomeados usando o nome do aplicativo e a região da seguinte forma:
-
Política:
kinesis-analytics-service-MyApplication-us-west-2 -
perfil:
kinesisanalytics-MyApplication-us-west-2
Configure o aplicativo
Siga o procedimento a seguir para configurar o aplicativo.
Configurar o aplicativo
-
Na página MyApplication, selecione Configure (Configurar).
-
Na página Configurar aplicativo, forneça o Local do código:
-
Em Bucket do Amazon S3, insira
ka-app-code-.<username> -
Em Caminho do objeto do Amazon S3, insira
s3-sink-scala-1.0.jar.
-
-
Na seção Acesso aos recursos do aplicativo, em Permissões de acesso, selecione Criar/atualizar o perfil do IAM
kinesis-analytics-MyApplication-us-west-2. -
Em Propriedades, selecione Adicionar grupo.
-
Insira o seguinte:
ID do grupo Chave Valor ConsumerConfigPropertiesinput.stream.nameExampleInputStreamConsumerConfigPropertiesaws.regionus-west-2ConsumerConfigPropertiesflink.stream.initposLATESTSelecione Save (Salvar).
-
Em Propriedades, selecione Adicionar grupo.
-
Insira o seguinte:
ID do grupo Chave Valor ProducerConfigPropertiess3.sink.paths3a://ka-app-code-<user-name>/data -
Em Monitoramento, confirme se Nível de monitoramento de métricas está definido como Aplicativo.
-
Em CloudWatch logging, marque a caixa de seleção Habilitar.
-
Selecione Atualizar.
nota
Ao optar por habilitar o registro em log do Amazon CloudWatch, o Managed Service for Apache Flink cria um grupo de logs e um fluxo de logs para você. Os nomes desses recursos são os seguintes:
-
Grupo de logs:
/aws/kinesis-analytics/MyApplication -
Fluxo de logs:
kinesis-analytics-log-stream
Editar a política do IAM
Edite a política do IAM para adicionar permissões para acessar o bucket do Amazon S3.
Editar a política do IAM para adicionar permissões do bucket do S3
Abra o console do IAM em https://console.aws.amazon.com/iam/
. -
Selecione Políticas. Selecione a política
kinesis-analytics-service-MyApplication-us-west-2que o console criou na seção anterior. -
Na página Resumo, selecione Editar política. Selecione a guia JSON.
-
Adicione a seção destacada do exemplo de política a seguir à política. Substitua os exemplos de IDs de conta (
012345678901) pelo ID da conta.
Execute o aplicativo
O gráfico de tarefas do Flink pode ser visualizado executando o aplicativo, abrindo o painel do Apache Flink e selecionando a tarefa desejada do Flink.
Interromper o aplicativo
Para interromper o aplicativo, na página Meu aplicativo, selecione Parar. Confirme a ação.
Crie e execute o aplicativo (CLI)
Nesta seção, você usa a AWS Command Line Interface para criar e executar o aplicativo Flink do Managed Service for Apache Flink. Use o comando AWS CLI kinesisanalyticsv2 para criar e interagir com os aplicativos Managed Service para aplicativos Apache Flink.
Criar uma política de permissões
nota
Você deve criar uma política de permissões e uma função para o seu aplicativo. Se você não criar esses recursos do IAM, seu aplicativo não poderá acessar seus fluxos de logs e dados.
Primeiro, crie uma política de permissões com duas instruções: uma que concede permissões para a ação de ler no fluxo de origem, e outra que concede permissões para ações de gravação no fluxo de coleta. Em seguida, anexe a política a um perfil do IAM (que será criado na próxima seção). Assim, ao assumir o perfil, o serviço Managed Service for Apache Flink terá as permissões necessárias para ler o fluxo de origem e gravar no fluxo de coleta.
Use o código a seguir para criar a política de permissões AKReadSourceStreamWriteSinkStream. Substitua username pelo nome de usuário usado para criar o bucket do Amazon S3 e armazenar o código do aplicativo. Substitua o ID da conta nos nomes do recurso da Amazon Resources Names (ARNs) (012345678901)pelo ID da sua conta.
Para obter instruções passo a passo para criar uma política de permissões, consulte Tutorial: crie e anexe a sua primeira política gerenciada pelo cliente no Guia do usuário do IAM.
Criar um perfil do IAM
Nesta seção, você cria um perfil do IAM que o aplicativo Managed Service for Apache Flink pode assumir para ler um fluxo de origem e gravar no fluxo de coleta.
O Managed Service for Apache Flink não pode acessar seu fluxo sem permissões. Essas permissões são concedidas usando um perfil do IAM. Cada perfil do IAM tem duas políticas anexadas. A política de confiança concede ao Managed Service for Apache Flink permissão para assumir o perfil, e a política de permissões determina o que o serviço pode fazer depois de assumir a função.
Anexe a política de permissões que criou na seção anterior a essa função.
Para criar uma perfil do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. No painel de navegação, selecione Perfis e Criar perfil.
Em Selecionar tipo de identidade de confiança, selecione AWSServiço
Em Selecionar o serviço que usará esta função, selecione Kinesis.
Em Selecione seu caso de uso, selecione Managed Service for Apache Flink.
Selecione Next: Permissions (Próximo: permissões).
Na página Attach permissions policies, selecione Next: Review. É possível anexar políticas de permissões depois de criar a função.
Na página Criar função, insira
MF-stream-rw-rolepara o Nome da função. Selecione Criar função.Foi criado um perfil do IAM chamado
MF-stream-rw-role. Em seguida, você atualiza as políticas de confiança e de permissões para a funçãoAnexe a política de permissões à função.
nota
Para este exercício, o Managed Service for Apache Flink assume esse perfil para ler dados de um fluxo de dados do Kinesis (origem) e gravar a saída em outro fluxo de dados do Kinesis. Depois, você anexa a política que criou na etapa anterior, Crie uma política de permissões.
Na página Resumo, selecione a guia Permissões.
Selecione Attach Policies.
Na caixa de pesquisa, insira
AKReadSourceStreamWriteSinkStream(a política criada na seção anterior).Selecione a política
AKReadSourceStreamWriteSinkStreame selecione Anexar política.
Agora você criou a função de execução de serviço que seu aplicativo usa para acessar os recursos. Anote o ARN da nova função.
Para obter instruções passo a passo sobre como criar um perfil, consulte Criação de um perfil do IAM (console) no Guia do usuário do IAM.
Criar o aplicativo
Salve o seguinte código JSON em um arquivo chamado create_request.json. Substitua o ARN da função de amostra pelo ARN da função criada anteriormente. Substitua o sufixo do ARN do bucket (nome do usuário) pelo sufixo que você selecionou na seção anterior. Substitua o ID da conta de exemplo (012345678901) na função de execução do serviço pelo ID da conta.
{ "ApplicationName": "s3_sink", "ApplicationDescription": "Scala tumbling window application", "RuntimeEnvironment": "FLINK-1_15", "ServiceExecutionRole": "arn:aws:iam::012345678901:role/MF-stream-rw-role", "ApplicationConfiguration": { "ApplicationCodeConfiguration": { "CodeContent": { "S3ContentLocation": { "BucketARN": "arn:aws:s3:::ka-app-code-username", "FileKey": "s3-sink-scala-1.0.jar" } }, "CodeContentType": "ZIPFILE" }, "EnvironmentProperties": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "s3.sink.path" : "s3a://ka-app-code-<username>/data" } } ] } }, "CloudWatchLoggingOptions": [ { "LogStreamARN": "arn:aws:logs:us-west-2:012345678901:log-group:MyApplication:log-stream:kinesis-analytics-log-stream" } ] }
Execute o CreateApplication com a seguinte solicitação para criar o aplicativo:
aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json
O aplicativo agora é criado. Inicie o aplicativo na próxima etapa.
Iniciar o aplicativo
Nesta seção, você usa a ação StartApplication para iniciar o aplicativo.
Para iniciar o aplicativo
Salve o seguinte código JSON em um arquivo chamado
start_request.json.{{ "ApplicationName": "s3_sink", "RunConfiguration": { "ApplicationRestoreConfiguration": { "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT" } } }Execute a ação
StartApplicationcom a solicitação anterior para iniciar o aplicativo:aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json
O aplicativo agora está em execução. É possível verificar as métricas do Managed Service for Apache Flink no console do Amazon CloudWatch para verificar se o aplicativo está funcionando.
Interromper o aplicativo
Nesta seção, você usa a ação StopApplication para interromper o aplicativo.
Como interromper o aplicativo
Salve o seguinte código JSON em um arquivo chamado
stop_request.json.{ "ApplicationName": "s3_sink" }Execute a ação
StopApplicationcom a solicitação anterior para interromper o aplicativo:aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json
O aplicativo agora está interrompido.
Adicionar uma opção de registro em log do CloudWatch
Você pode usar o AWS CLI para adicionar um fluxo de logs do Amazon CloudWatch ao seu aplicativo. Para obter informações sobre o uso do CloudWatch Logs com seu aplicativo, consulte Configurando o log de aplicativos.
Atualizar propriedades do ambiente
Nesta seção, você usa a ação UpdateApplication para alterar as propriedades do ambiente do aplicativo sem recompilar o código do aplicativo. Neste exemplo, você altera a região dos fluxos de origem e destino.
Para atualizar propriedades de ambiente para o aplicativo
Salve o seguinte código JSON em um arquivo chamado
update_properties_request.json.{"ApplicationName": "s3_sink", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "EnvironmentPropertyUpdates": { "PropertyGroups": [ { "PropertyGroupId": "ConsumerConfigProperties", "PropertyMap" : { "aws.region" : "us-west-2", "stream.name" : "ExampleInputStream", "flink.stream.initpos" : "LATEST" } }, { "PropertyGroupId": "ProducerConfigProperties", "PropertyMap" : { "s3.sink.path" : "s3a://ka-app-code-<username>/data" } } ] } } }Execute a ação
UpdateApplicationcom a solicitação anterior para atualizar as propriedades do ambiente:aws kinesisanalyticsv2 update-application --cli-input-json file://update_properties_request.json
Atualizar o código do aplicativo
Quando você precisar atualizar o código do aplicativo com uma nova versão do pacote do código, use a ação CLI UpdateApplication.
nota
Para carregar uma nova versão do código do aplicativo com o mesmo nome de arquivo, você deve especificar a nova versão do objeto. Para obter mais informações sobre o uso de versões de objetos do Amazon S3, consulte Como ativar ou desativar o controle de versão.
Para usar o AWS CLI, exclua seu pacote do código anterior do bucket do Amazon S3, faça o upload da nova versão e chame UpdateApplication, especificando o mesmo nome de objeto e bucket do Amazon S3 e a nova versão do objeto. O aplicativo será reiniciado com o novo pacote de código.
O exemplo de solicitação da UpdateApplication ação a seguir recarrega o código do aplicativo e reinicia o aplicativo. Atualize o CurrentApplicationVersionId para a versão atual do aplicativo. Você pode verificar a versão atual do aplicativo usando as ações DescribeApplication ou ListApplications. Atualize o sufixo do nome do bucket (<username>) com o sufixo que você selecionou na seção Crie recursos dependentes.
{ "ApplicationName": "s3_sink", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationCodeConfigurationUpdate": { "CodeContentUpdate": { "S3ContentLocationUpdate": { "BucketARNUpdate": "arn:aws:s3:::ka-app-code-username", "FileKeyUpdate": "s3-sink-scala-1.0.jar", "ObjectVersionUpdate": "SAMPLEUehYngP87ex1nzYIGYgfhypvDU" } } } } }
Limpar recursos da AWS
Esta seção inclui procedimentos para limpar recursos AWS criados no tutorial Janela em cascata.
Este tópico contém as seguintes seções:
Exclua o seu aplicativo Managed Service for Apache Flink
Faça login no Console de gerenciamento da AWS e abra o console do Amazon MSF em https://console.aws.amazon.com/flink.
No painel do Managed Service for Apache Flink, selecione MyApplication.
Na página do aplicativo, selecione Excluir e, em seguida, confirme a exclusão.
Exclua seus fluxos de dados do Kinesis
Abra o console do Kinesis em https://console.aws.amazon.com/kinesis
. No painel Kinesis Data Streams, selecione ExampleInputStream.
Na página ExampleInputStream, Selecione Excluir Kinesis Stream e, em seguida, confirme a exclusão.
Na página Kinesis streams, selecione ExampleOutputStream, selecione Ações, selecione Excluir e, em seguida, confirme a exclusão.
Excluir objeto e bucket do Amazon S3
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. Selecione o bucket ka-app-code-
<username>.Selecione Excluir e, em seguida, insira o nome do bucket para confirmar a exclusão.
Exclua seus recursos do IAM
Abra o console do IAM em https://console.aws.amazon.com/iam/
. Na barra de navegação, selecione Políticas.
No controle do filtro, insira kinesis.
Selecione a política kinesis-analytics-service-MyApplication-us-west-2.
Selecione Ações da política e, em seguida, Excluir.
Na barra de navegação, selecione Roles (Funções).
Selecione a função kinesis-analytics-MyApplication-us-west-2.
Selecione Excluir função e, em seguida, confirme a exclusão.
Exclua seus recursos do CloudWatch
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. No painel de navegação, selecione Logs.
Selecione o grupo de logs /aws/kinesis-analytics/MyApplication.
Selecione Excluir grupo de logs e, em seguida, confirme a exclusão.