As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Habilitar a conversão de formato do registro
Se você habilitar a conversão do formato de registro, não poderá definir o destino do Amazon Data Firehose como Amazon OpenSearch Service, Amazon Redshift ou Splunk. Com a conversão de formato habilitada, o Amazon S3 é o único destino que pode ser usado para o fluxo do Firehose. A seção a seguir mostra como ativar a conversão do formato de registro nas operações do console e da API do Firehose. Para obter um exemplo de como configurar a conversão do formato de registro com CloudFormation, consulte AWS::DataFirehose:: DeliveryStream.
Habilitação da conversão de formato do registro a partir do console
É possível habilitar a conversão de formato de dados no console ao criar ou atualizar um fluxo do Firehose. Com a conversão de formato de dados habilitada, o Amazon S3 é o único destino que pode ser configurado para o fluxo do Firehose. Além disso, a compactação do Amazon S3 será desabilitada quando você habilitar a conversão de formato. No entanto, a compactação Snappy ocorre automaticamente como parte do processo de conversão. OK formato de enquadramento para o Snappy que o Amazon Data Firehose usa nesse caso é compatível com o Hadoop. Isso significa que é possível usar os resultados da compactação Snappy e executar consultas nesses dados no Athena. Para o formato de enquadramento Snappy no qual o Hadoop se baseia, consulte .java. BlockCompressorStream
Para ativar a conversão de formato de dados para um fluxo de dados do Firehose
-
Faça login no Console de gerenciamento da AWS e abra o console do Amazon Data Firehose em. https://console.aws.amazon.com/firehose/
-
Selecione um fluxo do Firehose para atualizar ou crie um novo fluxo do Firehose seguindo as etapas em Tutorial: Criação de um fluxo do Firehose a partir do console.
-
Em Convert record format (Converter formato do registro), defina Record format conversion (Conversão de formato do registro) como Enabled (Habilitado).
-
Selecione o formato de saída que você deseja. Para obter mais informações sobre as duas opções, consulte Apache Parquet
e Apache ORC . -
Escolha uma AWS Glue tabela para especificar um esquema para seus registros de origem. Defina a região, o banco de dados, a tabela e a versão da tabela.
Gerenciamento da conversão do formato de registro da API do Firehose
Se você quiser que o Amazon Data Firehose converta o formato dos seus dados de entrada de JSON para Parquet ou ORC, especifique o DataFormatConversionConfigurationelemento opcional em ExtendedS3 ou em ExtendedS3. DestinationConfiguration DestinationUpdate Se você especificar DataFormatConversionConfiguration, as seguintes restrições se aplicam.
-
Em BufferingHints, você não pode
SizeInMBsdefinir um valor menor que 64 se você habilitar a conversão do formato de registro. Além disso, quando a conversão de formato não está ativada, o valor padrão é 5. O valor se torna 128 quando você a habilita. -
Você deve definir
CompressionFormatem ExtendedS3 DestinationConfiguration ou em ExtendedS3 como. DestinationUpdateUNCOMPRESSEDO valor padrão paraCompressionFormatéUNCOMPRESSED. Portanto, você também pode deixá-lo não especificado em DestinationConfigurationExtendedS3. Os dados ainda são compactados como parte do processo de serialização, usando a compactação Snappy, por padrão. OK formato de enquadramento para o Snappy que o Amazon Data Firehose usa nesse caso é compatível com o Hadoop. Isso significa que é possível usar os resultados da compactação Snappy e executar consultas nesses dados no Athena. Para o formato de enquadramento Snappy no qual o Hadoop se baseia, consulte .java. BlockCompressorStreamQuando você configurar o serializador, será possível escolher outros tipos de compactação.