Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Activer la conversion du format d'enregistrement
Si vous activez la conversion du format d'enregistrement, vous ne pouvez pas définir votre destination Amazon Data Firehose comme Amazon OpenSearch Service, Amazon Redshift ou Splunk. Lorsque la conversion de format est activée, Amazon S3 est la seule destination que vous pouvez utiliser pour votre flux Firehose. La section suivante explique comment activer la conversion du format d'enregistrement à partir de la console et des opérations de l'API Firehose. Pour un exemple de configuration de la conversion de format d'enregistrement avec CloudFormation, voir AWS: : DataFirehose : : DeliveryStream.
Activer la conversion du format d'enregistrement depuis la console
Vous pouvez activer la conversion des formats de données sur la console lorsque vous créez ou mettez à jour un flux Firehose. Lorsque la conversion des formats de données est activée, Amazon S3 est la seule destination que vous pouvez configurer pour le flux Firehose. De plus, la compression Amazon S3 est désactivée lorsque vous activez la conversion de format. Toutefois, la compression Snappy se fait automatiquement dans le cadre du processus de conversion. Le format de cadrage pour Snappy utilisé par Amazon Data Firehose dans ce cas est compatible avec Hadoop. Cela signifie que vous pouvez utiliser les résultats de la compression Snappy et exécuter des requêtes sur ces données dans Athena. Pour le format de cadrage Snappy sur lequel repose Hadoop, consultez .java. BlockCompressorStream
Pour activer la conversion des formats de données pour un flux Firehose
-
Connectez-vous à la AWS Management Console console Amazon Data Firehose et ouvrez-la à l'adresse. https://console.aws.amazon.com/firehose/
-
Choisissez un stream Firehose à mettre à jour ou créez un nouveau stream Firehose en suivant les étapes décrites dans. Tutoriel : Création d'un stream Firehose depuis la console
-
Sous Convert record format (Convertir le format d'enregistrement), définissez Record format conversion (Conversion du format d'enregistrement) sur Enabled (Activé).
-
Choisissez le format de sortie souhaité. Pour plus d'informations sur les deux options, consultez Apache Parquet
et Apache ORC . -
Choisissez une AWS Glue table pour spécifier un schéma pour vos enregistrements sources. Définissez la région, la base de données, la table et la version de la table.
Gérez la conversion des formats d'enregistrement depuis l'API Firehose
Si vous souhaitez qu'Amazon Data Firehose convertisse le format de vos données d'entrée de JSON en Parquet ou ORC, spécifiez l'DataFormatConversionConfigurationélément facultatif dans ExtendedS3 ou ExtendedS3 DestinationConfiguration. DestinationUpdate Si vous le spécifiez DataFormatConversionConfiguration, les restrictions suivantes s'appliquent.
-
Dans BufferingHints, vous ne pouvez pas définir une valeur inférieure
SizeInMBsà 64 si vous activez la conversion du format d'enregistrement. De plus, lorsque la conversion de format n'est pas activée, la valeur par défaut est 5. La valeur devient 128 lorsque vous activez la conversion. -
Vous devez définir
CompressionFormatdans ExtendedS3 DestinationConfiguration ou ExtendedS3 sur. DestinationUpdateUNCOMPRESSEDLa valeur par défaut deCompressionFormatestUNCOMPRESSED. Par conséquent, vous pouvez également le laisser non spécifié dans DestinationConfigurationExtendedS3. Les données sont toujours compressées dans le cadre du processus de sérialisation, en utilisant la compression Snappy, par défaut. Le format de cadrage pour Snappy utilisé par Amazon Data Firehose dans ce cas est compatible avec Hadoop. Cela signifie que vous pouvez utiliser les résultats de la compression Snappy et exécuter des requêtes sur ces données dans Athena. Pour le format de cadrage Snappy sur lequel repose Hadoop, consultez .java. BlockCompressorStreamLorsque vous configurez le sérialiseur, vous pouvez choisir d'autres types de compression.