View a markdown version of this page

AWS Glue DataBrew - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Glue DataBrew

AWS Glue DataBrew は、データのクリーニング、正規化、変換を行うフルマネージド型のビジュアルデータ準備サービスです。それを使用するたの書き込みコードがないという点で AWS Glue ETL とは異なっています。DataBrew には 250 種類以上の変換が組み込まれており、ポイントアンドクリックによる視覚的なインターフェイスにより、データ変換ジョブを作成および管理できます。

DataBrew は、別のコンソールビューで AWS Glue から使用できます。いくつかの AWS サービスとネイティブに統合されており、さまざまなファイル形式をサポートしています。詳細については、「製品とサービスの統合」を参照してください。

DataBrew は次の 6 つのコアコンセプトに基づいています:

  • プロジェクト – DataBrew のデータ準備ワークスペース全体

  • データセット – 構造化データまたは半構造化データのコレクション

  • レシピ – データ変換ステップのセット。各ステップには多数のアクションを含めることができます

  • ジョブ – レシピまたはデータプロファイルジョブを実行するための一連の命令 

  • データリネージュ – ビジュアルインターフェイスでデータを追跡し、その出所を特定すること

  • データプロファイル – データ形式の概要表示

AWS Glue DataBrew は AWS Glue Studio と統合されているため、AWS Glue ETL ジョブとワークフロー内で DataBrew レシピを調整できます。DataBrew レシピは、ジョブのブックマーク、自動再試行、自動スケーリングなどの AWS Glue 機能を活用することもできます。DataBrew を使用開始するには、AWS Glue DataBrew サンプルプロジェクトチュートリアルを使用します。