步骤 1:创建项目 - AWS Glue DataBrew

步骤 1:创建项目

在此步骤中,您将使用 DataBrew 控制台快速开始使用项目示例。

创建项目
  1. 登录到 AWS 管理控制台并打开 DataBrew 控制台,网址:https://console.aws.amazon.com/databrew/

  2. 确保在 DataBrew 控制台的右上角选择您的 AWS 区域。有关 DataBrew 支持的 AWS 区域列表,请参阅《AWS 一般参考》中的 DataBrew 端点和配额

  3. 在导航窗格中,选择项目,然后选择创建项目

  4. 项目详细信息面板上,执行以下操作:

    • 项目名称中,输入 chess-project

    • 对于附加的配方,创建一个新配方。已提供配方的建议名称(chess-project-recipe)。

  5. 选择数据集窗格上,选择样本文件

  6. 样本文件窗格上,选择著名国际象棋比赛棋局。该数据集包含超过 2 万场国际象棋比赛的详细信息。

    对于数据集名称,已提供数据集的建议名称(chess-games)。

  7. 访问权限窗格上,选择 AwsGlueDataBrewDataAccessRole。这是一个服务相关角色,让 DataBrew 可以代表您访问 Amazon S3 存储桶。

  8. 选择创建项目,然后等待 DataBrew 完成项目的准备工作。窗口看上去类似下面这样。

    您看到的数据表示 chess-games 数据集中的样本。默认情况下,样本包含数据集中的前 500 行。您可以在稍后更改此项目设置。

    可通过工具栏访问数百种数据转换,您可以将其应用于数据。

    DataBrew 控制台右侧的配方窗格会跟踪您到目前为止所应用的转换。