

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 《AWS Glue DataBrew 开发人员指南》的文档历史记录
<a name="doc-history"></a>

**当前 API 版本：**databrew-2017-07-25

下表介绍了此版本 AWS Glue DataBrew 的文档。如果您希望在《AWS Glue DataBrew 开发人员指南》**更新时收到通知，可以订阅 RSS 源。

| 变更 | 说明 | 日期 | 
| --- |--- |--- |
| [将 `glue:GetCustomEntityType` 添加到了 AWS 托管式策略中](#doc-history) |  在启用 PII 识别的情况下执行 AWS Glue DataBrew 剖析作业需要具有此权限。有关更多信息，请参阅 [AWS Glue DataBrew 对 AWS 托管式策略的更新](https://docs.aws.amazon.com/databrew/latest/dg/aws-managed-policies.html#databrew-managed-policy-updates)。 | 2024 年 3 月 20 日 | 
| [在 CRYPTOGRAPHIC\_HASH 转换中支持多种哈希算法](#doc-history) | 现在，您可以在对列中的值进行哈希处理时指定哈希算法。有关更多信息，请参阅 [CRYPTOGRAPHIC\_HASH](https://docs.aws.amazon.com/databrew/latest/dg/recipe-actions.CRYPTOGRAPHIC_HASH.html)。 | 2023 年 8 月 11 日 | 
| [将 `glue:BatchGetCustomEntityTypes` 添加到了 AWS 托管式策略中](#doc-history) |  在启用 PII 识别的情况下执行 AWS Glue DataBrew 剖析作业需要具有此权限。有关更多信息，请参阅 [AWS Glue DataBrew 对 AWS 托管式策略的更新](https://docs.aws.amazon.com/databrew/latest/dg/aws-managed-policies.html#databrew-managed-policy-updates)。 | 2022 年 5 月 9 日 | 
| [支持 Apache ORC 文件格式](#doc-history) | DataBrew 现在支持将 Apache ORC 作为 DataBrew 数据源和输出的文件格式。有关更多信息，请参阅[数据源支持的文件类型](https://docs.aws.amazon.com/databrew/latest/dg/supported-data-file-sources.html)。 | 2022 年 3 月 31 日 | 
| [支持跨账户 AWS Glue Data Catalog Amazon S3 访问](#doc-history) | 现在，如果在 AWS Glue 控制台中创建了适当的资源策略，则可以从其他 AWS 账户访问 AWS Glue Data Catalog S3 表。创建策略后，可以在创建 DataBrew 数据集时选择将相关 Data Catalog S3 表作为输入源。有关更多信息，请参阅[数据源和输出支持的连接](https://docs.aws.amazon.com/databrew/latest/dg/supported-data-connection-sources.html)。 | 2022 年 3 月 11 日 | 
| [支持与 Amazon AppFlow 进行本机控制台集成](#doc-history) | DataBrew 现在已与 Amazon AppFlow 进行本机控制台集成。这种集成意味着您可以连接到 Salesforce、Zendesk、Slack、ServiceNow 和其他软件即服务（SaaS）应用程序中的数据。您还可以连接到 Amazon S3 和 Amazon Redshift 等 AWS 服务中的数据。有关更多信息，请参阅[数据源和输出支持的连接](https://docs.aws.amazon.com/databrew/latest/dg/supported-data-connection-sources.html)。 | 2021 年 11 月 18 日 | 
| [支持数据质量规则](#doc-history) | DataBrew 现在支持创建数据质量规则，这些规则是可自定义的验证检查，用于定义对特定数据的业务要求。有关更多信息，请参阅[在 AWS Glue DataBrew 中验证数据质量](https://docs.aws.amazon.com/databrew/latest/dg/profile.data-quality-rules.html)。 | 2021 年 11 月 18 日 | 
| [支持自定义 SQL 语句](#doc-history) | DataBrew 现在支持使用自定义 SQL 语句检索来自 Amazon Redshift 和 Snowflake 的数据。这种支持意味着您可以使用专门构建的查询来选择和限制从大型表返回的数据。有关更多信息，请参阅[数据源和输出支持的连接](https://docs.aws.amazon.com/databrew/latest/dg/supported-data-connection-sources.html)。 | 2021 年 11 月 18 日 | 
| [支持 PII 检测](#doc-history) | DataBrew 现在支持检测个人身份信息（PII）。这使您可以选择在数据准备期间屏蔽 PII。有关更多信息，请参阅[识别和处理个人身份信息（PII）](https://docs.aws.amazon.com/databrew/latest/dg/personal-information-protection.html)。 | 2021 年 11 月 18 日 | 
| [支持其他 AWS 区域](#doc-history) | DataBrew 现在支持其他 AWS 区域。有关支持的区域列表，请参阅 [AWS Glue DataBrew 端点和配额](https://docs.aws.amazon.com/general/latest/gr/databrew.html)。 | 2021 年 10 月 5 日 | 
| [支持将数据写入基于 Lake Formation 的 Amazon S3 表类数据存储服务](#doc-history) | DataBrew 现在支持基于 AWS Lake Formation 将数据写入 AWS Glue Data Catalog S3 表。DataBrew 现在还支持将数据写入 Tableau Hyper 格式。有关更多信息，请参阅[创建和使用 AWS Glue DataBrew 配方作业](https://docs.aws.amazon.com/databrew/latest/dg/jobs.recipe.html)。 | 2021 年 8 月 13 日 | 
| [支持将数据写入 JDBC 目标](#doc-history) | DataBrew 现在支持将数据直接写入 JDBC 支持的数据库和数据仓库，包括 Amazon Redshift、Snowflake、Microsoft SQL Server、MySQL、Oracle Database 和 PostgreSQL。有关更多信息，请参阅[创建和使用 AWS Glue DataBrew 配方作业](https://docs.aws.amazon.com/databrew/latest/dg/jobs.recipe.html)。 | 2021 年 7 月 23 日 | 
| [支持指定为剖析作业生成哪些数据质量统计信息](#doc-history) | DataBrew 现在支持指定在剖析作业中为数据集自动生成哪些数据质量统计信息。有关更多信息，请参阅[创建和使用 AWS Glue DataBrew 配方作业](https://docs.aws.amazon.com/databrew/latest/dg/jobs.profile.html)。 | 2021 年 7 月 23 日 | 
| [支持将数据集写入 AWS Glue Data Catalog](#doc-history) | DataBrew 现在支持将数据集直接写入 AWS Glue Data Catalog。您可以选择将根据运行数据准备配方的作业创建的数据集存储在 Data Catalog 中的 Amazon S3、Amazon Redshift 和 Amazon RDS 表中。支持的 RDS 表包括 Amazon Aurora、RDS for Oracle、RDS for Microsoft SQL Server、RDS for MySQL 和 RDS for PostgreSQL 的表。 | 2021 年 6 月 30 日 | 
| [支持识别高级数据类型](#doc-history) | DataBrew 现在支持自动识别和标记列中的高级数据类型，这样可以更加轻松地对包含某些类型数据的列进行标准化。这些类型的数据包括社会保障号码、电子邮件地址、电话号码、性别、信用卡、URL、IP 地址、日期和时间、货币、邮政编码、国家、地区、州和城市。 | 2021 年 6 月 30 日 | 
| [支持使用 Amazon AppFlow 从 SAAS 应用程序传输数据](#doc-history) | DataBrew 现在支持使用 Amazon AppFlow 从第三方软件即服务（SaaS）应用程序（例如 Salesforce、Zendesk、Slack 和 ServiceNow）将数据传输到 Amazon S3。有关更多信息，请参阅[数据源和输出支持的连接](https://docs.aws.amazon.com/databrew/latest/dg/supported-data-connection-sources.html)。 | 2021 年 4 月 29 日 | 
| [支持使用来自 JDBC 数据库的输入创建 DataBrew 数据集](#doc-history) | DataBrew 现在支持根据 JDBC 支持的数据库和数据仓库中的数据创建数据集，包括 Amazon Redshift、Snowflake、Microsoft SQL Server、MySQL、Oracle Database 和 PostgreSQL。有关更多信息，请参阅[数据源和输出支持的连接](https://docs.aws.amazon.com/databrew/latest/dg/supported-data-connection-sources.html)。 | 2021 年 4 月 2 日 | 
| [支持其他 AWS 区域](#doc-history) | DataBrew 现在支持其他 AWS 区域。有关支持的区域列表，请参阅 [AWS Glue DataBrew 端点和配额](https://docs.aws.amazon.com/general/latest/gr/databrew.html)。 | 2021 年 1 月 28 日 | 
| [通过新转换处理重复](#doc-history) | DataBrew 控制台和 API 中添加了四种用于处理重复的新转换。有关更多信息，请参阅[数据质量配方步骤](https://docs.aws.amazon.com/databrew/latest/dg/recipe-actions.data-quality.html)中的 [DELETE\_DUPLICATE\_ROWS](https://docs.aws.amazon.com/databrew/latest/dg/recipe-actions.DELETE_DUPLICATE_ROWS.html)、[FLAG\_DUPLICATE\_ROWS](https://docs.aws.amazon.com/databrew/latest/dg/recipe-actions.FLAG_DUPLICATE_ROWS.html)、[FLAG\_DUPLICATES\_IN\_COLUMN](https://docs.aws.amazon.com/databrew/latest/dg/recipe-actions.FLAG_DUPLICATES_IN_COLUMN.html) 和 [REMOVE\_DUPLICATES](https://docs.aws.amazon.com/databrew/latest/dg/recipe-actions.REMOVE_DUPLICATES.html)。 | 2021 年 1 月 28 日 | 
| [其他 CSV 分隔符](#doc-history) | DataBrew 现在支持用于创建 DataBrew 数据集的逗号分隔值（CSV）文件中除逗号以外的其他分隔符。有关更多信息，请参阅[创建和使用 AWS Glue DataBrew 数据集](https://docs.aws.amazon.com/databrew/latest/dg/datasets.html)。 | 2021 年 1 月 28 日 | 
| [JupyterLab 的 DataBrew 扩展](#doc-history) | 现在，您可以在 JupyterLab 中使用 AWS Glue DataBrew 作为扩展。有关更多信息，请参阅[在 JupyterLab 中使用 DataBrew 作为扩展](https://docs.aws.amazon.com/databrew/latest/dg/jupyter.html?icmpid=docs_bru_doc_history)。 | 2020 年 11 月 20 日 | 
| [新数据准备工具：AWS Glue DataBrew](#doc-history) | 这是 *AWS Glue DataBrew 开发人员指南*的首次发布。 | 2020 年 11 月 11 日 | 