将 AWS Glue DataBrew 与您的 VPC 结合使用
如果您使用 Amazon VPC 托管 AWS 资源,则可以将 AWS Glue DataBrew 配置为基于 Amazon VPC 服务,通过虚拟私有云(VPC)路由流量。为实现此目标,DataBrew 首先将一个弹性网络接口预置到您指定的子网中。然后,DataBrew 将您指定的安全组附加到该网络接口以控制访问。指定的安全组必须为所有流量制定自引用入站和出站规则。此外,您的 VPC 还必须启用 DNS 主机名和解析。有关更多信息,请参阅《AWS Glue 开发人员指南》中的设置 VPC 以连接到 JDBC 数据存储。
对于 AWS Glue Data Catalog 数据集,您需要在 Data Catalog 中创建 AWS Glue 连接时配置 VPC 信息。要为此连接创建 Data Catalog 表,请从 AWS Glue 控制台运行爬网程序。有关更多信息,请参阅《AWS Glue 开发人员指南》中的填充 AWS Glue Data Catalog。
对于数据库数据集,请在您从 DataBrew 控制台创建连接时指定您的 VPC 信息。
要将 AWS Glue DataBrew 与没有 NAT 的 VPC 子网结合使用,您必须有一个网关 VPC 端点连接到 Amazon S3,并且有一个 VPC 端点用于 AWS Glue 接口。有关更多信息,请参阅 Amazon VPC 文档中的创建网关端点和接口 VPC 端点(AWS PrivateLink)。DataBrew 预置的弹性接口没有公有 IPv4 地址,因此它不支持使用 VPC 互联网网关。
目前不支持 Amazon S3 接口端点。如果您使用 AWS Secrets Manager 存储密钥,则需要到 Secrets Manager 的路由。如果您使用的是加密,则需要到 AWS Key Management Service(AWS KMS)的路由。