Dataset
表示可以由 DataBrew 处理的数据集。
目录
注意
下表中首先描述了必需参数。
- Input
-
有关 DataBrew 如何在 AWS Glue Data Catalog 或 Amazon S3 中查找数据集的信息。
类型:Input 对象
必需:是
- Name
-
数据集的唯一名称。
类型:字符串
长度限制:长度下限为 1。最大长度为 255。
必需:是
- AccountId
-
拥有数据集的 AWS 账户的 ID。
类型:字符串
长度限制:长度上限为 255。
必需:否
- CreateDate
-
数据集的创建日期和时间。
类型:时间戳
必需:否
- CreatedBy
-
创建数据集的用户的 Amazon 资源名称(ARN)。
类型:字符串
必需:否
- Format
-
从 Amazon S3 文件或文件夹创建的数据集的文件格式。
类型:字符串
有效值:
CSV | JSON | PARQUET | EXCEL | ORC必需:否
- FormatOptions
-
定义 DataBrew 如何解释数据集中数据的一组选项。
类型:FormatOptions 对象
必需:否
- LastModifiedBy
-
上次修改数据集的用户的 Amazon 资源名称(ARN)。
类型:字符串
必需:否
- LastModifiedDate
-
数据集的上次修改日期和时间。
类型:时间戳
必需:否
- PathOptions
-
定义 DataBrew 如何解释数据集的 Amazon S3 路径的一组选项。
类型:PathOptions 对象
必需:否
- ResourceArn
-
数据集的唯一 Amazon 资源名称(ARN)。
类型:字符串
长度约束:最小长度为 20。最大长度为 2048。
必需:否
- Source
-
数据集的数据位置:Amazon S3 或 AWS Glue Data Catalog。
类型:字符串
有效值:
S3 | DATA-CATALOG | DATABASE必需:否
- Tags
-
已应用于数据集的元数据标签。
类型:字符串到字符串映射
映射条目:最多 200 项。
密钥长度限制:最小长度为 1。最大长度为 128。
值长度限制:最大长度为 256。
必需:否
另请参阅
有关在特定语言的 AWS SDK 中使用此 API 的更多信息,请参阅以下内容: