Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de un catálogo gestionado de Amazon Redshift en el AWS Glue Data Catalog
 Puede que no tenga un clúster de productores de Amazon Redshift o un datashare de Amazon Redshift disponibles en la actualidad, pero desee crear y gestionar tablas de Amazon Redshift mediante. AWS Glue Data Catalog Para empezar, puede crear un catálogo AWS Glue
gestionado mediante la glue:CreateCatalog API o la AWS Lake Formation consola configurando el tipo de catálogo como Managed y Catalog source como Redshift. Este paso hace lo siguiente:
Crea un catálogo en el catálogo de datos
Registra el catálogo como una ubicación de datos de Lake Formation
crea un grupo de trabajo sin servidor gestionado por Amazon Redshift
Vincula el grupo de trabajo sin servidor de Amazon Redshift y el catálogo de datos mediante un objeto de intercambio de datos
Para crear un catálogo administrado y configurar los permisos (consola)
- 
                      
                      
Abra la consola de Lake Formation en https://console.aws.amazon.com/lakeformation/
.  En el panel de navegación, seleccione Catálogos en Catálogo de datos.
Seleccione la opción Crear catálogo.
En la página de detalles del catálogo de conjuntos, introduzca la siguiente información:
- 
                          
Nombre: un nombre exclusivo para el catálogo gestionado. El nombre no se puede cambiar y debe estar en minúsculas. El nombre puede tener un máximo de 255 caracteres como máximo. cuenta.
 - 
                          
Tipo: elija
Managed catalogel tipo de catálogo. - 
                          
Almacenamiento: elija
Redshiftel almacenamiento. - 
                          
Descripción: introduzca una descripción para el catálogo creado a partir de la fuente de datos.
 
- 
                          
 Puede utilizar las aplicaciones de Apache Spark que se ejecutan en Amazon EMR EC2 para acceder a las bases de datos de Amazon Redshift en. AWS Glue Data Catalog
Para permitir que Apache Spark lea y escriba en el almacenamiento gestionado de Amazon Redshift, AWS Glue cree un clúster de Amazon Redshift gestionado con los recursos informáticos y de almacenamiento necesarios para realizar operaciones de lectura y escritura sin afectar a las cargas de trabajo del almacén de datos de Amazon Redshift. También debe proporcionar un rol de IAM con los permisos necesarios para transferir datos hacia y desde el bucket de Amazon S3. Para conocer los permisos necesarios para la función de transferencia de datos, consulte el paso 5 de la Requisitos previos para administrar los espacios de nombres de Amazon Redshift en AWS Glue Data Catalog sección.
- 
                     
De forma predeterminada, los datos del clúster de Amazon Redshift se cifran mediante una clave AWS gestionada. Lake Formation ofrece una opción para crear la clave de KMS personalizada para el cifrado. Si utiliza una clave administrada por el cliente, debe añadir políticas clave específicas a la clave.
 - 
                     
Elija Personalizar la configuración de cifrado si utiliza una clave gestionada por el cliente para cifrar los datos del almacenamiento gestionado de Amazon Redshift. Para usar una clave personalizada, debe agregar una política de claves administradas personalizadas adicionales a la clave de KMS. Para obtener más información, consulte Requisitos previos para administrar los espacios de nombres de Amazon Redshift en AWS Glue Data Catalog.
 - 
                    
                      
Opciones de cifrado: elija la opción Personalizar la configuración de cifrado si desea utilizar una clave personalizada para cifrar el catálogo. Para usar una clave personalizada, debe agregar una política de claves administradas personalizadas adicionales a la clave de KMS.
 Seleccione Siguiente para conceder permisos a otros directores.
En la página Otorgar permisos, selecciona Agregar permisos.
- 
                      
En la pantalla Añadir permisos, selecciona los principales y los tipos de permisos que deseas conceder.
                         
                         
                      - 
                          
En la sección Entidades principales, elija un tipo de entidad principal y, a continuación, especifique las entidades principales a las que adjudicar los permisos.
- 
                              
Usuarios y roles de IAM: elija uno o varios usuarios o roles de la lista de usuarios y roles de IAM.
 - 
                              
Usuarios y grupos de SAML: para SAML y Amazon Quick Suite usuarios y grupos, introduzca uno o más nombres de recursos de Amazon (ARNs) para los usuarios o grupos federados a través de SAML, o para los usuarios o grupos de ARNs Amazon Quick Suite. Presione Ingresar después de cada ARN.
Para obtener información sobre cómo crearlos ARNs, consulte los comandos AWS CLI grant y revoke. AWS CLI
 
 - 
                              
 - 
                          
En la sección Permisos, seleccione los permisos y los permisos adjudicables.
En Permisos de catálogo, seleccione uno o más permisos para adjudicar.
Elija Superusuario para adjudicar permisos administrativos sin restricciones en todos los recursos del catálogo.
En Permisos concedibles, selecciona los permisos que el destinatario de la subvención puede conceder a otros directores de su cuenta. AWS Esta opción no se admite cuando se adjudican permisos a un entidad principal de IAM desde una cuenta externa.
 
 - 
                          
 - 
                     
Seleccione Siguiente para revisar la información y crear el catálogo. La lista de catálogos muestra el nuevo catálogo gestionado.
 
Para crear un catálogo federado (CLI)
- 
                     
El siguiente ejemplo muestra cómo crear un catálogo federado.
aws glue create-catalog --cli-input-json file://input.json { "Name":"CatalogName", "CatalogInput": { "Description":"Redshift published Catalog", "CreateDatabaseDefaultPermissions" : [], "CreateTableDefaultPermissions": [], "CatalogProperties": { "DataLakeAccessProperties" : { "DataLakeAccess" : "true", "DataTransferRole" :"DTR arn", "KMSKey":"kms key arn", // Optional "CatalogType": "aws:redshift" } } } }Respuesta de Glue get-catalog
aws glue get-catalog \ --catalog-idaccount-id:catalog-name\ --regionus-east-1Response: { "Catalog": { "Name": "CatalogName", "Description": "Glue Catalog for Redshift z-etl use case", "CreateDatabaseDefaultPermissions" : [], "CreateTableDefaultPermissions": [], "CatalogProperties": { "DataLakeAccessProperties" : { "DataLakeAccess": "true", "DataTransferRole": "DTR arn", "KMSKey": "kms key arn", "ManagedWorkgroupName": "MWG name", "ManagedWorkgroupStatus": "MWG status", "RedshiftDatabaseName": "RS db name", "NamespaceArn": "namespace key arn", "CatalogType": "aws:redshift" } } }