Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Planificación de transferencias hacia o desde sistemas de almacenamiento en la nube de terceros
Al planificar transferencias de datos entre nubes, tenga en cuenta lo siguiente:
-
Uso de un agente: un agente solo es necesario para acceder al almacenamiento en otras nubes cuando se utilizan tareas en modo básico. Las tareas en modo mejorado no requieren un agente. Si decide utilizar un agente, puede implementarlo como una instancia de Amazon EC2 al transferir desde el almacenamiento de objetos compatible con S3 de un proveedor de servicios en la nube, o como una máquina virtual de Google Compute Engine o de Azure para transferencias desde esos servicios de almacenamiento específicos, respectivamente. Al transferir desde sistemas de archivos en Google y Azure, se recomienda implementar el agente como una máquina virtual de Google o de Azure para que el agente se encuentre lo más cerca posible del sistema de archivos. Además, DataSync comprime los datos desde el agente hacia AWS, lo que puede ayudar a reducir los costos de salida de datos. DataSync proporciona una lista de ubicaciones en la nube validadas que ofrecen la compatibilidad requerida con la API de Amazon S3.
-
Punto de conexión de almacenamiento de objetos de la otra nube: el punto de conexión de almacenamiento de un proveedor de nube externo suele ser específico de la región o de la cuenta. El punto de conexión regional se utiliza como servidor en la ubicación de almacenamiento de objetos de DataSync, junto con el nombre del bucket especificado.
-
Clases de almacenamiento de los objetos de origen: al igual que Amazon S3, algunos proveedores de servicios en la nube admiten un nivel de archivo que requiere una restauración antes de poder acceder a los objetos archivados. Por ejemplo, los objetos en el nivel de archivo de Azure Blob se deben obtener para permitir el acceso estándar antes de una transferencia de datos. Se puede acceder a los objetos en el nivel de archivo de Google Cloud Storage de inmediato y sin restauración, pero el acceso directo al nivel de archivo conlleva costos de obtención asociados. Revise la documentación sobre las clases de almacenamiento entre nubes para determinar los requisitos de acceso y las tarifas de recuperación antes de iniciar la transferencia de datos. Para obtener más información sobre la restauración de objetos archivados en Amazon S3, consulte Restauración de un objeto archivado en la Guía del usuario de Amazon Simple Storage Service.
-
Acceso al almacenamiento de objetos: transferir datos entre proveedores de servicios en la nube de terceros requiere acceso al almacenamiento de objetos de la otra nube mediante claves de autenticación. Por ejemplo, para proporcionar acceso a Google Cloud Storage, configure una ubicación de almacenamiento de objetos de DataSync que se conecte a la API XML de Google Cloud Storage
y se autentique mediante una clave de Código de autenticación de mensajes basado en hash (HMAC) para la cuenta de servicio. Para Azure Blob Storage, configure una ubicación dedicada de DataSync para Azure Blob que se autentique mediante tokens SAS. DataSync utiliza AWS Secrets Manager para almacenar de forma segura las credenciales de almacenamiento de objetos. Para obtener más información, consulte Protección de las credenciales de las ubicaciones de almacenamiento. -
Compatibilidad con etiquetas de objetos:
-
A diferencia de Amazon S3, no todos los proveedores de servicios en la nube admiten etiquetas de objetos. Las tareas de DataSync pueden fallar al intentar leer etiquetas desde la ubicación de origen si el proveedor de servicios en la nube no admite etiquetas de objetos a través de la API de Amazon S3, o si las credenciales que proporciona no son suficientes para recuperar las etiquetas. DataSync proporciona una opción de tarea para desactivar la lectura y copia de etiquetas de objetos durante una transferencia si las etiquetas de objetos no son compatibles o si no desea retenerlas. Revise la documentación del proveedor de servicios en la nube para determinar si se admiten las etiquetas de objetos y verifique la configuración de etiquetas de objetos de la tarea de transferencia antes de iniciarla.
-
Puede utilizar la API de Amazon S3 para comprobar si un proveedor de servicios en la nube devuelve una solicitud
get-object-tagging. Para obtener más información, consulte get-object-taggingen la Referencia de comandos AWS CLI. Un proveedor de servicios en la nube que admite etiquetas de objetos devuelve una respuesta similar al siguiente ejemplo:
aws s3api get-object-tagging --bucket BUCKET_NAME --endpoint- url=https://BUCKET_ENDPOINT --key prefix/file1 { "TagSet": [] }Un proveedor de servicios en la nube que no admite
get-object-taggingdevuelve el siguiente mensaje:aws s3api get-object-tagging --bucket BUCKET_NAME --endpoint- url=https://BUCKET_ENDPOINT --key prefix/file1 An error occurred (OperationNotSupported) when calling the GetObjectTagging operation: The operation is not supported for this resource
-
-
Costos asociados a las solicitudes y a la salida de datos: transferir datos desde el almacenamiento de objetos en la nube conlleva costos de solicitudes y de salida de datos asociados con la lectura de datos y la transferencia de datos salientes. Los cargos por solicitudes varían entre proveedores de servicios en la nube y, cuando corresponde, entre clases de almacenamiento. Consulte la documentación del proveedor de servicios en la nube sobre los costos específicos de las solicitudes relativos a la clase de almacenamiento desde la que planea leer. Para obtener una descripción general de los cargos por solicitudes que DataSync realiza para las transferencias de datos, consulte Evaluación de los costos de solicitudes de S3 al usar DataSync y Precios de AWS DataSync
. Transferir datos fuera de proveedores de servicios en la nube específicos genera cargos por salida de datos. Los costos de transferencia de datos varían entre proveedores de servicios en la nube y también dependen de la región en la que se almacenan los datos. -
Tasas de solicitudes de almacenamiento de objetos: los proveedores de servicios en la nube presentan distintas características de rendimiento y de tasas de solicitudes en las plataformas de almacenamiento de objetos. Revise las tasas de solicitudes del otro proveedor de servicios en la nube y determine dónde se aplican los límites de solicitudes. Planifique con antelación las transferencias altamente paralelizadas que constan de varios agentes, cuando se requiera una partición específica o incrementos de rendimiento.
Amazon S3 dispone de tasas de solicitudes documentadas que puede utilizar como base para diseñar su solución. Las tasas de solicitudes de Amazon S3 se aplican por prefijo particionado y se pueden escalar en múltiples prefijos. Para obtener más información, consulte Prácticas recomendadas y patrones de diseño: optimización del rendimiento de Amazon S3 en la Guía del usuario de Amazon Simple Storage Service.