

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 计划传入或传出第三方云存储系统
<a name="third-party-cloud-transfer-considerations"></a>

在计划跨云数据传输时，请考虑以下几点：
+ **使用代理：**只有在使用基本模式任务时，才需要代理来访问其他云中的存储。[增强模式任务](https://docs.aws.amazon.com/datasync/latest/userguide/choosing-task-mode.html)无需代理。如果决定使用代理，在从云提供商的 S3 兼容对象存储中进行传输时可以将代理部署为 [Amazon EC2 实例](https://docs.aws.amazon.com/datasync/latest/userguide/deploy-agents.html#ec2-deploy-agent)，或分别作为 Google 计算引擎或 Azure 虚拟机，用于从这些特定的存储服务进行传输。从 Google 和 Azure 中的文件系统进行传输时，建议将代理部署为 Google 或 Azure 虚拟机，以使代理尽可能靠近文件系统。此外，还可以将代理中的数据 DataSync 压缩到 AWS，这有助于降低出口成本。 DataSync 提供了[经过验证的云位置列表，这些位置](https://docs.aws.amazon.com/datasync/latest/userguide/creating-other-cloud-object-location.html)提供了所需的 [Amazon S3 API 兼容性](https://docs.aws.amazon.com/datasync/latest/userguide/creating-other-cloud-object-location.html#other-cloud-access)。
+ **其他云的对象存储端点：**第三方云提供商的存储端点通常是特定区域或账户专属的。区域终端节点与指定的存储桶名称一起用作 DataSync 对象存储位置的服务器。
+ **源对象的存储类别：**与 Amazon S3 一样，一些云提供商支持使用存档层，要求先进行还原操作才能访问存档对象。例如，必须检索 Azure Blob 存档层中的对象以进行标准访问，然后才能进行数据传输。Google Cloud Storage 存档层中的对象可立即访问且无需恢复，但是直接访问存档层会产生检索费用。在开始数据传输之前，请查阅跨云存储类别文档，确定访问要求和检索费用。有关在 Amazon S3 中还原已归档对象的更多信息，请参阅《Amazon Simple Storage Service 用户指南》**中的[恢复已归档的对象](https://docs.aws.amazon.com/AmazonS3/latest/userguide/restoring-objects.html)。
+ **对象存储访问权限：**在第三方云提供商之间传输数据需要通过身份验证密钥的形式，访问其他云的对象存储。例如，要提供对 Google Cloud Storage 的访问权限，您需要配置一个 DataSync 对象存储位置，该位置连接到 [Google Cloud Storage XML API](https://cloud.google.com/storage/docs/xml-api/overview)，并使用[基于哈希的消息身份验证码 (HMAC) 密钥](https://docs.aws.amazon.com/datasync/latest/userguide/tutorial_transfer-google-cloud-storage.html#transfer-google-cloud-storage-create-hmac-key)为您的服务帐号进行身份验证。[对于 Azure Blob 存储，你可以配置一个专用 [Azure Blob DataSync 位置，该位置](https://docs.aws.amazon.com/datasync/latest/userguide/creating-azure-blob-location.html#creating-azure-blob-location-how-to)使用 SAS 令牌进行身份验证。](https://docs.aws.amazon.com/datasync/latest/userguide/creating-azure-blob-location.html#azure-blob-access) DataSync AWS Secrets Manager 用于安全存储您的对象存储凭证。有关更多信息，请参阅[保护存储位置凭证](https://docs.aws.amazon.com/datasync/latest/userguide/location-credentials.html)。
+ **对象标签支持：**
  + 与 Amazon S3 不同，并非所有云提供商都支持[对象标签](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-tagging.html)。 DataSync 如果云提供商不支持通过 Amazon S3 API 进行对象标签，或者您提供的凭证不足以检索标签，则在尝试从源位置读取标签时，任务可能会失败。 DataSync提供了一个任务选项，用于在不支持[对象标签或您不想保留对象标签时关闭对对象标签的读取和复制](https://docs.aws.amazon.com/datasync/latest/userguide/API_Options.html#DataSync-Type-Options-ObjectTags)。请查阅云提供商文档确定是否支持对象标签，并在验证传输任务的对象标签设置后再启动传输。
  + 可使用 Amazon S3 API 来检查云提供商是否会返回 `get-object-tagging` 请求。有关更多信息，请参阅《AWS CLI 命令参考》**中的 [get-object-tagging](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3api/get-object-tagging.html)。

    支持对象标签的云提供商将返回类似以下示例的响应：

    ```
    aws s3api get-object-tagging --bucket BUCKET_NAME --endpoint- url=https://BUCKET_ENDPOINT --key prefix/file1
                                        
    {
    
        "TagSet": []
    
    }
    ```

    不支持 `get-object-tagging` 的云提供商将返回以下消息：

    ```
    aws s3api get-object-tagging --bucket BUCKET_NAME --endpoint- url=https://BUCKET_ENDPOINT --key prefix/file1
    
    An error occurred (OperationNotSupported) when calling the GetObjectTagging operation: The operation is not supported for this resource
    ```
+ **请求和数据传出的相关费用：**从云对象存储传输数据会产生与数据读取和传出相关的[请求和传出费用](https://docs.aws.amazon.com/datasync/latest/userguide/creating-other-cloud-object-location.html#other-cloud-considerations-costs)。不同云提供商以及不同存储类别（如果适用）的请求费用会有所不同。请查阅云提供商文档，了解与计划读取的存储类别相关的请求的具体费用。有关数据传输的请求费用的 DataSync 概述，请参阅[使用时评估 S3 请求费用 DataSync](https://docs.aws.amazon.com/datasync/latest/userguide/create-s3-location.html#create-s3-location-s3-requests)和[AWS DataSync 定价](https://aws.amazon.com/datasync/pricing/)。从特定的云提供商传出数据会产生传出费用。数据传输成本因云提供商而异，此外也取决于存储数据的区域。
+ **对象存储请求速率：**云提供商对象存储平台的性能和请求速率特征各不相同。请查看其他云提供商的请求速率，确定请求限制的适用范围。对于由多个代理组成的高度并行化传输，需要提前规划，以满足特定的分区需求或性能提升要求。

  Amazon S3 记录了请求速率，您可以据此构建解决方案。Amazon S3 的请求速率按分区前缀计算，并且可以跨多个前缀扩展。有关更多信息，请参阅《Amazon Simple Storage Service 用户指南》**中的[最佳实践设计模式：优化 Amazon S3 性能](https://docs.aws.amazon.com/AmazonS3/latest/userguide/optimizing-performance.html)。