在线存储 - Amazon SageMaker AI

在线存储

在线存储是一种低延迟、高可用性数据存储,支持实时查找特征。它通常用于机器学习 (ML) 模型处理。创建特征组时,您可以在标准在线存储 (Standard) 或内存层在线存储 (InMemory) 之间进行选择。这样,您就可以在考虑性能和成本的同时,选择与特定应用程序的读取和写入模式最匹配的存储类型,有关定价的详细信息,请参阅 Amazon SageMaker 定价

在线存储包含以下 StorageType 选项。有关在线存储内容的更多信息,请参阅 OnlineStoreConfig

标准层存储类型

Standard 层是在线存储特征组的托管低延迟数据存储。它为您的应用程序提供机器学习模型服务的快速数据检索。Standard 是默认存储类型。

内存层存储类型

InMemory 层是在线存储特征组的托管数据存储,支持极低延迟检索。它为用于高吞吐量应用程序的机器学习模型处理提供大规模实时数据检索。InMemory 层由 Amazon ElastiCache (Redis OSS) 提供支持。更多信息,请参阅什么是 Amazon ElastiCache (Redis OSS)?

在线存储 InMemory 层支持集合类型,即列表、集和向量。有关 InMemory 集合类型的更多信息,请参阅 集合类型

Feature Store 提供对在线存储的低延迟读取和写入。应用程序延迟主要由两个部分组成:基础设施或网络延迟以及 Feature Store API 延迟。降低网络延迟有助于以极低的延迟读取和写入 Feature Store。您可以通过将 AWS PrivateLink 部署到 Feature Store 运行时端点来降低 Feature Store 的网络延迟。借助 AWS PrivateLink,您可以使用接口 VPC 端点,以可扩展的方式从您的 Amazon Virtual Private Cloud (VPC) 私密访问所有 Feature Store 运行时 API 操作。将 privateDNSEnabled 选项设置为 true 的 AWS PrivateLink 部署:

  • 它将所有 Feature Store 的读/写流量保留在您的 VPC 内。

  • 使用 Feature Store 时,它会将流量保留在与发起流量的客户端相同的 AZ 中。这样可以避免 AZ 之间的“跳跃”,从而降低网络延迟。

按照使用接口 VPC 端点访问 AWS 服务中的步骤设置到 Feature Store 的 AWS PrivateLink。AWS PrivateLink 中的 Feature Store 运行时的服务名称为 com.amazonaws.region.sagemaker.featurestore-runtime

InMemory 层在线存储可根据存储使用情况和请求自动扩展。如果新的使用模式变化很快,自动扩缩可能需要几分钟时间才能适应。在自动扩缩期间:

  • 对特征组的写入操作可能会收到节流错误。应在几分钟后重试您的请求。

  • 对特征组的读取操作可能会收到节流错误。标准重试策略适用于这种情况。

  • 读取操作可能会导致延迟增加。

默认 InMemory 层特征组的最大大小为 50 GiB。

请注意,InMemory 层目前仅支持在线特征组,不支持在线+离线特征组,因此 InMemory 层的在线和离线存储之间无法进行复制。此外,InMemory 层目前不支持客户托管的 KMS 密钥。