Archivio online - Amazon SageMaker AI

Archivio online

L'archivio online è un datastore a bassa latenza e ad alta disponibilità che fornisce la ricerca in tempo reale delle funzionalità. In genere viene utilizzato per la fornitura di modelli di machine learning (ML). Puoi scegliere tra l'archivio online standard (Standard) o un archivio online di livello in memoria (InMemory), nel momento in cui crei un gruppo di funzionalità. In questo modo, è possibile selezionare il tipo di archiviazione più adatto ai modelli di lettura e scrittura per una particolare applicazione, tenendo conto al contempo delle prestazioni e dei costi. Per ulteriori dettagli sui prezzi, consulta Prezzi di Amazon SageMaker.

L'archivio online contiene le seguenti opzioni StorageType. Per ulteriori informazioni sui contenuti dell’archivio online, consulta OnlineStoreConfig.

Tipo di archiviazione di livello standard

Il livello Standard è un datastore gestito a bassa latenza per i gruppi di funzionalità dell'archivio online. Fornisce un rapido recupero dei dati per la fornitura di modelli ML per le tue applicazioni. Standard è il tipo di archiviazione predefinito.

Tipo di archiviazione di livello in memoria

Il livello InMemory è un datastore gestito per i gruppi di funzionalità dell'archivio online che supporta un recupero a latenza molto bassa. Fornisce il recupero dei dati in tempo reale su larga scala per la fornitura di modelli ML utilizzati per applicazioni ad alta velocità di trasmissione effettiva. Il livello InMemory è basato su Amazon ElastiCache (Redis OSS). Per ulteriori informazioni, consulta Cos’è Amazon ElastiCache (Redis OSS)?

Il livello InMemory dell'archivio online supporta i tipi di raccolta, ovvero elenco, set e vettore. Per ulteriori informazioni sui tipi di raccolta InMemory, consulta Tipi di raccolta.

L'archivio funzionalità offre letture e scritture a bassa latenza nell'archivio online. La latenza dell'applicazione è costituita principalmente da due componenti principali: la latenza dell'infrastruttura o della rete e la latenza dell'API archivio funzionalità. La riduzione della latenza di rete aiuta a ottenere la latenza più bassa in lettura e scrittura sull'archivio funzionalità. È possibile ridurre la latenza di rete verso l'archivio funzionalità implementando AWS PrivateLink sull'endpoint del runtime dell'archivio funzionalità. Con AWS PrivateLink, puoi accedere privatamente a tutte le operazioni dell'API di runtime dell'archivio funzionalità dal tuo cloud privato virtuale (VPC) Amazon in modo scalabile utilizzando gli endpoint VPC dell'interfaccia. Un'implementazione AWS PrivateLink con l'opzione privateDNSEnabled impostata come true:

  • Mantiene tutto il traffico di lettura/scrittura dell'archivio funzionalità all'interno del tuo VPC.

  • Mantiene il traffico nella stessa zona di disponibilità del client che l'ha originato quando utilizza l'archivio funzionalità. Ciò evita che i "salti" tra le zone di disponibilità riducano la latenza di rete.

Segui le fasi descritte in Accesso a un servizio AWS utilizzando un endpoint VPC di interfaccia per la configurazione di AWS PrivateLink sull'archivio funzionalità. Il nome del servizio per il runtime dell'archivio funzionalità in AWS PrivateLink è com.amazonaws.region.sagemaker.featurestore-runtime.

L’archivio online di livello InMemory scala automaticamente in base all’utilizzo e alle richieste di archiviazione. Il dimensionamento automatico può richiedere alcuni minuti per adattarsi a un nuovo modello di utilizzo se cambia rapidamente. Durante il dimensionamento automatico:

  • Le operazioni di scrittura sul gruppo di funzionalità potrebbero ricevere errori di limitazione. Dovresti ritentare le tue richieste qualche minuto più tardi.

  • Le operazioni di lettura sul gruppo di funzionalità potrebbero ricevere errori di limitazione. In questo caso sono adatte le strategie standard di ripetizione dei tentativi.

  • Le operazioni di lettura possono presentare una latenza elevata.

La dimensione massima del gruppo di funzionalità di livello InMemory predefinito è 50 GiB.

Tieni presente che attualmente il livello InMemory supporta solo i gruppi di funzionalità online, non i gruppi di funzionalità online+offline, quindi non è prevista replica tra archivi online e offline per il livello InMemory. Inoltre, il livello InMemory attualmente non supporta le chiavi KMS gestite dal cliente.