Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo dell'ottimizzazione automatica nella console
Puoi utilizzare la console di Amazon OpenSearch Service per creare lavori di inserimento vettoriale, monitorarne l'avanzamento, visualizzare consigli di ottimizzazione e creare indici basati su tali consigli.
Prerequisiti
Prima di poter utilizzare l'ottimizzazione automatica nella console, è necessario disporre di quanto segue:
-
Un AWS account attivo con accesso alla OpenSearch console.
-
Una raccolta OpenSearch Serverless esistente di Type Vector Search o un dominio gestito OpenSearch .
-
Autorizzazioni IAM per le seguenti azioni:
opensearch:SubmitAutoOptimizeJobopensearch:GetAutoOptimizeJobopensearch:DeleteAutoOptimizeJobopensearch:CancelAutoOptimizeJobopensearch:ListAutoOptimizeJobs
Nota
Si tratta di politiche basate sull'identità. AWS non supporta politiche basate sulle risorse per l'ottimizzazione automatica delle risorse.
-
Configura la tua sessione utente federata in modo che abbia una scadenza minima delle credenziali di almeno 1 ora. Per set di dati molto grandi o di dimensioni elevate, valuta la possibilità di aumentare la durata di scadenza fino a 3 ore.
Creazione di un processo di inserimento vettoriale
Un processo di inserimento vettoriale analizza i dati vettoriali e fornisce consigli di ottimizzazione per la configurazione degli indici.
Per creare un processo di ingestione vettoriale
-
Accedi alla console di Amazon OpenSearch Service all'indirizzo Console di gestione AWS
. -
Nel riquadro di navigazione, scegli Auto-Optimize.
-
Scegli Crea un lavoro di ingestione vettoriale.
-
In Dettagli del lavoro, inserisci un nome per il tuo lavoro di ingestione vettoriale. Questo nome consente di identificare il lavoro nella console.
-
In Origine dati, configura quanto segue:
-
Per l'URI Amazon S3, inserisci l'URI Amazon S3 della cartella contenente i tuoi file Parquet. L'URI deve puntare alla cartella che la contiene, non a singoli file. Ad esempio, se il file Parquet si trova in
s3://my-bucket/my-folder/file1.parquet, immetteres3://my-bucket/my-folder/. -
Per Regione, seleziona la AWS regione in cui si trova il tuo bucket Amazon S3. La regione deve corrispondere alla posizione del bucket.
-
-
In OpenSearch Dominio, seleziona un dominio o una raccolta esistente oppure scegli Crea nuovo per crearne uno.
Nota
Puoi specificare un dominio OpenSearch gestito o una raccolta OpenSearch serverless serverless.
-
In Autorizzazioni di origine dati, specifica il ruolo IAM che dispone delle autorizzazioni per accedere al bucket OpenSearch e al dominio o alla raccolta Amazon S3. Il ruolo deve disporre delle autorizzazioni necessarie in base alla configurazione del dominio o della raccolta:
-
Per i OpenSearch domini con una politica di accesso al dominio, concedi l'accesso al ruolo tramite tale politica.
-
Per i OpenSearch domini con controllo granulare degli accessi, aggiungi il ruolo come ruolo di backend.
-
Per le raccolte OpenSearch serverless, aggiungi il ruolo alla politica di accesso ai dati.
-
-
Scegli Next (Successivo).
-
In Configura indice, specifica quanto segue:
-
Per Nome campo, inserisci il nome della colonna del set di dati Parquet che contiene i dati vettoriali.
-
Per Tipo di spazio, selezionate la metrica della distanza usata per calcolare la distanza tra i vettori:
l2 - Distanza euclidea
cosinesimil - Somiglianza con il coseno
innerproduct - Prodotto interno
-
Per Dimension, inserisci il numero di valori in virgola mobile in ogni vettore.
-
-
In Requisiti prestazionali, configura quanto segue:
-
Per Recall, specificate la qualità di ricerca desiderata come valore decimale compreso tra 0 e 1. Valori di richiamo più elevati restituiscono risultati più pertinenti. Esempio:
0,95 indica che in media vengono restituiti 19 dei 20 veri vettori di documento più vicini a un vettore di query
0.9 indica 9 su 10
0,8 indica 8 su 10
-
Per i requisiti di latenza della ricerca, seleziona la tua tolleranza di latenza. I requisiti modesti consentono maggiori risparmi sui costi grazie a metodi di compressione che riducono i requisiti di memoria.
-
-
Scegli Next (Successivo).
-
Controlla la configurazione e scegli Crea.
Il lavoro inizia l'elaborazione. È possibile monitorarne l'avanzamento nella tabella Vector Ingestion Jobs.
Monitoraggio dei lavori di ottimizzazione
Puoi monitorare lo stato dei tuoi lavori di inserimento vettoriale dalla pagina di destinazione con ottimizzazione automatica.
Per monitorare i lavori di ottimizzazione
-
Accedi alla console di Amazon OpenSearch Service da https://console.aws.amazon.com/aos/casa
. -
Nel riquadro di navigazione, scegli Ottimizzazione automatica.
-
La tabella Vector Ingestion Jobs mostra tutti i lavori con il loro stato corrente. Aggiorna la pagina per visualizzare informazioni sullo stato aggiornate.
Nota
Non esiste un meccanismo di aggiornamento o notifica automatico. È necessario aggiornare manualmente la console per vedere quando un processo viene completato.
Comprendere gli stati dello stato del lavoro
I lavori di ottimizzazione automatica possono avere i seguenti valori di stato:
- Pending (In attesa)
-
Il lavoro è in coda e in attesa di avvio.
- In esecuzione
-
Il processo di ottimizzazione automatica consiste nell'analisi attiva dei dati e nella generazione di consigli.
- Completato
-
Il processo di ottimizzazione automatica è stato completato correttamente. Tutte le analisi, le valutazioni e i consigli sono completi e disponibili per la visualizzazione.
- Non riuscito
-
Il processo ha riscontrato un errore. Visualizza i dettagli dell'errore nella pagina dei dettagli del lavoro per determinarne la causa.
- Attivo
-
È stato creato un indice nel cluster allegato e i dati sono stati inseriti.
La durata del job dipende principalmente dalla dimensione del set di dati e dal carico di servizio corrente. I lavori tipici vengono completati entro 15 minuti o diverse ore.
Visualizzazione dettagli processo
È possibile visualizzare informazioni dettagliate su uno specifico lavoro di ottimizzazione, inclusi la configurazione e lo stato.
Per visualizzare i dettagli del lavoro
-
Accedi alla console di Amazon OpenSearch Service da https://console.aws.amazon.com/aos/casa
. -
Nel pannello di navigazione, scegli Auto-Optimize.
-
Nella tabella Vector Ingestion Jobs, scegli il nome del lavoro.
-
La pagina dei dettagli del lavoro mostra le seguenti informazioni:
Nome e stato del Job
Configurazione dell'origine dati (URI e regione Amazon S3)
OpenSearch dominio o raccolta
Configurazione dell'indice (nome del campo, tipo di spazio, dimensione)
Requisiti prestazionali (richiamo e latenza)
Messaggi di errore (se il processo non è riuscito)
Visualizzazione e comprensione dei risultati
Una volta completato correttamente un lavoro, è possibile visualizzare i consigli di ottimizzazione.
Per visualizzare i risultati dell'ottimizzazione
-
Accedi alla console di Amazon OpenSearch Service da https://console.aws.amazon.com/aos/casa
. -
Nel pannello di navigazione, scegli Auto-Optimize.
-
Nella tabella Vector Ingestion Jobs, scegli un lavoro con lo stato Completato.
-
La pagina dei risultati mostra le seguenti sezioni:
-
Panoramica dei risultati: mostra la qualità di richiamo stimata della ricerca rispetto al requisito richiesto e l'indice di memoria occupato rispetto alla configurazione più consigliata.
-
Consigli: elenca fino a tre consigli di ottimizzazione, ordinati in base alla raccomandazione principale, che corrisponde meglio alla configurazione in uso. Ogni raccomandazione include:
Parametri di configurazione dell'indice
Parametri di configurazione della ricerca
Metriche delle prestazioni previste
Stime dell'impronta di memoria
Nota
Sebbene i consigli siano ordinati in base alla migliore corrispondenza, puoi selezionare qualsiasi consiglio più adatto al tuo caso d'uso specifico. Ottimizza automaticamente i tentativi di trovare le corrispondenze più vicine ai criteri di richiamo scelti.
-
Creazione di un indice basato sui consigli
Dopo aver esaminato i consigli di ottimizzazione, è possibile creare manualmente un indice utilizzando la configurazione consigliata o creare automaticamente un indice con il consiglio selezionato.
Per creare un indice automaticamente
-
Accedi alla console di Amazon OpenSearch Service da https://console.aws.amazon.com/aos/casa
. -
Nel pannello di navigazione, scegli Auto-Optimize.
-
Nella tabella Vector Ingestion Jobs, scegli un lavoro con lo stato Completato.
-
Esamina i consigli e seleziona quello che desideri utilizzare.
-
Scegli Build index.
-
Il sistema crea automaticamente un indice nel cluster utilizzando la raccomandazione selezionata e inserisce i dati vettoriali dal set di dati Parquet.
Per creare un indice manualmente
-
Accedi alla console di Amazon OpenSearch Service da https://console.aws.amazon.com/aos/casa
. -
Nel pannello di navigazione, scegli Auto-Optimize.
-
Nella tabella Vector Ingestion Jobs, scegli un lavoro con lo stato Completato.
-
Esamina i consigli e annota la configurazione dell'indice e i parametri di configurazione della ricerca per il consiglio scelto.
-
Utilizza l' OpenSearch API o la console per creare manualmente un indice con i parametri consigliati.