Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Fase 1: aggiungere documenti ad Amazon S3
Prima di eseguire un processo di analisi delle entità Amazon Comprehend sul tuo set di dati, crei un bucket Amazon S3 per ospitare i dati, i metadati e l'output di analisi delle entità Amazon Comprehend.
Argomenti
Scaricamento del set di dati di esempio
Prima che Amazon Comprehend possa eseguire un processo di analisi delle entità sui tuoi dati, devi scaricare ed estrarre il set di dati e caricarlo in un bucket S3.
-
Scarica la cartella tutorial-dataset.zip sul tuo dispositivo.
-
Estrai la
tutorial-datasetcartella per accedervi.data
-
Per scaricare il
tutorial-dataset, esegui il seguente comando in una finestra di terminale: -
Per estrarre i dati dalla cartella zip, esegui il seguente comando nella finestra del terminale:
Alla fine di questo passaggio, dovresti avere i file estratti in una cartella decompressa chiamata. tutorial-dataset Questa cartella contiene un README file con un'attribuzione open source Apache 2.0 e una cartella chiamata data contenente il set di dati per questo tutorial. Il set di dati è composto da 100 file con estensioni. .story
Creazione di un bucket Amazon S3
Dopo aver scaricato ed estratto la cartella dei dati di esempio, la memorizzi in un bucket Amazon S3.
Importante
Il nome di un bucket Amazon S3 deve essere univoco per tutti. AWS
Accedi Console di gestione AWS e apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/
-
In Bucket, scegli Crea bucket.
-
In Bucket name (Nome bucket), immettere un nome univoco.
-
Per Regione, scegli la AWS regione in cui desideri creare il bucket.
Nota
Devi scegliere una regione che supporti sia Amazon Comprehend che Amazon Kendra. Non è possibile modificare la regione di un bucket dopo averlo creato.
-
Mantieni le impostazioni predefinite per Block Public Access per questo bucket, Bucket Versioning e Tag.
-
Per Crittografia predefinita, scegli Disabilita.
-
Mantieni le impostazioni predefinite per le impostazioni avanzate.
-
Controlla la configurazione del bucket, quindi scegli Crea bucket.
-
Per creare un bucket S3, usa il comando create-bucket
in: AWS CLI Nota
Devi scegliere una regione che supporti sia Amazon Comprehend che Amazon Kendra. Non è possibile modificare la regione di un bucket dopo averlo creato.
-
Per assicurarti che il tuo bucket sia stato creato correttamente, usa il comando list
:
Creazione di cartelle di dati e metadati nel bucket S3
Dopo aver creato il bucket S3, crei cartelle di dati e metadati al suo interno.
Apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/
-
In Bucket, fai clic sul nome del tuo bucket dall'elenco dei bucket.
-
Dalla scheda Oggetti, scegli Crea cartella.
-
Per il nuovo nome della cartella, immettete
data. -
Per le impostazioni di crittografia, scegliete Disabilita.
-
Scegliere Create folder (Crea cartella).
-
Ripeti i passaggi da 3 a 6 per creare un'altra cartella per l'archiviazione dei metadati di Amazon Kendra e assegna un nome alla cartella creata nel passaggio 4.
metadata
-
Per creare la
datacartella nel tuo bucket S3, usa il comando put-objectin: AWS CLI -
Per creare la
metadatacartella nel tuo bucket S3, usa il comando put-object in:AWS CLI -
Caricamento dei dati di input
Dopo aver creato le cartelle di dati e metadati, carichi il set di dati di esempio nella cartella. data
Apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/
-
In Bucket, fai clic sul nome del tuo bucket dall'elenco dei bucket, quindi fai clic su.
data -
Scegli Carica, quindi scegli Aggiungi file.
-
Nella finestra di dialogo, accedi alla
datacartella all'interno dellatutorial-datasetcartella sul dispositivo locale, seleziona tutti i file, quindi scegli Apri. -
Mantieni le impostazioni predefinite per Destinazione, Autorizzazioni e Proprietà.
-
Scegli Carica.
-
Per caricare i dati di esempio nella
datacartella, utilizzate il comando copyin: AWS CLI -
Al termine di questo passaggio, avrai un bucket S3 con il set di dati archiviato all'interno della data cartella e una metadata cartella vuota, in cui verranno archiviati i metadati Amazon Kendra.