Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Formato di file manifesto aumentato per l'addestramento in modalità Pipe
Il formato di manifest aumentato ti consente di eseguire l’addestramento in modalità Pipe usando i file senza dover creare file RecordIO. È necessario specificare i canali di addestramento e di convalida come valori per il parametro InputDataConfig
della richiesta CreateTrainingJob
. I file manifest aumentati sono supportati solo per i canali che utilizzano la modalità di input Pipe. Per ogni canale, i dati vengono estratti dal relativo file manifest aumentato e trasmessi (in ordine) all'algoritmo attraverso la named pipe del canale. La modalità Pipe utilizza il metodo FIFO (first-in-first-out), quindi i record vengono elaborati nell'ordine di accodamento. Per informazioni sulla modalità di input Pipe, consulta Input Mode
.
I nomi degli attributi con un suffisso "-ref"
puntano a dati binari preformattati. In alcuni casi, l'algoritmo sa come analizzare i dati. In altri casi, può essere necessario organizzare i dati in modo che i record vengano delimitati per l'algoritmo. Se l'algoritmo è compatibile con i dati in formato RecordIORecordIO
per RecordWrapperType
il problema viene risolto. Se l'algoritmo non è compatibile con il formato RecordIO
, specifica None
per RecordWrapperType
e verifica che i dati vengano analizzati in modo corretto per l'algoritmo.
Se utilizzi l'esempio ["image-ref", "is-a-cat"]
e il wrapping RecordIO, il seguente flusso di dati viene inviato alla coda:
recordio_formatted(s3://amzn-s3-demo-bucket/foo/image1.jpg)recordio_formatted("1")recordio_formatted(s3://amzn-s3-demo-bucket/bar/image2.jpg)recordio_formatted("0")
Se alle immagini non è applicato il formato RecordIO, vengono trasmesse come singolo record con il valore dell'attributo is-a-cat
corrispondente. Questo può causare un problema perché l'algoritmo potrebbe non delimitare correttamente le immagini e gli attributi. Per ulteriori informazioni sull'utilizzo dei file manifest aumentati per la classificazione delle immagini, consulta Addestramento con il formato di immagine manifest aumentato.
Con i file manifest aumentati e la modalità Pipe in generale, i limiti delle dimensioni del volume EBS non si applicano. Ciò include le impostazioni che devono altrimenti essere comprese nei limiti delle dimensioni del volume EBS, come S3DataDistributionType
. Per ulteriori informazioni sulla modalità Pipe e su come utilizzarla, consulta Utilizzo degli algoritmi di addestramento personalizzati - Configurazione dei dati di input.