Formato di file manifesto aumentato per l'addestramento in modalità Pipe - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Formato di file manifesto aumentato per l'addestramento in modalità Pipe

Il formato di manifest aumentato ti consente di eseguire l’addestramento in modalità Pipe usando i file senza dover creare file RecordIO. È necessario specificare i canali di addestramento e di convalida come valori per il parametro InputDataConfig della richiesta CreateTrainingJob. I file manifest aumentati sono supportati solo per i canali che utilizzano la modalità di input Pipe. Per ogni canale, i dati vengono estratti dal relativo file manifest aumentato e trasmessi (in ordine) all'algoritmo attraverso la named pipe del canale. La modalità Pipe utilizza il metodo FIFO (first-in-first-out), quindi i record vengono elaborati nell'ordine di accodamento. Per informazioni sulla modalità di input Pipe, consulta Input Mode.

I nomi degli attributi con un suffisso "-ref" puntano a dati binari preformattati. In alcuni casi, l'algoritmo sa come analizzare i dati. In altri casi, può essere necessario organizzare i dati in modo che i record vengano delimitati per l'algoritmo. Se l'algoritmo è compatibile con i dati in formato RecordIO, se specifichi RecordIO per RecordWrapperType il problema viene risolto. Se l'algoritmo non è compatibile con il formato RecordIO, specifica None per RecordWrapperType e verifica che i dati vengano analizzati in modo corretto per l'algoritmo.

Se utilizzi l'esempio ["image-ref", "is-a-cat"] e il wrapping RecordIO, il seguente flusso di dati viene inviato alla coda:

recordio_formatted(s3://amzn-s3-demo-bucket/foo/image1.jpg)recordio_formatted("1")recordio_formatted(s3://amzn-s3-demo-bucket/bar/image2.jpg)recordio_formatted("0")

Se alle immagini non è applicato il formato RecordIO, vengono trasmesse come singolo record con il valore dell'attributo is-a-cat corrispondente. Questo può causare un problema perché l'algoritmo potrebbe non delimitare correttamente le immagini e gli attributi. Per ulteriori informazioni sull'utilizzo dei file manifest aumentati per la classificazione delle immagini, consulta Addestramento con il formato di immagine manifest aumentato.

Con i file manifest aumentati e la modalità Pipe in generale, i limiti delle dimensioni del volume EBS non si applicano. Ciò include le impostazioni che devono altrimenti essere comprese nei limiti delle dimensioni del volume EBS, come S3DataDistributionType . Per ulteriori informazioni sulla modalità Pipe e su come utilizzarla, consulta Utilizzo degli algoritmi di addestramento personalizzati - Configurazione dei dati di input.