Costi per l'utilizzo di Amazon Redshift ML - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dal 1º novembre 2025. Se desideri utilizzare le UDF Python, creale prima di tale data. Le UDF Python esistenti continueranno a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog.

Costi per l'utilizzo di Amazon Redshift ML

Con Amazon Redshift puoi sfruttare le funzionalità di machine learning per ottenere informazioni dettagliate dai dati senza la necessità di vaste competenze di ingegneria dei dati o machine learning. Nelle sezioni seguenti vengono descritti i costi associati all’uso di Amazon Redshift ML per aiutarti a pianificare e ottimizzare le spese sfruttando al contempo questa potente integrazione di machine learning.

Costi per l’utilizzo di Amazon Redshift ML con SageMaker AI

Amazon Redshift ML per SageMaker AI utilizza le risorse cluster esistenti per la previsione in modo che possa evitare ulteriori addebiti Amazon Redshift. Non sono previsti costi aggiuntivi Amazon Redshift per la creazione o l'utilizzo di un modello. La previsione avviene localmente nel cluster Redshift, quindi non è necessario pagare extra a meno che non sia necessario ridimensionare il cluster. Amazon Redshift ML utilizza Amazon SageMaker AI per l’addestramento del modello, che ha un costo associato aggiuntivo.

Le funzioni di previsione eseguite all'interno del cluster Amazon Redshift non comportano costi supplementari. L’istruzione CREATE MODEL utilizza Amazon SageMaker AI e comporta un costo aggiuntivo. Il costo aumenta con il numero di celle nei dati di addestramento. Il numero di celle è il prodotto del numero di record (nella query di addestramento o nelle ore di tabella) moltiplicato per il numero di colonne. Ad esempio, quando una query SELECT dell'istruzione CREATE MODEL crea 10.000 record e 5 colonne, il numero di celle create è 50.000.

In alcuni casi, i dati di addestramento prodotti dalla query SELECT di CREATE MODEL superano il limite MAX_CELLS fornito (o il valore predefinito di 1 milione se non è stato impostato un limite). In questi casi, CREATE MODEL sceglie casualmente circa MAX_CELLS (cioè il "numero di colonne" record dal set di dati di addestramento). CREATE MODEL quindi esegue la formazione utilizzando queste tuple scelte casualmente. Il campionamento casuale assicura che il set di dati di addestramento ridotto non abbia alcun errore. Pertanto, impostando MAX_CELLS, è possibile controllare i costi di addestramento.

Quando si utilizza l'istruzione CREATE MODEL, è possibile utilizzare le opzioni MAX_CELLS e MAX_RUNTIME per controllare i costi, il tempo e la precisione potenziale del modello.

MAX_RUNTIME specifica la quantità massima di tempo che l’addestramento può impiegare in SageMaker AI quando utilizzi l’opzione AUTO ON oppure OFF. I processi di addestramento spesso vengono completati prima di MAX_RUNTIME, in base alle dimensioni del set di dati. Dopo aver addestrato un modello, Amazon Redshift esegue ulteriori lavori in background per compilare e installare i modelli nel cluster. Pertanto, il completamento di CREATE MODEL può richiedere più tempo di MAX_RUNTIME. Tuttavia MAX_RUNTIME limita la quantità di calcolo e il tempo utilizzati in SageMaker AI per addestrare il modello. È possibile controllare lo stato del modello in qualsiasi momento utilizzando SHOW MODEL.

Quando esegui CREATE MODEL con AUTO ON, Amazon Redshift ML utilizza SageMaker AI Autopilot per esplorare automaticamente e in modo intelligente diversi modelli (o candidati) per trovare quello migliore. MAX_RUNTIME limita la quantità di tempo e calcolo impiegato. Se MAX_RUNTIME è impostato su un valore troppo basso, potrebbe non esserci abbastanza tempo per esplorare neanche un candidato. Se viene visualizzato l'errore "Il candidato pilota automatico non ha modelli", eseguire di nuovo CREATE MODEL con un valore maggiore di MAX_RUNTIME. Per ulteriori informazioni su questo parametro, consulta MaxAutoMLJobRuntimeInSeconds nella documentazione di riferimento dell’API Amazon SageMaker AI.

Quando esegui CREATE MODEL con AUTO OFF, MAX_RUNTIME corrisponde a un limite per quanto tempo il job di addestramento viene eseguito in SageMaker AI. I processi di addestramento vengono spesso completati prima, a seconda delle dimensioni del set di dati e di altri parametri utilizzati, ad esempio num_rounds in MODEL_TYPE XGBOOST.

È inoltre possibile controllare i costi o ridurre i tempi di addestramento specificando un valore MAX_CELLS più piccolo quando si esegue CREATE MODEL. Una cella è una voce nel database. Ogni riga corrisponde a tutte le celle quante sono le colonne, che possono essere di larghezza fissa o variabile. MAX_CELLS limita il numero di celle e quindi il numero di esempi di addestramento utilizzati per addestrare il modello. Per impostazione predefinita, MAX_CELLS è impostato su 1 milione di celle. La riduzione di MAX_CELLS riduce il numero di righe dal risultato della query SELECT in CREATE MODEL che Amazon Redshift esporta e invia a SageMaker AI per addestrare un modello. La riduzione di MAX_CELLS riduce così la dimensione del set di dati utilizzato per addestrare i modelli sia con AUTO ON che con AUTO OFF. Questo approccio aiuta a ridurre i costi e i tempi di addestramento dei modelli. Per visualizzare informazioni sui tempi di addestramento e fatturazione di un determinato job di addestramento, scegli Processi di addestramento in Amazon SageMaker AI.

L’aumento di MAX_RUNTIME e MAX_CELLS spesso migliora la qualità del modello consentendo a SageMaker AI di esplorare più candidati. In questo modo SageMaker AI può impiegare più tempo per addestrare ciascun candidato e utilizzare più dati per addestrare modelli migliori. Se si desidera un'iterazione o un'esplorazione del set di dati più rapida, utilizzare valori più bassi per MAX_RUNTIME e MAX_CELLS. Se si desidera una maggiore precisione dei modelli, utilizzare valori maggiori per MAX_RUNTIME e MAX_CELLS.

Per ulteriori informazioni sui costi associati a vari numeri di cellulare e i dettagli della versione di prova gratuita, consultare Prezzi di Amazon Redshift.

Costi per l’utilizzo di Amazon Redshift ML con Amazon Bedrock

L’utilizzo di Amazon Redshift ML con Amazon Bedrock comporta costi aggiuntivi. Per maggiori informazioni, consulta Prezzi di Amazon Bedrock.