Machine learning - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dal 1º novembre 2025. Se desideri utilizzare le UDF Python, creale prima di tale data. Le UDF Python esistenti continueranno a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog.

Machine learning

Amazon Redshift Machine Learning (Amazon Redshift ML) è un efficace servizio basato su cloud che consente ad analisti e data scientist di qualunque livello di utilizzare la tecnologia di machine learning in tutta semplicità. Amazon Redshift ML utilizza un modello per generare risultati. Puoi utilizzare i modelli nei modi seguenti:

  • Puoi fornire i dati per cui desideri addestrare un modello e i metadati associati agli input di dati ad Amazon Redshift. Quindi Amazon Redshift ML crea dei modelli in Amazon SageMaker AI che acquisiscono i modelli nei dati di input. Sfruttando i dati dell’organizzazione per il modello, puoi utilizzare Amazon Redshift ML per identificare le tendenze nei dati, come la previsione del tasso di abbandono, il valore medio del cliente o la previsione dei ricavi. Puoi quindi utilizzare questi modelli per generare previsioni per i nuovi dati di input senza sostenere costi aggiuntivi.

  • Puoi utilizzare uno dei modelli di fondazione (FM) forniti da Amazon Bedrock, come Claude o Amazon Titan. Con Amazon Bedrock puoi combinare la potenza dei modelli linguistici di grandi dimensioni (LLM) con i dati di analisi in Amazon Redshift in poche fasi. Sfruttando un modello linguistico di grandi dimensioni (LLM), puoi utilizzare Amazon Redshift per eseguire l’elaborazione del linguaggio naturale sui dati. Puoi utilizzare l’elaborazione del linguaggio naturale per applicazioni come la generazione di testo, l’analisi del sentiment o la traduzione. Per informazioni sull’uso di Amazon Bedrock con Amazon Redshift, consulta Integrazioni di Amazon Redshift ML con Amazon Bedrock.

Nota

Rifiuto esplicito all'utilizzo dei dati volto al miglioramento del servizio

Se utilizzi i modelli Amazon Bedrock, consigliamo di leggere le policy AWS su come il servizio Amazon Bedrock gestisce i dati. Dovresti stabilire se hai bisogno di utilizzare una policy di non adesione per impedire al servizio di usare i dati per i miglioramenti del modello o del servizio, nel caso in cui Amazon Bedrock implementi tale funzionalità in futuro. Per garantire che il servizio non utilizzi i dati per tali scopi, utilizza la policy di non adesione generale di AWS.

Per ulteriori informazioni, consulta gli argomenti seguenti:

Nota

I modelli linguistici di grandi dimensioni possono generare informazioni imprecise o incomplete. Consigliamo di verificare le informazioni prodotte dai modelli linguistici di grandi dimensioni per garantire che siano accurate e complete.

Modalità di funzionamento di Amazon Redshift ML con Amazon SageMaker AI

Amazon Redshift utilizza Amazon SageMaker AI Autopilot per ottenere automaticamente il modello migliore e rendere disponibile la funzione di previsione in Amazon Redshift.

Il seguente diagramma illustra come funziona Amazon Redshift ML.

Flusso di lavoro per Amazon Redshift ML che si integra con Amazon SageMaker AI Autopilot.

Di seguito è riportato il flusso di lavoro generale:

  1. Amazon Redshift esporta i dati di addestramento in Amazon S3.

  2. Amazon SageMaker AI Autopilot preelabora i dati di addestramento. La pre-elaborazione esegue funzioni importanti, ad esempio l'imputazione di valori mancanti. Riconosce che alcune colonne sono di categoria (come il codice postale), le formatta correttamente per l'addestramento e svolge numerose altre attività. Scegliere i preprocessori migliori da applicare sul set di dati di formazione è un problema di per sé e Amazon SageMaker AI Autopilot ne automatizza la soluzione.

  3. Amazon SageMaker AI Autopilot trova l’algoritmo e gli iperparametri dell’algoritmo che forniscono il modello con le previsioni più accurate.

  4. Amazon Redshift registra la funzione di previsione come funzione SQL nel cluster Amazon Redshift.

  5. Quando esegui le istruzioni CREATE MODEL, Amazon Redshift utilizza Amazon SageMaker AI per l’addestramento. Pertanto, vi è un costo associato per l'addestramento del modello. Si tratta di una voce separata per Amazon SageMaker AI nella fattura di AWS. Si paga anche lo spazio di archiviazione utilizzato in Amazon S3 per archiviare i dati di addestramento. L'inferenza che utilizza modelli creati con CREATE MODEL che possono essere compilati ed eseguiti sul cluster Redshift non verrà addebitata. Non ci sono costi aggiuntivi di Amazon Redshift per l'utilizzo di Amazon Redshift ML.