機器學習 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

機器學習

Amazon Redshift 機器學習 (Amazon Redshift ML) 是一種強大的雲端型服務,可讓各種技能等級的分析師和資料科學家更輕鬆地使用機器學習技術。Amazon Redshift ML 使用模型來產生結果。您可以透過下列方式使用模型:

  • 您可以提供您想要訓練模型的資料,以及與 Amazon Redshift 資料輸入相關聯的中繼資料。然後,Amazon Redshift ML 會在 Amazon SageMaker AI 中建立模型,以擷取輸入資料中的模式。透過將您自己的資料用於模型,您可以使用 Amazon Redshift ML 來識別資料中的趨勢,例如流失預測、客戶生命週期價值或收入預測。您可以使用這些模型來產生新輸入資料的預測,而不會產生額外的成本。

  • 您可以使用 Amazon Bedrock 提供的其中一個基礎模型 (FM),例如 Claude 或 Amazon Titan。使用 Amazon Bedrock,您只需幾個步驟,即可將大型語言模型 LLMs) 的強大功能與 Amazon Redshift 中的分析資料結合。透過使用外部大型語言模型 (LLM),您可以使用 Amazon Redshift 對資料執行自然語言處理 (NLP)。您可以針對文字產生、情緒分析或翻譯等應用程式使用 NLP。如需搭配 Amazon Redshift 使用 Amazon Bedrock 的詳細資訊,請參閱 Amazon Redshift ML 與 Amazon Bedrock 整合

注意

選擇不使用您的資料來改善服務

如果您使用的是 Amazon Bedrock 模型,建議您閱讀有關 Amazon Bedrock 服務如何處理您的資料 AWS 的政策。如果 Amazon Bedrock 未來實作此類功能,您應該判斷是否需要使用選擇退出政策,以防止服務將您的資料用於模型或服務改進。為了確保服務不會將您的資料用於此類目的,請使用一般 AWS 選擇退出政策。

如需詳細資訊,請參閱下列內容:

注意

LLMs可能會產生不正確或不完整的資訊。我們建議驗證 LLMs產生的資訊,以確保其準確且完整。

Amazon Redshift ML 如何與 Amazon SageMaker AI 搭配使用

Amazon Redshift 與 Amazon SageMaker AI Autopilot 搭配使用,以自動取得最佳模型,並在 Amazon Redshift 中提供預測函數。

下圖說明Amazon Redshift ML 的運作方式。

與 Amazon SageMaker AI Autopilot 整合的 Amazon Redshift ML 工作流程。

一般工作流程如下:

  1. Amazon Redshift會 將訓練資料匯出至 Amazon S3。

  2. Amazon SageMaker AI Autopilot 會預先處理訓練資料。預處理會執行重要功能,例如輸入遺漏值。其會識別特定資料欄是可分類的 (例如郵遞區號),正確格式化這些資料欄以進行訓練,並執行許多其他工作。選擇要套用至訓練資料集的最佳預處理器本身是問題,Amazon SageMaker AI Autopilot 會自動化其解決方案。

  3. Amazon SageMaker AI Autopilot 會尋找演算法和演算法超參數,以最準確的預測交付模型。

  4. Amazon Redshift 會將預測函數註冊為您 Amazon Redshift 叢集中的 SQL 函數。

  5. 當您執行 CREATE MODEL 陳述式時,Amazon Redshift 會使用 Amazon SageMaker AI 進行訓練。因此,訓練模型會產生相關的成本。這是 AWS 帳單中 Amazon SageMaker AI 的個別明細項目。您也需要支付 Amazon S3 用於存放訓練資料的儲存費用。使用透過 CREATE MODEL 建立且可在 Redshift 叢集上編譯和執行的模型進行推論不收費。使用 Amazon Redshift ML 不會收取額外的 Amazon Redshift 費用。