本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 Amazon DataZone 中使用機器學習和生成式 AI
注意
採用 Amazon Bedrock 技術: AWS 實作自動濫用偵測。由於 Amazon DataZone 中描述功能的 AI 建議是以 Amazon Bedrock 為基礎,因此使用者會繼承在 Amazon Bedrock 中實作的控制項,以強制執行 AI 的安全、安全性和負責任的使用。
在目前版本的 Amazon DataZone 中,您可以針對名稱和描述功能使用 AI 建議,以自動化資料探索和目錄編製。支援 Amazon DataZone 中的生成式 AI 會建立資產和資料欄的商業名稱和描述。您可以使用這些名稱和描述來新增資料的業務內容,並建議分析資料集,這有助於提升資料探索結果。
Amazon DataZone 中資料資產名稱和描述的 AI 建議採用 Amazon Bedrock 的大型語言模型,可協助您確保資料易於理解且易於探索。AI 建議也建議最相關的資料集分析應用程式。透過減少手動文件任務並建議適當的資料用量,自動產生的名稱和描述可協助您增強資料的可信度,並盡量減少忽略寶貴的資料,以加速明智的決策。
支援地區
在目前的 Amazon DataZone 版本中,下列區域支援名稱和描述功能的 AI 建議:
-
美國東部 (維吉尼亞北部)
-
美國西部 (奧勒岡)
-
亞太區域 (東京)
-
歐洲 (法蘭克福)
-
亞太區域 (悉尼)
-
加拿大 (中部)
-
歐洲 (倫敦)
-
南美洲 (聖保羅)
-
歐洲 (愛爾蘭)
-
亞太區域 (新加坡)
-
美國東部 (俄亥俄)
-
亞太區域 (首爾)
Amazon DataZone 支援在以下區域中產生商業描述。
-
亞太區域 (孟買)
-
Europe (Paris)
Amazon DataZone 支援在以下區域中產生商業名稱。
-
歐洲 (斯德哥爾摩)
Bedrock 跨區域推論
Amazon DataZone 利用 Amazon Bedrock 的跨區域推論端點,為美國東部 (俄亥俄) 區域提供建議。所有其他區域都使用區域內端點。
使用 GenAI 的步驟
下列程序說明如何在 Amazon DataZone 中產生名稱和描述的 AI 建議:
-
導覽至 Amazon DataZone 資料入口網站 URL,然後使用單一登入 (SSO) 或您的 AWS 登入資料登入。如果您是 Amazon DataZone 管理員,請前往 https://https://console.aws.amazon.com/datazone
的 Amazon DataZone 主控台,然後使用建立網域 AWS 帳戶 的 登入,然後選擇開啟資料入口網站。 -
在頂端導覽窗格中,選擇選取專案,然後選擇包含要為其產生 AI 說明建議之資產的專案。
產生商業描述和摘要
-
導覽至專案的資料索引標籤。
-
在左側導覽窗格中,選擇庫存資料,然後選擇您要為其產生資產描述 AI 建議的資產名稱。
-
在資產的詳細資訊頁面上的業務中繼資料索引標籤中,選擇產生描述。
產生商業名稱
-
導覽至專案的資料索引標籤。
-
在左側導覽窗格中,選擇資料來源,然後選擇您要為其啟用業務名稱產生功能的資料來源。
-
前往詳細資訊索引標籤,並啟用 AUTOMATED Business NAME GENERATION 組態。
-
BusinessNames CreateAsset API 承載的 predictionConfiguration 下啟用 businessNameGeneration 旗標,也可以在建立資產時以程式設計方式產生 BusinessName。
接受/拒絕預測
-
產生描述後,您可以編輯、接受或拒絕它們。
-
綠色圖示會顯示在資料資產的每個自動產生的中繼資料描述旁。在商業中繼資料索引標籤中,您可以選擇自動產生的摘要旁的綠色圖示,然後選擇編輯、接受或拒絕以處理產生的描述。
-
您也可以在選取商業中繼資料索引標籤時,選擇接受所有或拒絕頁面頂端顯示的所有選項,然後對所有自動產生的描述執行選取的動作。
-
或者,您可以選擇結構描述索引標籤,然後針對一個資料欄描述選擇綠色圖示,然後選擇接受或拒絕,以個別處理自動產生的描述。
-
在結構描述索引標籤中,您也可以選擇全部接受或拒絕全部,因此對所有自動產生的描述執行選取的動作。
若要使用產生的描述將資產發佈至目錄,請選擇發佈資產,然後在發佈資產快顯視窗中再次選擇發佈資產,以確認此動作。
注意
如果您不接受或拒絕資產的產生描述,然後發佈此資產,則此未檢閱的自動產生中繼資料不會包含在已發佈的資料資產中。
支援自訂關聯式資產類型
Amazon DataZone 支援自訂資產類型的 genAI 功能。先前僅受管 Glue AWS 和 AMazon Redshift 資產類型支援此功能。
若要啟用此功能,請建立您自己的資產類型定義,並連接 RelationalTableFormType
做為其中一個表單。Amazon DataZone 會自動偵測此類表單的存在,並啟用這些資產的 GenAI 功能。產生商業名稱 (透過 CreateAsset API 中的 predictionConfiguration) 和 businessDescription (透過按一下資產詳細資訊頁面上的產生描述按鈕) 的整體體驗保持不變。
如需建立自訂資產類型的詳細資訊,請參閱 在 Amazon DataZone 中建立自訂資產類型。
配額
Amazon DataZone 支援產生商業名稱和產生商業描述的不同配額。您可以聯絡 AWS 支援團隊,以提高這些配額。
-
BusinessDescriptionGeneration:每月 10K 次調用
-
BusinessNameGeneration:每月 50K 次調用