產生資料欄統計資料的先決條件
若要產生或更新資料欄統計資料,統計資料產生任務會代表您擔任 AWS Identity and Access Management (IAM) 角色。根據授與角色的權限,資料欄統計資料產生任務可以從 Amazon S3 資料存放區讀取資料。
在您設定資料欄統計資料產生任務時,AWS Glue 可讓您建立角色,該角色包含 AWSGlueServiceRole AWS 受管政策外加指定資料來源所需的內嵌政策。
如果指定現有角色來產生資料欄統計資料,請確定其包含 AWSGlueServiceRole 政策或同等政策 (或此政策的縮減版本),以及必要的內嵌政策。請依照下列步驟來建立新的 IAM 角色:
注意
若要針對由 Lake Formation 管理的資料表產生統計資料,則用於產生統計資料的 IAM 角色需要取得完整資料表存取權。
在您設定資料欄統計資料產生任務時,AWS Glue 可讓您建立角色,該角色包含 AWSGlueServiceRole AWS 受管政策外加指定資料來源所需的內嵌政策。您也可以建立角色並連接下面的政策中列出的許可,然後將該角色新增至資料欄統計資料產生任務。
建立產生資料欄統計資料的 IAM 角色
-
若要建立 IAM 角色,請參閱建立 AWS Glue IAM 角色。
-
若要更新現有角色,請在 IAM 主控台中,前往產生資料欄統計資料程序正在使用的 IAM 角色。
-
在新增權限區段,選擇連接政策。在新開啟的瀏覽器視窗中,選擇
AWSGlueServiceRoleAWS 受管理的策略。 -
您也需要納入從 Amazon S3 資料位置讀取資料的權限。
在新增權限區段中,選擇建立政策。在新開啟的瀏覽器視窗中,建立要搭配您角色使用的新政策。
-
在建立政策頁面中,選擇 JSON 索引標籤。將下列
JSON程式碼複製到政策編輯器欄位。注意
在下列政策中,將帳戶 ID 取代為有效的 AWS 帳戶,將
region取代為資料表的區域,將bucket-name取代為 Amazon S3 儲存貯體名稱。 (選用) 如果您正在使用 Lake Formation 權限向資料提供存取權,則 IAM 角色需要
lakeformation:GetDataAccess權限。如果 Amazon S3 資料位置已向 Lake Formation 註冊,且資料欄統計資料產生任務擔任的 IAM 角色沒有授予資料表的
IAM_ALLOWED_PRINCIPALS群組權限,則該角色需要資料表中的 Lake FormationALTER和DESCRIBE權限。用於註冊 Amazon S3 儲存貯體的角色需要資料表中的 Lake FormationINSERT和DELETE權限。如果 Amazon S3 資料位置已向 Lake Formation 註冊,且 IAM 角色沒有授予資料表的
IAM_ALLOWED_PRINCIPALS群組權限,則該角色需要資料表中的 Lake FormationALTER、DESCRIBE、INSERT及DELETE權限。-
如果您已啟用型錄層級
Automatic statistics generation選項,IAM 角色必須具有預設 Data Catalog 的glue:UpdateCatalog許可或 Lake FormationALTER CATALOG許可。您可以使用GetCatalog操作來驗證型錄屬性。 -
(選用) 寫入加密 Amazon CloudWatch Logs 的資料欄統計資料產生任務,需要金鑰政策中的下列權限。
-
您用來執行資料欄統計資料的角色必須具有該角色的
iam:PassRole許可。 -
建立用於產生資料欄統計資料的 IAM 角色時,該角色也必須具有下列信任政策,使服務可以擔任該角色。