本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
设置可 SageMaker HyperPod观测性插件
以下列表描述了设置可观测性插件的先决条件。
要将您的 Amazon SageMaker HyperPod (SageMaker HyperPod) 集群的指标发送到适用于 Prometheus 的亚马逊托管服务工作空间,并可选择在 Amazon Managed Grafana 中查看这些指标,请先将以下托管策略和权限附加到您的控制台角色。
-
启用 AWS IAM Identity Center (IAM 身份中心)以使用亚马逊托管 Grafana。如果您的账户中尚未启用 IAM 身份中心,请参阅 IAM 身份中心入门。此外,在 IAM 身份中心至少创建一个用户。
-
向您的角色添加以下策略和权限。
-
为亚马逊托管 Grafana 和亚马逊 Elastic Kubernetes Service 插件访问权限设置所需 IAM 角色的额外权限:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateRoleAccess", "Effect": "Allow", "Action": [ "iam:CreateRole", "iam:CreatePolicy", "iam:AttachRolePolicy", "iam:ListRoles" ], "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityAddonPolicy*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityGrafanaPolicy*" ] }, { "Sid": "IAMGrafanaPassRoleAccess", "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "Condition": { "StringLike": { "iam:PassedToService": [ "grafana.amazonaws.com" ] } } }, { "Sid": "IAMEKSPassRoleAccess", "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "Condition": { "StringLike": { "iam:PassedToService": [ "pods.eks.amazonaws.com" ] } } }, { "Sid": "IAMGetRoleAccess", "Effect": "Allow", "Action": "iam:GetRole", "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*" ] } ] }
-
管理 Amazon Managed Grafana 的 IAM 身份中心用户所需的其他权限:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "SSOAccess", "Effect": "Allow", "Action": [ "sso:ListProfileAssociations", "sso-directory:SearchUsers", "sso-directory:SearchGroups", "sso:AssociateProfile", "sso:DisassociateProfile" ], "Resource": [ "*" ] } ] }
-
移除和更新插件的 pod 身份关联所需的额外权限:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "EKSPodIdentity", "Effect": "Allow", "Action": [ "eks:DeletePodIdentityAssociation", "eks:UpdatePodIdentityAssociation" ], "Resource": "*" } ] }
确保满足上述先决条件后,就可以安装可观察性插件了。
快速安装可观测性附加组件
打开 Amazon A SageMaker I 控制台,网址为https://console.aws.amazon.com/sagemaker/
。 -
转到集群的详细信息页面。
-
在 “控制面板” 选项卡上,找到名为 “HyperPod 监控和可观察性” 的插件,然后选择 “快速安装”。
自定义安装可观测性附加组件
-
转到集群的详细信息页面。
-
在 “控制面板” 选项卡上,找到名为 “HyperPod 监控和可观察性” 的插件,然后选择 “自定义安装”。
-
指定要查看的指标类别。有关这些指标类别的更多信息,请参阅SageMaker HyperPod 集群指标。
-
指定是否要启用 Amazon CloudWatch 日志。
-
指定您是否希望该服务为 Prometheus 创建新的亚马逊托管服务工作空间。
-
要能够在亚马逊托管 Grafana 控制面板中查看指标,请选中标有 “使用亚马逊托管 Grafana 工作空间” 的复选框。您可以指定自己的工作区,也可以让服务为您创建一个新的工作空间。
注意
Amazon Managed Grafana 并不适用于所有可用的亚马逊 Prometheus 托管服务。 AWS 区域 但是,你可以在 AWS 区域 任何工作区中设置 Grafana 工作区,然后将其配置为从位于不同工作区的 Prometheus 工作区获取指标数据。 AWS 区域有关信息,请参阅使用 AWS 数据源配置将适用于 Prometheus 的亚马逊托管服务添加为数据源和连接亚马逊托管服务 Prometheus 和开源 Promethe us 数据源。