Amazon SageMaker AI 網域實體和狀態 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker AI 網域實體和狀態

Amazon SageMaker AI 網域支援 SageMaker AI 機器學習 (ML) 環境。SageMaker AI 網域由下列實體及其相關聯的狀態值組成。如需建立網域的加入步驟,請參閱Amazon SageMaker AI 網域概觀

  • 網域:網域包含下列項目。

    • 一個相關聯的 Amazon Elastic File System (Amazon EFS) 磁碟區。

    • 授權使用者清單。

    • 各種安全、應用程式、政策和 Amazon Virtual Private Cloud (Amazon VPC) 組態。

    網域內的使用者可以彼此共享筆記本檔案和其他成品。一個帳戶可有多個網域。如需多個網域的詳細資訊,請參閱多個網域概觀

  • 使用者檔案:使用者設定檔代表網域內的單一使用者。這是參考使用者的主要方式,用於共享、報告和其他使用者導向功能。此實體是在使用者加入 Amazon SageMaker AI 網域時建立的。如需使用者設定檔的詳細資訊,請參閱網域使用者設定檔

  • 共用空間:共用空間包含共用的 JupyterServer 應用程式和共用目錄。網域內的所有使用者都可以存取共用空間。網域內的所有使用者設定檔都可以存取網域中的所有共用空間。如需空間共用的詳細資訊,請參閱與共用空間協作

  • 應用程式:應用程式代表支援用戶筆記本,終端和主控台的讀取和執行體驗的應用程式。應用程式的類型可以是 JupyterServer、KernelGateway、RStudioServerPro 或 RSession。使用者可能會同時啟用多個應用程式。

下列資料表說明的狀態值是針對domainUserProfileshared spaceApp實體。如果適用,他們還提供故障排除步驟。

網域狀態值

Value Description
待定 正在建立網域。
InService 成功建立網域。
更新中 正在更新網域。
正在刪除 正在刪除網域。
失敗 無法建立網域。呼叫 DescribeDomain API 以查看無法建立網域的原因。在修復 FailureReason 中提到的錯誤之後,刪除失敗的網域並重新建立網域。
UPDATE_FAILED 無法更新網域。呼叫 DescribeDomain API 以查看無法更新網域的原因。修復 FailureReason 中提到的錯誤後,呼叫 UpdateDomain API。
Delete_Failed 無法刪除網域。呼叫 DescribeDomain API 以查看無法刪除網域的原因。因為刪除失敗,所以您可能有一些資源仍在執行,但是您無法使用或更新網域。修復FailureReason中提到的錯誤後,再次呼叫 DeleteDomain API。

UserProfile 狀態值

Value Description
待定 正在進行建立的UserProfile
InService 成功建立UserProfile
更新中 正在進行的更新UserProfile
正在刪除 正在進行刪除的 UserProfile
失敗 失敗建立的 UserProfile。呼叫 DescribeUserProfile API 以查看UserProfile建立失敗原因。修復FailureReason中提到的錯誤後,刪除失敗的UserProfile並重新建立網域。
UPDATE_FAILED UserProfile更新不成功。呼叫 DescribeUserProfile API 以查看UserProfile更新失敗原因。修復FailureReason中提到的錯誤後,再次呼叫 UpdateUserProfile API。
Delete_Failed 失敗刪除的UserProfile。呼叫 DescribeUserProfile API 以查看UserProfile刪除失敗原因。因為刪除失敗,所以您可能有一些資源仍在執行,但是您無法使用或更新UserProfile。修復FailureReason中提到的錯誤後,再次呼叫 DeleteUserProfile API。

共用空間狀態值

Value Description
待定 持續建立共享空間。
InService 成功建立共享空間。
正在刪除 持續刪除共享空間。
失敗 失敗建立共享空間。呼叫 DescribeSpace API 以查看共用空間建立失敗原因。修復FailureReason中提到的錯誤後,刪除失敗的共用空間並重新建立它。
UPDATE_FAILED 更新失敗的共用空間。呼叫 DescribeSpace API 以查看共用空間更新失敗原因。修復FailureReason中提到的錯誤後,再次呼叫 UpdateSpace API。
Delete_Failed 失敗刪除共用空間。呼叫 DescribeSpace API 以查看共用空間刪除失敗原因。因為刪除失敗,所以您可能有一些資源仍在執行,但是您無法使用或更新共用空間。修復FailureReason中提到的錯誤後,再次呼叫 DeleteSpace API。
已刪除 成功刪除的共用空間。

App 狀態值

Value Description
待定 正在進行建立的App
InService 成功建立的 App
正在刪除 正在進行刪除的 App
失敗 失敗建立的 App。呼叫 DescribeApp API 以查看App建立失敗原因。修復FailureReason中提到的錯誤後,再次呼叫 CreateApp API。
已刪除 成功刪除的 App

應用程式維護

至少每 90 天,SageMaker AI 對 Amazon SageMaker Studio Classic JupyterServer 和 KernelGateway、SageMaker Canvas 和 Amazon SageMaker Data Wrangler 應用程式的基礎軟體執行一次安全和效能更新。某些維護項目 (例如作業系統升級) 要求 SageMaker AI 在維護時段短時間內讓您的應用程式離線。由於此維護會使應用程式離線,因此您無法在更新基礎軟體時執行任何作業。維護活動進行中時,應用程式的狀態會從 InService 轉換為待處理中。維護完成後,應用程式的狀態會轉換回 InService。如果修補失敗,則應用程式的狀態會變成失敗。如果應用程式處於失敗狀態,建議您建立相同類型的新應用程式。如需建立 Studio Classic 應用程式的相關資訊,請參閱關閉並更新 Amazon SageMaker Studio Classic 和應用程式。如需有關建立 SageMaker Canvas 應用程式的詳細資訊,請參閱應用程式管理

如需詳細資訊,請洽此處。https://aws.amazon.com/premiumsupport/。