故障診斷 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

故障診斷

重要

允許 Amazon SageMaker Studio 或 Amazon SageMaker Studio Classic 建立 Amazon SageMaker 資源的自訂 IAM 政策也必須授予許可,才能將標籤新增至這些資源。需要將標籤新增至資源的許可,因為 Studio 和 Studio Classic 會自動標記他們建立的任何資源。如果 IAM 政策允許 Studio 和 Studio Classic 建立資源,但不允許標記,則嘗試建立資源時可能會發生「AccessDenied」錯誤。如需詳細資訊,請參閱提供標記 SageMaker AI 資源的許可

AWS Amazon SageMaker AI 的 受管政策 提供建立 SageMaker 資源的許可,已包含建立這些資源時新增標籤的許可。

如果您在使用無伺服器推論時遇到問題,請參閱以下故障診斷提示。

容器映像

如果您用於無伺服器端點的容器與您在執行個體型端點上使用的容器相同,則您的容器可能沒有寫入檔案的許可。這種情況可能是由於下列原因而發生:

  • 您的無伺服器端點無法建立或更新,因為 ping 運作狀態檢查失敗。

  • 用於端點的 Amazon CloudWatch 日誌顯示容器因許可錯誤而無法寫入某些檔案或目錄。

若要修正這個問題,您可以嘗試在檔案或目錄上新增 other 的讀取、寫入和執行許可,然後重建容器。您可以執行以下步驟,完成此程序:

  1. 在您用來建置容器的 Dockerfile 中,新增以下命令:RUN chmod o+rwX <file or directory name>

  2. 重建容器。

  3. 將新的容器映像上傳至 Amazon ECR。

  4. 嘗試再次建立或更新無伺服器端點。