

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# HyperPod 推論故障診斷
<a name="sagemaker-hyperpod-model-deployment-ts"></a>

此疑難排解指南解決了 Amazon SageMaker HyperPod 推論部署和操作期間可能發生的常見問題。這些問題通常涉及 VPC 聯網組態、IAM 許可、Kubernetes 資源管理和運算子連線問題，這些問題可能會阻止成功的模型部署，或導致部署失敗或保持待定狀態。

本故障診斷指南使用以下術語：**故障診斷步驟**是用於識別和調查問題的診斷程序、**解決**提供修正已識別問題的特定動作，以及**驗證**確認解決方案是否正常運作。

**Topics**
+ [透過 SageMaker AI 主控台的推論運算子安裝失敗](sagemaker-hyperpod-model-deployment-ts-console-cfn-failures.md)
+ [透過 CLI AWS 的推論運算子安裝失敗](sagemaker-hyperpod-model-deployment-ts-cli.md)
+ [憑證下載逾時](sagemaker-hyperpod-model-deployment-ts-certificate.md)
+ [模型部署問題](sagemaker-hyperpod-model-deployment-ts-deployment-issues.md)
+ [VPC ENI 許可問題](sagemaker-hyperpod-model-deployment-ts-permissions.md)
+ [IAM 信任關係問題](sagemaker-hyperpod-model-deployment-ts-trust.md)
+ [缺少 NVIDIA GPU 外掛程式錯誤](sagemaker-hyperpod-model-deployment-ts-gpu.md)
+ [推論運算子無法啟動](sagemaker-hyperpod-model-deployment-ts-startup.md)