

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 一般的なエラーとトラブルシューティング
<a name="bestpractice7"></a>

AWS Batch におけるエラーは、多くの場合、アプリケーションレベルで発生したり、ユーザーの特定のジョブ要件を満たさないインスタンス構成が原因で発生したりします。その他の問題としては、ジョブが `RUNNABLE` のステータス内で停止したり、`INVALID` の状態でコンピューティング環境が停止したりすることが挙げられます。`RUNNABLE` のステータスのまま動かなくなるジョブのトラブルシューティングの詳細については、[`RUNNABLE` 状態でジョブが止まる](job_stuck_in_runnable.md) を参照してください。ある `INVALID` の状態にあるコンピューティング環境のトラブルシューティングについては、[`INVALID` コンピューティング環境](invalid_compute_environment.md) を参照してください。
+ **Amazon EC2 スポット vCPU クォータの確認** — 現在のサービスクォータがジョブの要件を満たしていることを確認します。例えば、現在のサービスクォータが 256 vCPUs で、ジョブに 10,000 vCPUs が必要だとします。その場合、サービスクォータはジョブの要件を満たしていません。詳細とトラブルシューティングの手順の詳細については、[Amazon EC2 Service Quotas](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-resource-limits.html) と [Amazon EC2 リソースのService Quotaを増やすには?](https://aws.amazon.com/premiumsupport/knowledge-center/ec2-instance-limit/) を参照してください。
+ **アプリケーション実行前のジョブが失敗する** — ジョブの一部には、`DockerTimeoutError` のエラーまたは `CannotPullContainerError` のエラーが原因で失敗するものがあります。トラブルシューティング情報については、[AWS Batch の”DockerTimeoutError”エラーを解決する方法](https://aws.amazon.com/premiumsupport/knowledge-center/batch-docker-timeout-error/)を参照してください。
+ **不十分な IP アドレス** — VPC とサブネットの IP アドレスの数によって、作成できるインスタンスの数が制限されることがあります。Classless Inter-Domain Routings (CIDR) を使用して、ワークロード実行に必要な IP アドレスよりも多くの IP アドレスを指定します。必要な場合、大きなアドレス空間を持つ専用 VPC を構築することもできます。例えば、`10.x.0.0/16` において複数の CIDR を持つ VPC を作成し、すべてのアベイラビリティーゾーンに `10.x.y.0/17` の CIDR を使い サブネットを作成できます。この例では、x は 1～4 で、y は 0 または 128 です。この設定では、すべてのサブネットに 36,000 個の IP アドレスが割り当てられます。  
![\[VPC diagram showing 6 private subnets with different CIDR ranges across 3 アベイラビリティーゾーン.\]](http://docs.aws.amazon.com/ja_jp/batch/latest/userguide/images/batch-best-practices-VPC_larges_scale-1.png)
+ **インスタンスが Amazon EC2 に登録されていることを確認する** — Amazon EC2 コンソールにおいてインスタンスが表示されるが、Amazon ECS クラスターに Amazon Elastic Container Service コンテナインスタンスが何も表示されない場合は、Amazon ECS エージェントが Amazon マシンイメージ (AMI) にインストールされていない可能性があります。AMI 内の Amazon ECS エージェント、AMI Amazon EC2 データ、または起動テンプレートも、正しく設定されていない可能性があります。根本原因を探し出すには、別の Amazon EC2 インスタンスを作成するか、または SSH を使用して既存のインスタンスに接続します。詳細については、[Amazon ECS コンテナエージェントの設定](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/ecs-agent-config.html)、[Amazon ECS ログファイルの場所](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/logs.html)、および [コンピューティングリソース AMIs](compute_resource_AMIs.md) を参照してください。
+ **AWS ダッシュボードを確認する** — AWS ダッシュボードを確認して、予想されるジョブの状態とコンピューティング環境が予想どおりにスケーリングされていることを確認します。CloudWatch でジョブログを確認することもできます。
+ **インスタンスが作成されたことを確認する** — インスタンスが作成されたら、コンピューティング環境が想定どおりにスケーリングされたことを意味します。インスタンスが作成されていない場合は、コンピューティング環境内の関連するサブネットを探して変更します。詳細については、[Auto Scaling グループのスケーリングアクティビティを検証する](https://docs.aws.amazon.com/autoscaling/ec2/userguide/as-verify-scaling-activity.html) を参照してください。

  また、インスタンスが関連するジョブ要件を満たしていることを確認するようお勧めします。例えば、ジョブに 1 TiB のメモリが必要でも、コンピューティング環境では 192 GB のメモリに制限されている C5 インスタンスタイプが使用されているとします。
+ **AWS Batch により、インスタンスがリクエストされていることを確認する** — Auto Scaling グループの履歴をチェックして、インスタンスが AWS Batch によってリクエストされていることを確認します。これは、Amazon EC2 がどのようにインスタンスを取得しようとしているかを示しています。Amazon EC2 スポットが特定のアベイラビリティーゾーンのインスタンスを取得できない、というエラーが表示される場合は、アベイラビリティーゾーンが特定のインスタンスファミリーを提供していないことが原因である可能性があります。
+ **インスタンスが Amazon ECS に登録されていることを確認する** — Amazon EC2 コンソールにインスタンスが表示されるが、Amazon ECS クラスターに Amazon ECS コンテナインスタンスが表示されない場合は、Amazon ECS エージェントが Amazon マシンイメージ (AMI) にインストールされていない可能性があります。さらに、Amazon ECS エージェント、AMI の Amazon EC2 データ、または起動テンプレートが正しく設定されていない可能性があります。根本原因を探し出すには、別のAmazon EC2 インスタンスを作成するか、または SSH を使用して既存のインスタンスに接続します。詳細については、[CloudWatch エージェント構成ファイル: ログセクション](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Agent-Configuration-File-Details.html#CloudWatch-Agent-Configuration-File-Logssection)、[Amazon ECS Log File Locations](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/logs.html)、および [コンピューティングリソース AMIs](compute_resource_AMIs.md) を参照してください。
+ **サポートチケットを開く** — トラブルシューティングを行っても問題が解決せず、サポートプランがある場合は、サポートチケットを開いてください。サポートチケットには、問題、ワークロードの仕様、構成、およびテスト結果に関する情報を必ず含めてください。詳細については、[サポート プランの比較](https://aws.amazon.com/premiumsupport/plans/) を参照してください。
+ **AWS Batch および HPC フォーラムを確認する** — 詳細については、[AWS Batch](https://repost.aws/tags/TAAQ5TlH16Tc686CgyYUNX0g/aws-batch) および [HPC](https://repost.aws/tags/TAjBvP4otfT3eX8PswbXo9AQ/high-performance-compute) フォーラムを参照してください。
+ **AWS Batch ランタイムモニタリングダッシュボードを確認する** — このダッシュボードは、サーバーレスアーキテクチャを使用して Amazon ECS、AWS Batch、Amazon EC2 からのイベントをキャプチャし、ジョブとインスタンスに関する洞察を提供します。詳細については、[AWS Batch ランタイム監視ダッシュボードソリューション](https://github.com/aws-samples/aws-batch-runtime-monitoring) を参照してください。