本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
BOOTSTRAP_FAILURE_PRIMARY_WITH_NON_ZERO_CODE
概觀
當叢集因 BOOTSTRAP_FAILURE_PRIMARY_WITH_NON_ZERO_CODE 錯誤而終止時,主要執行個體中的引導操作失敗。如需有關引導操作的詳細資訊,請參閱 建立引導操作以使用 Amazon EMR 叢集安裝其他軟體。
Resolution
若要解決此錯誤,請檢閱 API 錯誤中傳回的詳細資訊,修改引導操作指令碼,並建立具有更新的引導操作的新叢集。
若要對失敗的 EMR 叢集進行疑難排解,請參閱從 DescribeCluster 和 ListClusters API 傳回的 ErrorDetail 資訊。如需詳細資訊,請參閱Amazon EMR 中具有 ErrorDetail 資訊的錯誤代碼。ErrorDetail 內的 ErrorData 陣列會傳回此錯誤代碼的下列資訊:
primary-instance-id-
引導操作失敗的主要執行個體 ID。
bootstrap-action-
失敗的引導操作的序號。
bootstrap-action值為1的指令碼是在執行個體上執行的第一個引導操作。 return-code-
失敗的引導操作的傳回碼。
amazon-s3-path-
失敗的引導操作的 Amazon S3 位置。
public-doc-
錯誤代碼文件的公有 URL。
要完成的步驟
請執行下列步驟來識別並修正引導操作錯誤的根本原因。然後啟動新叢集。
-
檢閱 Amazon S3 中的引導操作日誌檔案,以識別失敗的根本原因。若要進一步了解如何檢視 Amazon EMR 日誌,請參閱 檢視 Amazon EMR 日誌檔案。
-
如果您在建立執行個體時開啟叢集日誌,請參閱
stdout日誌以取得詳細資訊。您可以在此 Amazon S3 位置尋找引導操作的stdout日誌:s3://amzn-s3-demo-bucket/logs/Your_Cluster_Id/node/Primary_Instance_Id/bootstrap-actions/Failed_Bootstrap_Action_Number/stdout.gz如需有關叢集日誌的詳細資訊,請參閱 設定 Amazon EMR 叢集記錄和偵錯。
-
若要確定引導操作失敗,請檢閱
stdout日誌中的例外狀況,以及ErrorData中的return-code值。 -
使用上一步中的調查結果來修訂引導操作,以便避免例外狀況或在發生例外狀況時可以正常地處理。
-
啟動具有更新的引導操作的新叢集。