重試 Lambda 耐用函數

耐用的函數提供自動重試功能，讓您的應用程式能夠適應暫時性故障。開發套件處理兩個層級的重試：商業邏輯故障的步驟重試，以及基礎設施故障的後端重試。

步驟重試

當步驟中發生未攔截的例外狀況時，軟體開發套件會根據設定的重試策略自動重試步驟。步驟重試是檢查點操作，可讓 SDK 暫停執行並在稍後繼續，而不會遺失進度。

下表說明 SDK 在步驟中如何處理例外狀況：

案例	發生的情況	計量影響
步驟中剩餘重試嘗試的例外狀況	SDK 會建立重試的檢查點，並暫停函數。在下次調用時，步驟會重試已設定的退避延遲。	1 操作 + 錯誤承載大小
步驟中的例外狀況，沒有剩餘的重試嘗試	步驟失敗並擲回例外狀況。如果您的處理常式程式碼未擷取此例外狀況，則整個執行會失敗。	1 操作 + 錯誤承載大小

當步驟需要重試時，開發套件會檢查重試狀態，並在沒有其他工作執行時結束 Lambda 調用。這可讓 SDK 實作退避延遲，而不會耗用運算資源。函數會在退避期間後自動恢復。

設定重試策略以控制步驟處理失敗的方式。您可以指定重試的嘗試次數上限、退避間隔和條件。

最大嘗試次數的指數退避：

固定間隔退避：

條件式重試（僅重試特定錯誤）：

停用重試：

當重試策略傳回時shouldRetry: false，步驟會立即失敗，而不會重試。將此用於不應重試的操作，例如等冪等性檢查或具有無法安全重複之副作用的操作。

當您的處理常式程式碼中發生未攔截的例外狀況，但在任何步驟之外，軟體開發套件會將執行標記為失敗。這可確保正確擷取和報告應用程式邏輯中的錯誤。

案例	發生的情況	計量影響
任何步驟外處理常式程式碼的例外狀況	SDK 會將執行標記為 FAILED，並傳回錯誤。系統不會自動重試例外狀況。	錯誤承載大小

若要啟用易出錯程式碼的自動重試，請使用重試策略將其包裝在步驟中。步驟提供可設定退避的自動重試，而步驟外的程式碼會立即失敗。

當 Lambda 遇到基礎設施故障、執行時間錯誤，或開發套件無法與持久的執行服務通訊時，就會發生後端重試。Lambda 會自動重試這些失敗，以協助您的耐用函數從暫時性基礎設施問題中復原。

當函數遇到下列情況時，Lambda 會自動重試函數：

下表說明 SDK 如何處理這些案例：

案例	發生的情況	計量影響
耐用處理常式外的執行時間錯誤 (OOM、逾時、當機）	Lambda 會自動重試調用。開發套件會從最後一個檢查點重播，略過完成的步驟。	錯誤承載大小 + 每次重試 1 個操作
呼叫 / `GetDurableExecutionState` APIs時發生服務錯誤 (5xx) `CheckpointDurableExecution` 或逾時	Lambda 會自動重試調用。開發套件會從最後一個檢查點重播。	錯誤承載大小 + 每次重試 1 個操作
呼叫 / `GetDurableExecutionState` APIs 時調節 (429) `CheckpointDurableExecution` 或無效的檢查點字符	Lambda 會自動重試具有指數退避的調用。開發套件會從最後一個檢查點重播。	錯誤承載大小 + 每次重試 1 個操作
當 / `GetDurableExecutionState` APIs時，用戶端錯誤 `CheckpointDurableExecution` (4xx，429 和無效的字符除外）	SDK 會將執行標記為 FAILED。不會自動重試，因為錯誤表示永久問題。	錯誤承載大小

後端重試會使用指數退避並繼續，直到函數成功或達到執行逾時為止。在重播期間，軟體開發套件會略過已完成的檢查點，並繼續從上次成功的操作執行，確保您的函數不會重新執行已完成的工作。

設定重試策略時，請遵循下列最佳實務：

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

事件來源映射

冪等性