本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
其他主題
下列是使用 Hive 存取 DynamoDB 來調整應用程式的一些更多方法。
Retry duration (重試持續時間)
依預設,如果 Hive 未在兩分鐘內從 DynamoDB 傳回任何結果,Hive 將會重新執行 Hadoop 任務。您可以藉由修改 dynamodb.retry.duration 參數來調整此間隔:
SET dynamodb.retry.duration=2;
此值必須是非零的整數,代表重試間隔中的分鐘數。dynamodb.retry.duration 預設值為 2 (分鐘)。
平行資料請求
針對單一資料表的多個資料請求,無論是來自一名以上的使用者還是一個以上的應用程式,都會耗盡讀取佈建輸送量,降低效能。
處理持續時間
DynamoDB 中的資料一致性取決於每個節點讀取和寫入操作的順序。當 Hive 查詢正在進行中時,另一個應用程式可以將新資料載入 DynamoDB 資料表,或修改或刪除現有的資料。在此案例中,Hive 查詢的結果有可能無法反映執行查詢的過程中所做的資料變更。
請求時間
當對 DynamoDB 資料表的需求較低時,排程存取 DynamoDB 資料表的 Hive 查詢可改善效能。例如,若您大多數的應用程式使用者住在舊金山,您可以選擇在大多數的使用者仍在睡眠中的太平洋標準時間 (PST) 早上 4 點匯出每日資料,而不更新您 DynamoDB 資料庫中的紀錄。