其他主題

下列是使用 Hive 存取 DynamoDB 來調整應用程式的一些更多方法。

Retry duration (重試持續時間)

依預設，如果 Hive 未在兩分鐘內從 DynamoDB 傳回任何結果，Hive 將會重新執行 Hadoop 任務。您可以藉由修改 dynamodb.retry.duration 參數來調整此間隔：


SET dynamodb.retry.duration=2;

此值必須是非零的整數，代表重試間隔中的分鐘數。dynamodb.retry.duration 預設值為 2 (分鐘)。

針對單一資料表的多個資料請求，無論是來自一名以上的使用者還是一個以上的應用程式，都會耗盡讀取佈建輸送量，降低效能。

DynamoDB 中的資料一致性取決於每個節點讀取和寫入操作的順序。當 Hive 查詢正在進行中時，另一個應用程式可以將新資料載入 DynamoDB 資料表，或修改或刪除現有的資料。在此案例中，Hive 查詢的結果有可能無法反映執行查詢的過程中所做的資料變更。

當對 DynamoDB 資料表的需求較低時，排程存取 DynamoDB 資料表的 Hive 查詢可改善效能。例如，若您大多數的應用程式使用者住在舊金山，您可以選擇在大多數的使用者仍在睡眠中的太平洋標準時間 (PST) 早上 4 點匯出每日資料，而不更新您 DynamoDB 資料庫中的紀錄。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

調整映射器

與 S3 整合