本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將文件上傳請求提交至 Amazon CloudSearch 網域
重要
將資料上傳至 Amazon CloudSearch 網域之前,請遵循下列準則:
-
在上傳文件之前,將文件分組為批次。持續上傳僅包含一個文件的批次,會對 Amazon CloudSearch 處理更新的速度產生巨大的負面影響。反之,建立盡可能接近限制的批次,並降低上傳頻率。如需批次大小上限和上傳頻率的詳細資訊,請參閱 了解 Amazon CloudSearch 限制。
-
網域的文件和搜尋端點在網域生命週期當中會保持不變。應當對端點進行快取處理,而非在每次上傳或搜尋請求之前擷取端點。在每個請求
DescribeDomains
之前呼叫aws cloudsearch describe-domains
或 查詢 Amazon CloudSearch 組態服務可能會導致您的請求受到調節。
建議使用其中一個 AWS SDKs或 AWS CLI 來提交文件上傳請求。SDKs和 會為您 AWS CLI 處理請求簽署,並提供執行所有 Amazon CloudSearch 動作的簡單方法。您也可以使用 Amazon CloudSearch 主控台上傳個別批次,並從 DynamoDB 或 S3 匯入資料。
例如,下列請求會使用 上傳批次 AWS CLI。
aws cloudsearchdomain --endpoint-url http://doc-movies-y6gelr4lv3jeu4rvoelunxsl2e.us-east-1.cloudsearch.amazonaws.com upload-documents --content-type application/json --documents movie-data-2013.json
基於開發和測試目的,您可以允許匿名存取網域的文件服務,並將未簽署的 HTTP POST 請求直接提交至網域的文件服務。在生產環境中,將您的網域存取權限制為特定 IAM 角色、群組或使用者,並提交已簽署的請求。如需控制 Amazon CloudSearch 存取的資訊,請參閱 configure access policies。如需請求簽署的詳細資訊,請參閱簽署 AWS API 請求。
例如,下列 POST 請求會將 JSON 格式的文件批次上傳至網域端點 https://doc-movies-123456789012.us-east-1.cloudsearch.amazonaws.com。
curl -X POST --upload-file data1.json doc-movies-123456789012.us-east-1.cloudsearch.amazonaws.com/2013-01-01/documents/batch --header "Content-Type: application/json"