

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 分析階段
<a name="analysis-phase"></a>

透過處理 PDF 檔案，您可以擷取可用於進一步處理和分析的內容。例如，您可以使用每日營運報告的成本欄位來識別成本趨勢，或透過彙總業務營運的關鍵績效指標 (KPIs) 來產生洞見。您也可以將擷取的內容與其他資料來源結合，包括資料湖、資料倉儲、第三方資料或客戶關係管理 (CRM) 資料，以執行深入的業務分析。

[Amazon Quick](https://docs.aws.amazon.com//quicksight/latest/user/welcome.html) 是一種無伺服器商業智慧服務，可連線至 Amazon Simple Storage Service (Amazon S3) 儲存貯體，其中包含您擷取的 PDF 檔案資料。然後，您的業務分析師可以建立儀表板，以分析、視覺化和直接從 S3 儲存貯體中的 JSON 檔案產生洞見。儀表板會連線至 S3 儲存貯體，並在處理新的 PDF 檔案後自動更新。您也可以[與不同的使用者共用儀表板，](https://docs.aws.amazon.com//quicksight/latest/user/sharing-a-dashboard.html)使用者也可以[訂閱儀表板](https://docs.aws.amazon.com//quicksight/latest/user/subscribing-to-reports.html)，在行動裝置上檢視儀表板。如需詳細資訊，請參閱《[Amazon Quick 文件》中的使用 Amazon S3 檔案建立資料集](https://docs.aws.amazon.com//quicksight/latest/user/create-a-data-set-s3.html)。

大多數 PDF 檔案也在表單和資料表或任意文字段落中包含豐富的文字內容。擷取文字內容後，其他 AWS 人工智慧和機器學習 (AI/ML) 服務可以使用豐富的文字內容，這些服務可以處理自然語言處理 (NLP)，例如 [Amazon Comprehend](https://docs.aws.amazon.com//comprehend/latest/dg/comprehend-general.html) 或 [Amazon Translate](https://docs.aws.amazon.com//translate/latest/dg/what-is.html)。您也可以使用 [Amazon Kendra](https://docs.aws.amazon.com//kendra/latest/dg/what-is-kendra.html) 來索引和搜尋從大型 PDF 檔案資料庫擷取的文件。

您的資料科學家和機器學習工程師也可以使用 Amazon SageMaker AI 直接存取 S3 儲存貯體或 Amazon DynamoDB 資料表中的擷取資料，然後實作進階 ML 建模和預測。

## 分析階段的最佳實務
<a name="best-practices-storage"></a>

您可以使用下列兩個最佳實務來確保成功的分析階段：
+ 建立資訊清單檔案，以使用 S3 儲存貯體做為 Quick 的資料來源。如需詳細資訊，請參閱 Quick 文件中的[使用您自己的 Amazon S3 資料建立分析](https://docs.aws.amazon.com//quicksight/latest/user/getting-started-create-analysis-s3.html)。
+ 自動更新您的資料集，以擷取新增至 Amazon S3 的任何新資料，並重新整理儀表板。如需詳細資訊，請參閱快速文件中[的依排程重新整理資料集](https://docs.aws.amazon.com//quicksight/latest/user/refreshing-imported-data.html#schedule-data-refresh)。

 