

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Lake Formation 中的藍圖和工作流程
<a name="workflows-about"></a>

工作流程會封裝複雜的多工作業擷取、轉換和載入 (ETL) 活動。工作流程會產生 AWS Glue 爬蟲程式、任務和觸發程序，以協調資料的載入和更新。Lake Formation 會以單一實體的形式執行和追蹤工作流程。您可以設定工作流程以隨需或排程執行。

**注意**  
Spark parquet 寫入器不支援資料欄名稱中的特殊字元。這是寫入器本身的技術限制，而不是組態問題。

您在 Lake Formation 中建立的工作流程會在AWS Glue主控台中顯示為導向無環圖 (DAG)。每個 DAG 節點都是任務、爬蟲程式或觸發程序。若要監控進度和疑難排解，您可以追蹤工作流程中每個節點的狀態。

當 Lake Formation 工作流程完成時，執行工作流程的使用者會獲得工作流程所建立之 Data Catalog 資料表的 Lake Formation `SELECT`許可。

您也可以在 中建立工作流程AWS Glue。不過，由於 Lake Formation 可讓您從藍圖建立工作流程，因此在 Lake Formation 中建立工作流程更為簡單且自動化。Lake Formation 提供下列類型的藍圖：
+ **資料庫快照** – 從 JDBC 來源將資料從所有資料表載入或重新載入至資料湖。您可以根據排除模式從來源排除一些資料。
+ **增量資料庫** – 根據先前設定的書籤，僅從 JDBC 來源將新資料載入資料湖。您可以在 JDBC 來源資料庫中指定要包含的個別資料表。對於每個資料表，您可以選擇書籤資料欄和書籤排序順序，以追蹤先前載入的資料。第一次針對一組資料表執行增量資料庫藍圖時，工作流程會從資料表載入所有資料，並為下一個增量資料庫藍圖執行設定書籤。因此，您可以使用增量資料庫藍圖而非資料庫快照藍圖來載入所有資料，前提是您將資料來源中的每個資料表指定為參數。
+ **日誌檔案** – 從日誌檔案來源大量載入資料 AWS CloudTrail，包括 Elastic Load Balancing 日誌和 Application Load Balancer 日誌。

使用下表來協助決定是否要使用資料庫快照或增量資料庫藍圖。


| 使用資料庫快照時... | 在下列情況下使用增量資料庫... | 
| --- | --- | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/lake-formation/latest/dg/workflows-about.html)  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/lake-formation/latest/dg/workflows-about.html)  | 

**注意**  
使用者無法編輯 Lake Formation 建立的藍色列印和工作流程。