本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 文字分類 - TensorFlow 的運作方式
<a name="text-classification-tensorflow-HowItWorks"></a>

文字分類 - TensorFlow 演算法會將文字分類為其中一個輸出類別標籤。對於文字分類來說，[BERT](https://arxiv.org/pdf/1810.04805.pdf) 等深度學習網路為高度準確。還有在大型文字資料集上進行訓練的深度學習網路 (例如 TextNet)，該網路具有超過 1100 萬個文字，大約有 11,000 個類別。使用 TextNet 資料訓練網路之後，您可以在具有特定焦點的資料集上微調網路，以執行更多特定的文字分類任務。Amazon SageMaker AI 文字分類 - TensorFlow 演算法支援在 TensorFlow Hub 中提供的許多預先訓練模型上進行轉移學習。

根據訓練資料中的類別標籤數量，文字分類層會連接到您選擇的預先訓練 TensorFlow 模型。分類層由一個退出層、一密集層以及具有 2 規範正規化的完全已連線的層組成，並以隨機權重初始化。您可以變更退出層的退出率超參數值，以及密集層的 L2 正規化因素。

您可以微調整個網路 (包含預先訓練的模型)，或僅微調新訓練資料的頂部分類層。使用這種轉移學習方法，可以使用較小的資料集進行訓練。