

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 文本分类- TensorFlow 工作原理
<a name="text-classification-tensorflow-HowItWorks"></a>

文本分类- TensorFlow 算法将文本归类为输出类标签之一。诸如 [BERT](https://arxiv.org/pdf/1810.04805.pdf) 之类的深度学习网络在文本分类方面非常准确。还有一些在大型文本数据集上训练的深度学习网络，例如 TextNet，它有超过1100万个文本，大约有11,000个类别。使用 TextNet 数据对网络进行训练后，您可以针对具有特定重点的数据集对网络进行微调，以执行更具体的文本分类任务。Amazon SageMaker AI 文本分类 TensorFlow 算法支持在 TensorFlow Hub 中提供的许多预训练模型上进行迁移学习。

根据训练数据中类别标签的数量，文本分类层将附加到您选择的预训练 TensorFlow 模型上。分类层由丢弃层、密集层和具有 2 范数正则化的完全连接层组成，并使用随机权重进行初始化。您可以更改丢弃层的丢弃比率以及密集层的 L2 正则化系数的超参数值。

您可以在新训练数据上，对整个网络（包括预训练模型）进行微调，也可以仅对顶层分类层进行微调。使用这种迁移学习方法就可以通过较小的数据集进行训练。