

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# BlazingText ハイパーパラメータ
<a name="blazingtext_hyperparameters"></a>

`CreateTrainingJob` リクエストでトレーニングジョブを開始する場合、トレーニングアルゴリズムを指定します。また、アルゴリズム固有のハイパーパラメータを文字列から文字列へのマップとして指定することもできます。BlazingText アルゴリズムのハイパーパラメータは、Word2Vec (教師なし) とテキスト分類 (教師あり) のどちらのモードを使用しているかによって異なります。

## Word2Vec ハイパーパラメータ
<a name="blazingtext_hyperparameters_word2vec"></a>

次の表に、Amazon SageMaker AI によって提供される BlazingText Word2Vec トレーニングアルゴリズムのハイパーパラメータを示します。


| Parameter Name | 説明 | 
| --- | --- | 
| mode | Word2vec アーキテクチャは、トレーニングに使用されます。<br />**必須**<br />有効な値: `batch_skipgram`、`skipgram`、または `cbow` | 
| batch\_size | `mode` が `batch_skipgram` に設定されている場合の各バッチのサイズ。10～20 間の数字に設定します。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 11 | 
| buckets | サブワードに使用するハッシュバケットの数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 2000000 | 
| epochs | トレーニングデータの完全なパスの数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 5 | 
| evaluation | [WordSimilarity-353 テスト](http://www.gabrilovich.com/resources/data/wordsim353/wordsim353.html)を使用してトレーニング済みのモデルが評価されるかどうか。<br />**オプション**<br />有効な値: (ブール値) `True` または `False`<br />デフォルト値: `True` | 
| learning\_rate | パラメータ更新に使用されるステップサイズ。<br />**オプション**<br />有効な値: 正の浮動小数<br />デフォルト値: 0.05 | 
| min\_char | サブワード/文字 n グラムに使用する最小文字数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値： 3 | 
| min\_count | 出現回数が `min_count` 未満の単語は破棄されます。<br />**オプション**<br />有効な値: 負以外の整数<br />デフォルト値: 5 | 
| max\_char | サブワード/文字 n グラムに使用する最大文字数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 6 | 
| negative\_samples | Negative Sample Sharing (負のサンプル共有) 戦略の負のサンプル数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 5 | 
| sampling\_threshold | 単語の出現回数のしきい値。トレーニングデータ内でより高い頻度で出現する単語は、ランダムにダウンサンプリングされます。<br />**オプション**<br />有効な値: 正の小数。推奨される範囲は (0, 1e-3] です。<br />デフォルト値: 0.0001 | 
| subwords | サブワード埋め込みを学習するかどうか。<br />**オプション**<br />有効な値: (ブール値) `True` または `False`<br />デフォルト値: `False` | 
| vector\_dim | アルゴリズムが学習する単語ベクトルのディメンション。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 100 | 
| window\_size | コンテキストウィンドウのサイズ。コンテキストウィンドウは、トレーニングに使用されたターゲット単語を囲む単語の数です。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 5 | 

## テキスト分類ハイパーパラメータ
<a name="blazingtext_hyperparameters_text_class"></a>

次の表に、Amazon SageMaker AI によって提供されるテキスト分類トレーニングアルゴリズムのハイパーパラメータを示します。

**注記**  
テキスト分類モードと Word2Vec モードのパラメータの一部は共通していますが、コンテキストによっては意味が異なる場合があります。


| Parameter Name | 説明 | 
| --- | --- | 
| mode | トレーニングモード。<br />**必須**<br />有効な値: `supervised` | 
| buckets | 単語 n-gram に使用するハッシュバケットの数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 2000000 | 
| early\_stopping | エポックの `patience` 数を過ぎても検証の正確性が向上しない場合にトレーニングを中止するかどうか。早期停止を使用する場合は、検証チャネルが必要であることに注意してください。<br />**オプション**<br />有効な値: (ブール値) `True` または `False`<br />デフォルト値: `False` | 
| epochs | トレーニングデータの完全なパスの最大数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 5 | 
| learning\_rate | パラメータ更新に使用されるステップサイズ。<br />**オプション**<br />有効な値: 正の浮動小数<br />デフォルト値: 0.05 | 
| min\_count | 出現回数が `min_count` 未満の単語は破棄されます。<br />**オプション**<br />有効な値: 負以外の整数<br />デフォルト値: 5 | 
| min\_epochs | 早期停止ロジックが呼び出される前にトレーニングするエポックの最小数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 5 | 
| patience | 検証セットで何も進捗がない場合に、早期停止を適用するまでに待機するエポック数。`early_stopping` が `True` である場合にのみ使用されます。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 4 | 
| vector\_dim | 埋め込みレイヤーのディメンション。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 100 | 
| word\_ngrams | 使用する単語 n-gram 機能の数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 2 | 