翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
不確実性法の定量的比較
このセクションでは、Corpus of Linguistic Acceptability (CoLA)(Warstadt、Singh、and Bowman 2019) データセットを用いて、不確実性を推定する方法を比較した方法を説明します。CoLA データセットは、一連の文章と、それらが許容されるかどうかを示すバイナリ指標で構成されています。文は、不適切な構文、意味、形態論など、さまざまな理由で容認できないとのレッテルを貼られることがあります。これらの文章は、言語学の出版物に掲載されている例文から抜粋したものです。2 つの検証セットがあります。一方の検証セットは、トレーニングデータセットを形成する際に使用されたのと同じソースから取られ (ドメイン内) 、もう一方の検証セットは、トレーニングセットに含まれていないソースから取られます (ドメイン外)。以下の表は、これらの情報を要約したものです。
| データセット | 合計サイズ | 肯定的 | 否定的 |
|---|---|---|---|
トレーニング |
8551 |
6023 |
2528 |
検証 (ドメイン内) |
527 |
363 |
164 |
検証 (ドメイン外) |
516 |
354 |
162 |
この比較では、RoBERTa (Liu et al.2019) のベースアーキテクチャを使用し、事前に訓練された重みと、1 つの隠れ層を持つランダムに初期化されたヘッドを持ちます。ハイパーパラメータは、RoBERTa のペーパーで提案されているものに若干の修正を加えたものです。