不確定方法的量化比較 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

不確定方法的量化比較

本節說明如何比較使用語言可接受性 (CoLA) Corpus (Warstadt、Singh 和 Bowman 2019) 資料集來估計不確定性的方法。CoLA 資料集包含一組句子,以及是否可接受的二進位指標。句子可能因各種原因而標示為無法接受,包括不當語法、語意或形態。這些句子取自語言出版物中的範例。有兩個驗證集。一個驗證集是從用來形成訓練資料集的相同來源取得 (在網域中),另一個驗證集則是從訓練集未包含的來源取得 (超出網域)。下表摘要說明此資訊。

資料集 總大小 積極 消極

訓練

8551

6023

2528

驗證 (網域中)

527

363

164

驗證 (網域外)

516

354

162

此比較使用 RoBERTa (Liu et al. 2019) 基礎架構,其中包含預先訓練的權重,以及具有單一隱藏層的隨機初始化頭部。超參數大多建議在 RoBERTa 論文中,進行一些微幅修改。