4ab46088eec4,046
http://nhiro.org.s3.amazonaws.com/c/b/cb3a77f9c8a1eb9697d6bcce6c1c98aa.jpg https://gyazo.com/cb3a77f9c8a1eb9697d6bcce6c1c98aa
(OCR text)
47
学習データの作り方
穴埋め問題のための学習データは普通の文章デー
タさえあれば、そこからランダムに穴を開ける
だけで作れるから人間の高価な作業が必要ない
ランダムに15%の単語を選ぶ
残り20%は、1/2でランダムな単語、1/2で
元どおりの単語にする
西尾は「ランダムに15%の単語をランダムな単語に置き換える」でいいのではと思う