Kaggle画像コンペTips
TTA(Test Time Augmentation)
Pseudo Labeling
What is Pseudo Labeling?
Pseudo labeling is the process of adding confident predicted test data to your training data. Pseudo labeling is a 5 step process. (1) Build a model using training data. (2) Predict labels for an unseen test dataset. (3) Add confident predicted test observations to our training data (4) Build a new model using combined data. And (5) use your new model to predict the test data and submit to Kaggle. Here is a pictorial explanation using sythetic 2D data.
訓練データを使ってモデルを作成する
そのモデルを使ってテストデータの予測結果を作る
それらテストデータと予測結果、ラベルを訓練データとして利用する
テストデータの予測結果をPseudo Labelというらしい
Pseudo Labelは予測結果、例えば2分類タスクだと0:0.8/1:0.2という確率をそのまま使うのか
Link