RBMで遊ぶ
データにはいろんなタイプの服装があるけど、今回はトップス(label:0), ボトムス(label:1), サンダル(label: 5)のみを抽出して使用した。
https://scrapbox.io/files/66b0f35a126606001c03ca08.png
半袖だったりノースリーブだったり結構パターンに多様性がある
RBMの内部は28*28サイズを5つ分学習できるようにした
https://scrapbox.io/files/66b0f486b58f9f001cb9a2b2.png
N=500, CDのK=1, α=0.01, T=100で学習
https://scrapbox.io/files/66b0f4cbe0964e001cde9786.png
学習後の内部状態
https://scrapbox.io/files/66b0f32d810d6b001df011ca.png
トップスとボトムスでくっきり分かれるかと思ったけど、そうはならなかった
サンダルに関しては5番目にうっすらある感じであまりハッキリしない
生成結果
上段:入力画像
中段:どの内部表現が使われているか
下段:生成結果
https://scrapbox.io/files/66b0f2c939297a001d570076.png
サンダルやズボンにも多少のバリエーションを学習できていて面白い
CDのK=1という雑すぎる近似でなんで学習できてしまうのだろうか?
Naa_tsure.icon何か直感的な説明が欲しい
ちなみに内部状態を3つにしたときは、うまく学習できなかった
人間の与えた区分(トップス、ボトムス、サンダル)とは全く異なる表現をしているところが面白い
https://scrapbox.io/files/66b0f626b0c577001d70b744.png
生成結果をみると、サンダルは異なる2パターンを生成できている!
Naa_tsure.icon1番目と7番目の違いに注目
なのに、トップスとボトムスは合体したものしか生成できてないw
https://scrapbox.io/files/66b0f6bd16aed5001c11ce57.png