simplex
各文書をBoW表現にすることで,上図の語彙座標単体*14に射影できる
*14 各語彙の出現確率の総和が1となるような空間
なんとかイメージできるけど、、ある文書は、(0.5, 0.1, 0.1, 0, 0, ....)みたいに、語彙の数だけある次元に1を分配するような数字(確率?)を取る形で、その空間に位置できる?という意味でいいだろうか..
この説明は難しく、さっぱりわからない ...
頂点(vertex), 面(face), 余次元1の面をファセット(facet) ... なんとなくggplotを思い出したが、、さっぱり... softmax関数も、対象ベクトル?の要素の数から1を引いた単体, simplexになる https://youtu.be/5CwLT-IQB9E?t=286