週記2024-11-10~2024-11-17
prev: 週記2024-11-06~2024-11-10
短いけど週末に切り替えるサイクルに戻すために切り替えておこう
前回書いた「今週やること」
意見ベクトルからのブロードリスニングをだいぶやったので、テキストからのブロードリスニングをやっていきたい
考察はしたが手は動かしてない
テキスト形式データからのブロードリスニング
とはいえ世論地図の最終データができたのでそれの分析もしたい
世論地図3970人UMAP
中央の高次元泥団子の扱いに悩んだ
UMAPの結果をクラスタリングするべきか
教えてもらった: tSNEの結果のクラスタリングは慎重に
高次元泥団子の扱いとして「UMAPの結果をクラスタリングするべきか」の最後で考えた案は「tSNEの結果のクラスタリングは慎重に」を呼んだ結果として筋悪と判断したのでネクストアクションどうしたらいいだろう、となっている
シンプルな問題を解いて理解を深めている
高次元正規分布の距離は平均√D, 分散0.7
対立次元
数学的な多次元トゲトゲ
テキスト形式データからのブロードリスニングに関しても、そもそも「UMAPの結果をクラスタリングするべきか」の話で、クラスタが適切でなければAIによるクラスタ解説も不調になるだろう
今週やること
とりあえず世論地図のUMAPはストレッチゴールなのでのんびりやるとして、一旦WebUIを最終版データで更新する✅
この後予定している会議で優先度の高い話が増えるかも
さほどではなかった
余裕があれば特にテキスト形式データからのブロードリスニング、外部脳、AIにKJ法を教えるなどに関してゆっくり考える時間を取ろう
世界からreferされる実績が増えたし、いろいろ書いてと言われてるが忙しくて英語で書く暇がないのでScrapbox自動翻訳のプロジェクトを進めるべきだし、英語だけではなく中国語やマレー語やベトナム語にもなったほうがいいのかもしれない
関連: ルックイーストポリシー
mem.nhiro.orgのUIを改善していくといいのかも
だいぶ進んでそうなのでPlurality和訳の現状把握もしよう
DBSCANとHDBSCANの違いも試す✅