見た 2026/6
2026/6/18
そりゃそう
2026/6/15
鮮度や信頼性(LLM が集めた情報 < 目を通した考察 < 検証したこと) 的な階層つけて運用してみるといいかねえ
2026/6/10
Causal Mediation Analysis とは
因果推論の DAG 的なやつか!
2026/6/9
便利そうではあるが
2026/6/8
Gemma 3n は MobileNet V5 らしい
2026/6/5
足し算できるできない話から
自分自身の潜在表現を予測する学習 (data2vec/JEPA 系) が、なぜ・どれだけデータ効率を改善するかを、階層的な合成データ RHM 上で理論的に解明した論文。
2026/6/4
蒸留なし・合成データなしという話、開発プロセスやデータが参考になる?
MAI-Thinking-1は、Microsoft AI(MAI)が外部モデルからの蒸留を一切使わず、クリーンな「企業グレード」データのみでフルスクラッチ学習した推論モデルです。アーキテクチャは35Bアクティブ/1TトータルのスパースMoE(8/512エキスパート)。事前学習30Tトークン+中間学習3.55Tトークンで構築され、最大256Kコンテキストに対応します。
2026/6/3
CLAUDE_PLUGIN_DATA
LLM の推論を「中間トークンの自己回帰生成」から切り離し、固定された特殊トークン列(メモリブロック)を作業記憶として使う潜在推論手法 RiM (Reasoning in Memory) を提案。2段階カリキュラムでメモリブロックに計算機能を学習させ、単一フォワードパスで処理する。GSM8K 系ベンチマークで Coconut や SFT を上回りつつ、直接回答と同等の低レイテンシを達成した。
2026/6/2
ADR 書いてるよという人の例、シンプル
2026/6/1