pandas multi-index
最初にここをよむのがよいかも。index要らない、全部columnでいいのでは?という気がしてたが、少し考え変わるかも。
利点(why)から説明してくれてる。
もちろん、公式文書も必要 Hierarchical indexing という単語を強調してる?
an arbitrary number of dimensions in lower dimensional data structures が利点と。
まとめとしては、以下を読むのがよい。網羅的に分かった感じがする。このサイトはすごい。
multi indexには順番があり、外側から指定するには、タプルで指定すればよい。
内側のみ指定したい場合は、slice(None)を使うか、pd.IndexSliceを使うか、pandas.DataFrame.xs(level=)を使うか。
glossary
levels, labels, names
multi indexにおいては、levelはその階層的indexの階層の何番目か。labelはindexを指定する際の値。nameはそれぞれのindexの名前
groupby, pivot, reshape の場合
groupbyして windowな関数で処理した値を、元のdataFrameに戻すのがうまくない。
元のdataframeと、新しく作ったdataframeで、indexを元にjoinするのが、シンプルっぽいけど、
df1.join(df2, on="df1.indx???????"...)
onのところが上手くかけない。
明日、整理しよう。
ここに簡潔な説明があった。マニュアルな文章が読めてないだけか、、俺。