pandas multi-index
#pandas_index
最初にここをよむのがよいかも。index要らない、全部columnでいいのでは?という気がしてたが、少し考え変わるかも。
pandasのMultiIndexについて - Qiita
利点(why)から説明してくれてる。
もちろん、公式文書も必要 Hierarchical indexing という単語を強調してる?
MultiIndex / Advanced Indexing — pandas 0.23.4 documentation
an arbitrary number of dimensions in lower dimensional data structures
が利点と。
まとめとしては、以下を読むのがよい。網羅的に分かった感じがする。このサイトはすごい。
pandasのMultiIndexから任意の行・列を選択、抽出 | note.nkmk.me
multi indexには順番があり、外側から指定するには、タプルで指定すればよい。
内側のみ指定したい場合は、slice(None)を使うか、pd.IndexSliceを使うか、pandas.DataFrame.xs(level=)を使うか。
pandas.DataFrame.xs — pandas 0.23.4 documentation
glossary
levels, labels, names
multi indexにおいては、levelはその階層的indexの階層の何番目か。labelはindexを指定する際の値。nameはそれぞれのindexの名前
Pandas index names, axis labels, and levels - Stack Overflow
#あとで見る
groupby, pivot, reshape の場合
groupbyして windowな関数で処理した値を、元のdataFrameに戻すのがうまくない。
元のdataframeと、新しく作ったdataframeで、indexを元にjoinするのが、シンプルっぽいけど、
df1.join(df2, on="df1.indx???????"...)
onのところが上手くかけない。
明日、整理しよう。
pandas.DataFrame.join — pandas documentation
ここに簡潔な説明があった。マニュアルな文章が読めてないだけか、、俺。
Python pandas 図でみる データ連結 / 結合処理 - StatsFragments
#pandas #python