HannariPython-#15-201903 Hands-On 作戦会議室
Pandas & Matplotlib 会
日程:3月15日金曜日
会場:スプーキーズ
概要
・くまちゃんLT
・自己紹介積み木式
・Pandasの基本的な使い方
・データの整形
・データの可視化(Matplotlib)←豆腐問題もあるし、ほとんど触れる余裕はないかもしれません。。。
使いたいデータ候補
・私が2日かかった大阪市自動車保有データ(エクセル) 30分くらいでできるのかどうか知りたい!!
このエクセルはとてもつらくて良い教材ですね(そっ閉じしてしまいました笑)
→pandas の read_excel では厳しいので xlrd を使ってやってみました。できなくはないですが、かなり面倒でした。シート数が100とかならこの方法でやる意味はありそう・・・
→もう一度見なおしてみたら、 xlrd を使わずとも pandas read_excel でもできそうですね。。
→最速を目指すなら、欲しい部分を手動でコピペして、csvのようにして読ませるのが楽で速い方法かもしれません・・・。
これならpythonコード自体は10行程度でdfにできそう(シート数が50くらいまでならなんとか・・・)
やっぱ手動を入れた方が早いですよね〜w
でもまたそれでミスが…(略
都道府県のGDPデータ
read_excelのオプションでindex_col=None, header=Noneにしないと、0列目に5列分入って出てくるという・・・
データセット
データとかいいながらPDFが多い問題!!
リポジトリ
これ入れとけばたぶん困らんやろリスト!
pip install numpy
pip install pandas
pip install pandas-datareader
pip install plotly
pip install matplotlib
pip install seaborn
pip install bokeh
pip install dash
pip install altair
pip install vega
pip install vega_datasets
pip install japanize_matplotlib
pip install qgrid
pip install tqdm
pip install sklearn
pip install ipython
pip install jupyter
pip install ipdb
絶対に困らないと思いますw