データの管理
どこでデータを管理すべきか悩むmrsekut.icon
個人情報もあったりするので、そこかしこに保存するのはやりたくない
GitHub上にもあまり残しておきたくない
一箇所で管理したい
実データが入っていないと同じコードを実行できない
ただ、Jupyter上でdf.head()などで逐一結果を出力しておくようにしておけば、閲覧する分には困らない
理想的には、そのタイミングで使ったデータをバージョン管理して保存したりしたい
RDSに直接アクセスしたり、S3にスナップショットを残したり色々あるっぽい これは調査が必要mrsekut.icon
そもそも取得しないようにする
ガイドラインを用意してそれに従う