データの管理
#WIP
/mrsekut-book-4802612907/116 (6.3 データの保管・管理)
どこでデータを管理すべきか悩むmrsekut.icon
個人情報もあったりするので、そこかしこに保存するのはやりたくない
GitHub上にもあまり残しておきたくない
一箇所で管理したい
実データが入っていないと同じコードを実行できない
ただ、Jupyter上でdf.head()などで逐一結果を出力しておくようにしておけば、閲覧する分には困らない
理想的には、そのタイミングで使ったデータをバージョン管理して保存したりしたい
RDSに直接アクセスしたり、S3にスナップショットを残したり色々あるっぽい
これは調査が必要mrsekut.icon
個人情報の取り扱い
/mrsekut-book-4802612907/117
そもそも取得しないようにする
ガイドラインを用意してそれに従う
匿名加工情報を使う