Pandas で特定の列に値が含まれている場合のみ取り出す
Excel file などでこういうのがよくある。
table: excel
id value notes
1 10
2 15 要注意データ
3 15
合計
40
これを pandas.read_excel で読み込むと以下のようになる。
table: read_excel
id value notes
1 10 NaN
2 15 要注意データ
3 15 NaN
NaN NaN 合計
NaN NaN 40
これに対して pandas.DataFrame.dropna すると以下のようになってしまう。
table: dropna
id value notes
2 15 要注意データ
そこで
code:python
とすれば以下のようにできる。
table: read_excel
id value notes
1 10 NaN
2 15 要注意データ
3 15 NaN