Polarsで欠損値を扱う
from PolarsのExpression
Polarsで欠損値を扱う
https://docs.pola.rs/user-guide/expressions/missing-data/#null-and-nan-values
df.null_count()
各カラムの欠損値の数
pl.is_null()
欠損データの補完
https://docs.pola.rs/user-guide/expressions/missing-data/#filling-missing-data
pl.fill_null()
code:py
pl.col("col2").fill_null(pl.lit(2)) # リテラルで補完
pl.col("col2").fill_null(strategy="forward") # strategy
pl.col("col2").fill_null(pl.median("col2")) # 式で補完
pl.col("col2").interpolate() # 補間で補完
NaN
欠損データ(null)とは区別される
https://docs.pola.rs/user-guide/expressions/missing-data/#notanumber-or-nan-values
空文字をnullにしたい
code:py
df = df.with_column(
pl.when(pl.col("col1") == "")
.then(None)
.otherwise(pl.col("col1"))
.alias("col1")
)