Polarsで欠損値を扱う
各カラムの欠損値の数
欠損データの補完
code:py
pl.col("col2").fill_null(pl.lit(2)) # リテラルで補完
pl.col("col2").fill_null(strategy="forward") # strategy
pl.col("col2").fill_null(pl.median("col2")) # 式で補完
pl.col("col2").interpolate() # 補間で補完
NaN
欠損データ(null)とは区別される
空文字をnullにしたい
code:py
df = df.with_column(
pl.when(pl.col("col1") == "")
.then(None)
.otherwise(pl.col("col1"))
.alias("col1")
)