Polarsの文字列操作
.str
code:py
out = df.select(
pl.col("animal"),
pl.col("animal").str.contains("cat|bit").alias("regex"),
pl.col("animal").str.contains("rab$", literal=True).alias("literal"),
pl.col("animal").str.starts_with("rab").alias("starts_with"),
pl.col("animal").str.ends_with("dog").alias("ends_with"),
)
正規表現も書けるし
str.extract
str.extract_all
str.replace
str.replace_all
区切り文字でsplitする
返り値はlist
区切り文字でsplitする
splitする上限数を指定する
structなおかげで、分割したものをそのままカラムに分けられる
code:py
df.with_columns(
pl.col("x")
.str.split_exact("_", 1)
.alias("fields")
).unnest("fields")