df.select()
#wip
配列も、ただの引数も行ける
code:py
df.select('a', 'b')
df.select('a', 'b')
動的型付みあるなあmrsekut.icon
pl.col()を使わなくても取れるということ
ただし、その場合aliasなど、諸々の演算はできない
一部の行を除外
code:py
out = df.select(pl.col("*").exclude("logged_at", "index"))
カラムに対する演算 ref
code:py
df_alias = df.select(
(pl.col("nrs") + 5).alias("nrs + 5"),
(pl.col("nrs") - 5).alias("nrs - 5"),
)
ユニークな数を数える ref
2つある
厳密なもの
pl.n_unique()
概算
pl.approx_n_unique()
HyperLogLog++
pl.when()
https://docs.pola.rs/user-guide/expressions/window/#window-expression-rules
type 1とtype2のとこ
pl.col()使わなくても動くのか、なぜ
code:py
out = df.select(
"Type 1",
"Type 2",
pl.col("Attack").mean().over("Type 1").alias("avg_attack_by_type"),
pl.col("Defense")
.mean()
.over("Type 1", "Type 2")
.alias("avg_defense_by_type_combination"),
pl.col("Attack").mean().alias("avg_attack"),
)
print(out)
https://docs.pola.rs/api/python/stable/reference/selectors.html#module-polars.selectors