duckdbからpandasのDataFrameを作る
duckdb
がdf()というメソッド持ってる
https://duckdb.org/docs/stable/guides/python/export_pandas.html
これが
pd.DataFrame
を返す
code:py
import duckdb
import pandas as pd
df = duckdb.sql("select * from read_json_auto('./data/prs-*-*.jsonl')").df()
df
'closedAt'
= pd.to_datetime(df
'closedAt'
)
df
'createdAt'
= pd.to_datetime(df
'createdAt'
)
日付をちゃんとするのにこういうのを挟む
ただし、duckdbが早いのでSQL側で頑張っても良いはず。
pandas
の資産に乗っかりたいときに使う