EDINETスクレイピング
作業の流れ
1. 更新する期間のXBRLファイルのURLを収集
2. XBRLファイルをDL → CSVに変換
3. CSVから必要なデータを抽出する
まだ全銘柄をスクレイピングしていないので、element_idの確認が必要
一回作業して、歯抜けを探す
index( match() )とif(isna(),index(),index())で対応
※ 次回から、新規上場のデータも取得できるようにする
element id
ここで欲しい情報のelement_idを特定する
※ 現時点だと不十分・・・USGAAP等が含まれていない
taxonomy自体は、分類(学)。
wordpressでも taxonomy(category, tag)を使う.