geopandas
自己紹介
小川英幸
データ分析
気象データを活用したり
衛星データを活用したり
資格: 証券アナリスト
本日の概要
GeoPandasとは
位置データを扱う
可視化する
GeoPandasとは
Pandasチックに表データを扱いながら、地理空間のデータ型を扱える
地理空間情報はshapelyを使用して処理する
注意
anacondaでのインストールが推奨されている
geopandasはPythonで書かれているが、GEOS, GDAL, PROJ辺りがCで書かれていて、いくらか依存がある。その辺りのインストールがややこしかったりする。
GEOS: 空間処理機能を持つ: shapelyに使われる colab上でのインストール
上のような感じでやると、エラー出ずに今のところ使えている
位置データを扱う
Shapely
geometry
Point: 点
LineString: 線
Polygon: 多角形
属性やメソッドを用いていろいろできる
ファイル
位置データを扱うファイル形式は色々ある。主に3つくらい?
Shapeファイル形式 最低3つのファイルに位置データなどがまとめられる
.shp: 地形情報
.shx: 位置インデックス
.dbf: 属性
.prj: 座標系
などなど
知らないとshpファイル以外消してしまう。たくさんあるのはなんかいや
GeoJSONファイル形式
一個のファイルで済む
KML
google 様から位置データ取得するとこれに入っている(実際にはKMZというこれが圧縮された状態のファイル)
座標参照系
座標参照系(CRS)は、数値座標を地球の表面上の位置に関連付ける方法です。 QGISでは、約7,000の標準CRSに対応しており、それぞれそれぞれに異なる使途、長短があります!
座標参照系は大きく分けて、「地理座標系」と「投影座標系」の2種類があります。 地理座標系は地球を球体とみなし、緯度経度で位置を表します。 投影座標系は地球の狭い範囲の一部を平面へ投影し、ある原点からの X 方向と Y 方向の距離で位置を表します。投影後のデータは、GIS 上でより正確な距離や面積、角度を測ることができます。
ファイルを読み込む
ようやくgeopandasが出てくる
京都の過疎地データの可視化
可視化はfoliumを使う
便利!
別にgeopandasを使わなくてもよい
まとめ
geopandasをとりあげました
geopandasと言いつつ、ほぼshapelyな話でした
お伝えしたかったのは、位置データをまとめて扱えるのがgeopandasで、使うと便利ということでした