geopandas
自己紹介
小川英幸 
twitter @Ogawahideyuki
合同会社 長目経営中
データ分析
気象データを活用したり
衛星データを活用したり
資格: 証券アナリスト
本日の概要
GeoPandasとは
位置データを扱う
可視化する
GeoPandasとは
https://geopandas.org
Pythonで地理空間情報を扱うためのパッケージ / Pandas + Shapely
Pandasチックに表データを扱いながら、地理空間のデータ型を扱える
地理空間情報はshapelyを使用して処理する
注意
anacondaでのインストールが推奨されている
geopandasはPythonで書かれているが、GEOS, GDAL, PROJ辺りがCで書かれていて、いくらか依存がある。その辺りのインストールがややこしかったりする。
GEOS: 空間処理機能を持つ: shapelyに使われる
GDAL: 画像読み込みようライブラリ
PROJ: 座標参照系を良い塩梅に扱う
colab上でのインストール
install 資料: Part 1 - Introduction to Geographic Data Science
上のような感じでやると、エラー出ずに今のところ使えている
位置データを扱う
Shapely
geometry
Point: 点
LineString: 線
Polygon: 多角形
Colab: https://colab.research.google.com/drive/18-K9a9B41cu36s5aM5K9I7dZRbWd8SXz?usp=sharing
属性やメソッドを用いていろいろできる
ファイル
位置データを扱うファイル形式は色々ある。主に3つくらい?
Shapeファイル形式 最低3つのファイルに位置データなどがまとめられる
wikipedia: シェープファイル
.shp: 地形情報
.shx: 位置インデックス
.dbf: 属性
.prj: 座標系
などなど
知らないとshpファイル以外消してしまう。たくさんあるのはなんかいや
GeoJSONファイル形式
wikipedia: GeoJSON
一個のファイルで済む
KML
wikipedia: KML
google 様から位置データ取得するとこれに入っている(実際にはKMZというこれが圧縮された状態のファイル)
座標参照系
QGIS 投影法の利用方法
座標参照系(CRS)は、数値座標を地球の表面上の位置に関連付ける方法です。 QGISでは、約7,000の標準CRSに対応しており、それぞれそれぞれに異なる使途、長短があります!
朝日航洋 座標参照系(CRS)とは?
座標参照系は大きく分けて、「地理座標系」と「投影座標系」の2種類があります。 地理座標系は地球を球体とみなし、緯度経度で位置を表します。 投影座標系は地球の狭い範囲の一部を平面へ投影し、ある原点からの X 方向と Y 方向の距離で位置を表します。投影後のデータは、GIS 上でより正確な距離や面積、角度を測ることができます。
ファイルを読み込む
ようやくgeopandasが出てくる
京都の過疎地データの可視化
可視化はfoliumを使う
便利!
別にgeopandasを使わなくてもよい
colab: https://colab.research.google.com/drive/18-K9a9B41cu36s5aM5K9I7dZRbWd8SXz?authuser=2#scrollTo=4Bm0BvQaqF5Z
まとめ
geopandasをとりあげました
geopandasと言いつつ、ほぼshapelyな話でした
お伝えしたかったのは、位置データをまとめて扱えるのがgeopandasで、使うと便利ということでした