分散コンピューティング
概要
複数の計算機を仮想的に一つにまとめて強力なマシンを作る
単一の一貫したシステムとみなせる独立したマシンの集合
利用者は単一のシステムと感じる
目的によってマシンの構成方法や協調方法は大きく変わる
IoTセンサーからスパコンまでなんでもOK
メリット
作業を分担することで性能向上
マシンがいくつか壊れても動くので可用性が高い
マシンの追加・削除が簡単なのでスケーラブル
安価なマシンを使用しても良い
応用例
GFS(Google)
Dynamo(Amazon)
Hadoop
GFSなどを参考にしたOSS
Cassandra
DynamoやBigTableを参考にしたOSS
分散コンピューティングの落とし穴(間違った理解)
ネットワークは高信頼である
ネットワークはセキュア
ネットワークは均一
ネットワークトポロジは変化しない
ネットワークは遅延はない
ネットワーク帯域は無限である
通信のコストはない
管理者は一人
関連
詳細
分散システムに必要な要素
タイミングモデル
同期、非同期、準同期
プロセス間通信
メッセージ送信、メモリ共有
故障モード
クラッシュ
故障検出機能
リーダー選出
合意
Quorums
分散システムの時間
FLPの概要
参考文献
論文
スライド
分散システムの概要
筑波大学 建部修見
分散処理システムの動向とその運用
株式会社IIJ 前橋孝広
What We Talk About When We Talk About Distributed Systems
Alvaro Videla
Web
分散システムについて語るときに我々の語ること ― 分散システムにまつわる重要な概念について
Alvaro Videla