ScalableなWeb Application設計

Scalableなアプリケーションを作るためにどういうことをやっているのか知っていることを抽象的にひたすらあげる

具体的なやり方は具体的なソフトと構成とともに調べる必要あり

MECEではない

一般的なボトルネックとその対応

ネットワーク帯域

対応

一度の通信量を減らす（データサイズを小さくする）

チャンクに分割

そもそも不要なデータがあったらデータ量を減らす

オーバーヘッドの少ないプロトコルを採用する

通信を分散する

リクエストを減らす

細かいリクエストが複数あったら、リクエストをまとめられるかも？

bulk処理をイメージ

computingの処理速度（CPU/GPU）

対応

処理を分散する

queueに積んで非同期に処理

動的にリソースをコントロールする

Edge computingをする

CDNで処理

クライアントで処理する

ブラウザにcomputingを任せる

スペックの低いスマホで全然動かなかったりする

探索にかかる時間

DBのSelectが遅い/検索でのserchが遅い

対応

データの持ち方を検討してDBの特性を考慮

やりたいタスクに特化したDBを採用する

分析なら分析用DBにデータを置くとか

検索は検索用サーバーに置くとか

探索範囲を絞る

scale out, sharding, Partitioning, 垂直分割

computing powerで解決

scale up

replication

ディスクIOが遅い

とにかくdisk I/Oは遅いのでアクセスさせないのがキモ

対応

キャッシュを使う

CDNを使う

その他対応

効率的なアルゴリズムを採用する

探索範囲を絞る

表示までが遅い

対応

非同期にリソース取得できるところは非同期にする

storage容量

比較的簡単に大きくできるので問題になりづらい？

とはいえ余計なものはいらない

共通の手法としてスケールアップがある

エンジニアリングとしては最も簡単な手法

金で解決

スケールアップ以外は基本的に面倒

stateがあると問題は一気に面倒になる。そしてstateはたいていある。

キャッシュはstateを持つ

expireはいつかの問題（「データが更新されない！」）

アクセス権限（間違って誰でもアクセスできるようになっているとやばい）

scale outでも

DBのshardingのように状態をもつと、どこにどの情報があるのかを意識する必要が出てくる

stateがないwebサーバーは増やせばいいだけだけど

同じユーザーの1セッション中のAPIリクエストは絶対に同じサーバーに来てほしいならLBでうけた同一クライアントのリクエストを同一のサーバに送る対応をする必要あり

分散は面倒

排他制御

ロック何が起きている問題

でも分散しないといけないのが普通

絶対ハマるので、気づきやすくするようにmonitoringしておくのが安心

高負荷に耐えうる WebApplication の作り方 | GMOインターネットグループ次世代システム研究室

scale up

CPU clock/coreが高いのを重視

scale out

最適化

コード

OS/middlewareのconfig

port枯渇問題

portがなくなると新しい通信ができない

Linuxのportは65535

自由に使えるEphemeral portは32768-61000の28232個

Linux kernel parameterでポート追加が可能

DBサーバの同時接続数がAPIサーバの最大数の上限

DBに接続できないAPIサーバーがあっても意味ない

memcahed

都度T CPセッションはるからport枯渇しやすい

垂直分割

このスライドではカラムでの分割のことを言っていなくて

機能ごとにDBを分けるという表現をしてる

アプリケーションでDBアクセスを分ける

スケーラブルな Web アプリケーション - Azure Reference Architectures | Microsoft Docs