アーキテクチャ道場 2025 - 実践編!
📄 Summarized by Claude Sonnet 4.6
アーキテクチャ道場 2025 - 実践編!
2025年6月24日(AWS Summit Japan 2025 セッション AWS-42)
どんなもの?
AWS Summit Japan 2025 で発表された実践的アーキテクチャ解説セッション。過去3年間の「スケーラビリティ・モダナイゼーション・レジリエンス」というテーマを踏まえ、2025年は「現実世界の問題解決から学ぶ」をコンセプトに2社の実例を深掘りする。
お題1:株式会社ZOZO — 過熱商品の在庫DB更新ボトルネック解決
お題2:SBIセキュリティ・ソリューションズ株式会社 — 地方銀行向け次世代勘定系システムの高可用性設計
抽出された3つの実践知:①進化できるアーキテクチャ(変化・適応)、②課題と制約の明確化、③論理モデルから物理モデルへの設計順序
先行研究と比べてどこがすごい?
従来のアーキテクチャ道場は一般的な設計パターンの紹介が中心だったのに対し、本セッションは実在する企業の制約・数値目標・フェーズ分割まで含んだ実解を提示している点が異なる。
ZOZOの事例では「7ヶ月以内」「在庫DBはクラウド移行不可」という厳しい現実的制約の下で段階的アーキテクチャを設計しており、教科書的な最適解ではなく"今できるベスト"を示している。
SBIの事例ではマイクロサービス×勘定系という通常は相反するとされる組み合わせを、RTO数値と運用フロー設計を含めて実証的に示した点が際立つ。
技術や手法のキモはどこ?
ZOZO 在庫DB更新スケール対応
フェーズ1:更新処理の非同期化(キューイングシステム)
ポイント①:冪等性の確保 — 状態管理テーブルで取出し済みトランザクションをスキップ
ポイント②:過熱商品の負荷分離 — 過熱商品専用キューを分割し通常商品への影響を遮断。過熱商品テーブルを自動メンテナンス(アクセスログから自動登録)
ポイント③:非同期でも在庫引当を疑似同期に — カートAPI側でステータスをポーリングし、引当失敗時はエラーレスポンスを返すことでUXを維持
フェーズ2:在庫数をAmazon DynamoDB(KVS=キーバリューストア)に切り出し
ロックフリーなKVSへ論理在庫数を移管し、オンプレの物理在庫DBとは補正バッチで整合性を維持
異種DB間でトランザクションが使えないため、RDBMS変更キャプチャ機能+補正バッチで不整合を検知・修正
最終成果:以前の5倍以上のカート投入リクエストでも安定稼働を実現(Amazon EKS / Amazon DynamoDB / Amazon Kinesis 構成)
SBI 次世代バンキングシステム 高可用性設計
ノード・AZ障害(RTO=1分):アクティブ・アクティブ構成
3 AZ冗長+1 AZ分の余剰リソース起動でAZ切離し後も縮退なし
Amazon EKS Liveness/Readiness Probe + Amazon Aurora 自動フェイルオーバー
大規模AZ障害には AWS Application Recovery Controller のゾーンシフトを活用
リージョン障害(RTO=1時間):アクティブ・パッシブ(ウォームスタンバイ)構成
Aurora Global Database でデータを大阪リージョンへレプリケーション
DNSの名前解決切替で災対リージョンへトラフィック転送
AWS CodePipeline + AWS Step Functions + AWS Lambda で承認フローを含む切替作業を自動化
銀行業界特有の通信方式(セッション維持・固定IPアドレス接続)への対応
クラウドのステートレスな通信と金融レガシーのステートフルな接続を「中継センタ」が緩衝層として変換
中継センタ自体もファシリティ・物理NW・通信経路の3要素をすべて冗長化
どうやって有効だと検証した?
ZOZO:フェーズ1完成後にセールイベントを無事に乗り越えたことで実証。5倍以上の負荷耐性を本番トラフィックで確認。
SBI:ノード・AZ障害試験は AWS Fault Injection Service を用いて開発環境で実施。リージョン切替試験は本番環境のシステムメンテナンス時間を利用し、定期的な「切替訓練」として実施(大阪リージョンでの稼働実績を積み上げることでシステム継続性の問題を排除)。
議論はある?
SBIのリージョン切替について、最終判断は人間(地方銀行様)が行う設計になっており、銀行業務のチェックポイント(コアタイム・夜間バッチ等)を勘案する必要がある。システムメトリクスのみでの自動判断は困難という現実的な制約が残る。
ZOZOの補正バッチによる整合性担保は、物理在庫と論理在庫の乖離をリアルタイムには防げず、準整合性(結果整合性)での運用となる点はトレードオフとして明示されている。
大規模AZ障害のゾーンシフト自動化は「当面の実装」として人間の判断を挟む形にとどまっており、「理想の実装」(自動化)は引き続き検討中とされている。
#アーキテクチャ設計
#AWS
#マイクロサービス
#高可用性
#レジリエンス