SRE Kaigi
▶️すぐ切り戻しできるようにする仕組み
制約が導く迷わない設計 〜 信頼性と運用性を両立するマイナンバー管理システムの実践
・制約ゆえ判断がしやすかった
・可逆性を高める
・Any Decision Record(ADR)▶️読み合わせをする、良さそう
過去の判断に対するジャッジ
SREが向き合う大規模リアーキテクチャ〜信頼性とアジリティの両立〜
・アラートがノイズになる
・Simple Monitor
・アプリのECSとバッチのECS
・データごとにスクリプトを分けている▶️レイヤー間の依存がない↔︎複合条件のようなものはできない、ハードコードされる
・条件や閾値をユーザー毎にカスタマイズすることを考えてない
・イベントテーブル(中間処理)▶️シナリオ毎に検索
・閾値の設定とイベントテーブルの設計
・ドライランモード→フラグ、前日にバッチ実行してロールバックさせて、翌朝の障害発生を防ぐ
・並行実行
Everything as code
Everything as Code は、バージョン管理、テスト、デプロイという同じ原則を適⽤して、ネットワークインフラストラクチャ、ドキュメンテーション、構成など、開発ライフサイクルのあらゆる側⾯の保守性とスケーラビリティを⾼めることを⽬的としたソフトウェア開発⼿法です。
AIと新時代を切り拓く。これからのSREとメルカリIBISの挑戦
・過去事例の活用が非効率
・インシデントのデータ取り込んで、RAGつかって解析
・問い合わせなども対応できる
・RAGにするのを苦労している
認知負荷を最小化するオブザーバビリティとSLOの導入 ―4名のSREが200名のプロダクトエンジニアを支援
・信頼性とアジリティはトレードオフだが両立させたい
・エラーバジェット:SLOから逸脱することが許容される範囲
クリティカルユーザージャーニー(CUJ)
・多くの目標を達成するために共通するタスクや、非常に重要な目標を達成するために行う一連の流れ
・CUJからSLI/SLOを考える
・プロダクトに関わる人たちが参加する
・ユーザージャーニーだけ考える↔︎APIとかは考えない
・顧客価値ベースでSLOを考える
プロンプトインジェクション
メモリーポイズニング
モデル抽出攻撃
植え付けの方もあるのか
・SAST 静的解析
・DAST 動的解析→擬似攻撃