「AWS負荷試験入門」を読んだ

順次追記していく

各種ユースケースを想定し、それぞれにおけるシステムの応答速度を推測する　大量のデータ登録データ容量の増加ユーザ数の増加バッチ処理とのバッティングシステムが異常系を返す再起動直後でキャッシュが効かない場合など
高負荷時におけるシステムの性能改善を行う応答速度の低下ロックの競合エラー発生データ不整合
目的の性能を提供するために必要なハードウェアをあらかじめ選定するクラウドはあまり気にしなくて良い
システムがスケール性をもつことを確認する
システムのスケール特性を把握するどこを上げれば性能が上がるのか上げるためのダウンタイムはどれくらいかどこまで上がるのか(限界がある場合は今の構成でどれくらいのユーザ数増加まで耐えられるのかを把握する)

大きく分けて 2 つ

システムは複数のサブシステムから成る(Web,API,DB など)

スループットがもっとも低い箇所(ボトルネック)を特定 → 改善する → 別の場所がボトルネックになる → 改善する

の繰り返し

待ち時間を含んでいるのがミソ一見処理時間が長いサブシステムが原因に見えても、その先のサブシステムのスループットが低く、待ち時間が発生してるということもある。ボトルネック関係なく、短くした分全体の性能の改善につながる

スループットが上がる → レイテンシーが上がる、の流れ

スループットの目標値一定時間にどの程度アクセスがあるか

(A _ B) / 86,400 秒= 1 日の平均 rps 1 日の平均 rps _ C = 最大ピーク時の倍率 = 最大 rps

最大 rps に安全係数(2 とか 3)をかけて数字をスループットの目標値とする。この目標値が達成できれば想定されるアクセスを捌ける、と考える。

例スループット=20000DAU 1 人あたりの平均アクセス数=50 1 日平均アクセス数に対する最大ピーク時の倍率=5 倍安全係数=2

rps= 30,000 _ 50 / 86,400 _ 5 * 2 = 173.6rps