データベース研究にまつわる小ネタ集
論文を書くときに使えるような,小ネタをまとめていく
1. O(1) と O(log N) の計算量の違いは一桁性能を変えることもある
2. インメモリDBの処理時間の最大94%はインデックスが占める
4. Facebook (Meta) のラックコストの40%はDRAM
5. Microsoft Azure のサーバコストの50%はDRAM
6. HFT ではレイテンシが200ミリ秒を超えると収益が大幅に低下し,低ボラティリティの日は50ミリ秒でその兆候が現れる 7. Amazonでは100ミリ秒のレイテンシ低下が1%の売上減少につながる
8. DRAMの容量対価格は非線形。64GBのDRAM価格は16GBのそれの7倍
9. 2000ドルで買えるもの: 20x4TB HDD or 8x1TB NVMe or 3x128GB PMem or 12x32GB DRAM.費用対効果はNVMeがGood
10. ページロードが3秒を超えるとWeb Applicationの離脱率は非常に高くなる.0.5秒おきに20%のトラフィックが失われる
11. 多くのワークロードでは,Insert/Updateされてから次にPoint Readされるまでのレイテンシは短い.一方で,Range Scanで読み込まれるまでのレイテンシは長い.8秒~85秒に至ることもある
12. 多くのワークロードではOne-hit-wonder (一発屋) ratio が高い.キャッシュのサイズが小さいほどその割合は増える
13. Cloud functions (FAAS) をずっとactiveにしておくアプローチは仮想マシンよりも高くつく
14. 複数のデータストアを使うアプリケーションでは,少なくとも一つはトランザクショナルなDBMSを使用している