SageAttention
https://github.com/woct0rdho/SageAttention/releases
Windows用ビルド済みバイナリ
1.06なら普通にpipで入る(30xxならこちらで良い)
RTX 40XXだと2.x.x系で性能が上がり、RTX 50XXだと2.x.x系の対応になるためビルドをしたりする必要があり、Windows環境だと導入難度が跳ね上がる。
Nvidia GPUの場合、shader modelという機能が8.0以降じゃないと動かない
Triton
との連携でミスるらしい
triton + sageattention error: RuntimeError: PassManager::run failed · Issue #6228 · comfyanonymous/ComfyUI
自分のGPUがいくつなのかは、以下のサイトで調べると分かる(外部サイト注意)
GPU Database | TechPowerUp