TensorRT-LLMによる推論高速化 - NVIDIA AI Summit Japan 2024
https://scrapbox.io/files/673601810ab40e8e25e779ef.png
https://scrapbox.io/files/67360278212999a8449c1974.png
DP: Data Parallel データ並列
TP: Tensor Parallel (Tensor Model Parallel) テンソル並列
PP: Pipeline Parallel (Pipeline Model Parallel) パイプライン並列