DeepSeek-R1-0528
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528deepseek-ai/DeepSeek-R1-0528
https://gyazo.com/e733ee16cff3f6443771b3e1eebfda8a
Qwen3 8Bに蒸留したモデル
Qwen3(235B)と同等性能
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8Bdeepseek-ai/DeepSeek-R1-0528-Qwen3-8B
https://huggingface.co/unsloth/DeepSeek-R1-GGUFunsloth/DeepSeek-R1-GGUF
https://huggingface.co/unsloth/DeepSeek-R1-0528-Qwen3-8B-GGUFunsloth/DeepSeek-R1-0528-Qwen3-8B-GGUF
特定のレイヤーを1.58-bit量子化して80%のサイズ削減したモデル
https://unsloth.ai/blog/deepseekr1-dynamicRun DeepSeek R1 Dynamic 1.58-bit
https://docs.unsloth.ai/basics/deepseek-r1-0528-how-to-run-locally#recommended-settingsローカルで動かす方法
← DeepSeek-R1
#DeepSeek_AI