DeepSeek-R1-0528
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
deepseek-ai/DeepSeek-R1-0528
https://gyazo.com/e733ee16cff3f6443771b3e1eebfda8a
Qwen3 8B
に蒸留したモデル
Qwen3(235B)と同等性能
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
https://huggingface.co/unsloth/DeepSeek-R1-GGUF
unsloth
/DeepSeek-R1-GGUF
https://huggingface.co/unsloth/DeepSeek-R1-0528-Qwen3-8B-GGUF
unsloth/
DeepSeek-R1-0528-Qwen3-8B-GGUF
特定のレイヤーを
1.58-bit量子化
して80%のサイズ削減したモデル
https://unsloth.ai/blog/deepseekr1-dynamic
Run DeepSeek R1 Dynamic 1.58-bit
https://docs.unsloth.ai/basics/deepseek-r1-0528-how-to-run-locally#recommended-settings
ローカルで動かす方法
←
DeepSeek-R1
#DeepSeek_AI