LLaDA
https://github.com/ML-GSAI/LLaDA
ML-GSAI/LLaDA
https://arxiv.org/abs/2502.09992
Large Language Diffusion Models
これまでにない8Bスケールの
拡散モデル
であるLLaDA(
Large Language Diffusion with mAsking
)を、ゼロから完全に学習させたものです。
LLaMA3 8B
に匹敵する性能。
ウェイトファイル
https://huggingface.co/GSAI-ML/LLaDA-8B-Base
GSAI-ML/LLaDA-8B-Base
https://huggingface.co/GSAI-ML/LLaDA-8B-Instruct/
GSAI-ML/LLaDA-8B-Instruct
diffusion llm