Transformer
自然言語処理のモデル
CNNやRNNを用いず、Attentionのみを用いる
BERTやGPTにも使われている
論文
Attention Is All You Need
Misreading Chatでの解説