Attention
RNNにおいて,どれくらいの過去の状態を予測に用いるかの重みをネットワークに組み込んだもの.
各時刻での回帰結合層の状態を保持することで実現する.