日時エンコーディング
文章中の場所を
Positional Encoding
で埋め込むことができる
時間軸上
の一点も同様に埋め込める
人間にとって
自然な周期
がいくつかあるからそれを採用した方が良いのでは
24時間
1週間(7倍)
28日(4倍)
365日(13倍)
12年(12倍)
144年(12倍)
適当に間を等比級数的に分割しても良い
Twitterやブログなどでの
自分の過去のアウトプット
を
コーパス
化する
その際に、日時がわかるものに関して日時を捨てる必要はない
学習データに混ぜ込みたい