spam収集実験
spam受信専用のアドレスを用意し、そこに来たspamメールを煮たり焼いたりする実験。
元々spamフィルタの学習実験として始まったもの。
Season 6終了後約1年程度実験休止していたことがあった。理由としては
Season 5やSeason 6においてReem(詐欺師)なspamが大半を占めておりつまらなくなった rita-ch.comの期限切れによるドメイン放棄
が挙げられる。
2021/01/01 00:30にSeason 7 「謎のヒロインX」 heroinex@spacebucks.spaceの運用を開始、2022/12/25 15:22をもって終了した。
ドメインレジストラ(Gandi)のメールサービスを使っていた。メールボックス2個標準付帯なので。 晒しあげ基準とか
原則として受信したすべてのメールをrita.xyz/spam/内に保存し公開する。
フォルダは言語別(ja, en, zhなど)に分けるが、マルウェアメール(本文)のみmalwareに収容する。
あまりにも同一内容のメールが多い場合、公開に必要な各種処理(画像・リンク書き換え等)が困難な場合は公開しない場合がある。
公開にあたって、ヘッダーは最低限の情報(From/To/Subject/Date/Reply-To/X-Mailer)のみ併記し、本文は可能な限りオリジナルのまま公開するが、以下に該当する場合は必要な処理を行う。
From欄などにおいて第三者のアドレスが無断で使われている可能性が高いと判断した場合は一部を伏せ字とする場合がある。
例: John Doe <taro@example.com> → John Doe <t**o@ex***le.com>
フィッシング詐欺サイトや偽ブランド品販売サイトなど危険性・違法性があるサイトはURLの一部を伏せ字とする。
それ以外の場合でも公開処理時の判断により伏せ字とする場合がある。
例: amz-conf1rm.example.net → amz-conf1rm.ex***le.net、example.com/AbCdEF → example.com/A****F
メール内の画像が外部リソースから呼び出されている場合、開封確認ビーコン等を兼ねている場合を除きメールと同じフォルダ内もしくはサブフォルダ内に画像を保存しそこから呼び出すように変更する。
例: <img src="//cdn.example.com/1234/5678/9012/test.jpg" border="0"> → <img src="test.jpg" border="0">
例2: ↳<img src="example-spam/test.jpg" border="0">
開封確認ビーコンなどはコメントアウトする。
例: <!-- <img src="//example.net/open?uid=1234567890&mid=9876543210&cid=123456" border="0" width="1" height="1"> -->
HTMLメールかつ無害なサイトへのリンクを残したままにする場合、検索スコア等に影響しないようrel="nofollow"を付与する。
例: <a href="//example.com/" rel="nofollow">example.com</a>
歴代の実験アドレスは以下の通り。すべて廃止済。
Season1: lambda@rita-ch.com
「ラムダ」。こっそり実験していたため記事はない上受信数の記録なし。
Season2: barbatos@rita-ch.com (状況報告記事一覧) 「バルバトス」。受信数390通。
Season3: oi@super-kitakami.net (状況報告記事一覧) 「大井」。受信数26通。
「肉」(フランス語)。受信数121通。
「肉 第二弾」(「肉」のエスペラント語)。受信数200通(運用開始から1年以上経過したためキリのいいタイミングで運用終了)。
Season6: bifsteko@rita-ch.com (状況報告記事一覧) 「ステーキ」(エスペラント語)。受信数31通。運用開始当初ドメイン有効期限切れが半年後に迫っていたため最初から期限を設けて運用した。