ブログから技術記事を抽出・集約してワイワイする
https://onk.hatenablog.jp/entry/2021/12/18/000000
技術記事を Hatena Developer Blog (会社のテックブログ) に書くこともありますが、個人ブログの集合体がコミュニティなんだよって気持ちから、個人ブログに書くのももちろん推奨されています。
毎週木曜日に技術勉強会を開催していますが、その中でも月初は特別編として、社外向けに書かれた技術記事をまとめて眺めています。
100ブクマでお祝い
これを実現するためには個人ブログの技術記事を集約する必要があり、そのデータとして全員のアウトプット先を YAML として持っています。
ブログリストをyamlで管理(プルリクで更新)
kind はパーサ向けの情報。
weight は面白機能で、Hatena Developer Blog に書いた場合は、特上寿司獲得ランキングにおいて 2 倍のスコアになります。
リアルタイムにワイワイする、イコール Slack の #engineer に流す、をやりたい。
新着をポーリング
新着判定は、記事 URL が一意なので、前回までに見た記事 URL に含まれているかどうかで判定可能。
技術記事かどうかを判定
技術記事かどうかを判定するのは、意外とヒューリスティックな方法でもそこそこの精度が出ます。
単語境界を工夫
とまれ今は技術ワード 200 個ぐらいについて正規表現でマッチした個数で判定を行っています。
技術記事判定ができているので、スタッフの個人ブログをまとめて公開することもできるようになったなぁと考えています。
2年運用(2020, 2021)
ブログの URL を入れると技術記事のみの title, url が帰ってくる API を用意しました。
叩いてみたい!