scrapboxとクローラ
適当なページをcurlするとわかるが, scrapboxでは①「俺らが見てるページ」と②「クローラが見てるページ」が違う
②はかなり簡素で, 本文のみがベタ書きされたものであり, 被リンクや1hop-linkなどは特に記述されない
ここが問題で, ②は内部リンクを削っているにも拘わらず, descriptionとしてリンクのタイトルが列挙してあることがあるため, しょっちゅう変な感じでGoogleに登録される
例えば, 被リンクはないが2hopで別ページから飛べるようなページは, 1hop目のページのdescriptionが検索に引っかかって訳のわからん状態になる
例: X→Y←Z
X (内部でYをリンク・被リンクなし)
Y (本文なし)
Z (内部でYをリンク)
YやZのdescriptionにはXの文言が入っているので, 「X」と検索するとYかZのページが検索結果に出る
またクローラは②を見ているのでYからXへと辿ることができず, Yの被リンク数だけが相対的に高くなる
具体例
Y=知識グラフなどのdescriptionが引っかかってカオス状態となる 多分, XよりもYのほうが被リンク数が多いのでこっちが引っかかっちゃうのだと思われる
内容のボリューム的にはX >>>> Y = ∅なのだが...
Y = ∅(本文ゼロ)なのに引っかかっちゃうのが良くないよね
https://gyazo.com/9f2d541901f4d72881c91682d048741b
なので, 俺らが思っている以上にクローラはページ同士がつながっているように見えてないし, クロールできる半径もかなり限られている
クローラが見つけやすいように目次=リンク集があるとSEO的にはうれしいはず
ページtopにピン留めしとけば必ずクローラは全ページを巡回できる
(もちろん, 用途によってはscrapboxはSEOに強いだろうし, こうした事態もscrapboxの設計思想自体に端を発していると思うが, 俺のように, 調べ物をそのままページ化しておいて, 割かしリンクとしては言及しないような人間には厳しい設計である.別に誰かに見てほしいというわけではないが, そうは言いつつ誰にも見られないというのも悲しきものだ.) 目次の生成
code:copy.sh
others