Scrapbox分析2023
Scrapboxいじめ
唐突に思いついたScrapboxいじめnishio.icon
プロジェクトをブルートフォースしたのかな?inajob.icon
ongoingnishio.icon
タイトルからは別の内容を想起したinajob.icon
何これw
あるんだw
大文字小文字は同一視されるのか
全部ではないですがこんなのができました
1341 projects 重複があったので直した
pageNum: undefinedだ
関連
Fatal JavaScript out of memory: Reached heap limit
割としばしばこの死に方をするプロジェクトがある
--v8-flags=--max-old-space-size=8000
ほんとかな、まあ後で試そう
ネットいじめ的な文脈とエッジケース探しみたいなものがある
「前回と同じ感じで統計をしよう」と思ったが前回はそもそもクロールなどしてなかったことに今更気づいた
ターミナルをぶっ壊す謎の文字が出現
https://gyazo.com/9f427585ccb82c03a093440e4f57a75e
https://gyazo.com/43be4a710e2fb4a921d89a15706c0f85
よく見たら白いところもやばいな
https://gyazo.com/b0c55915313a9a04859098ef09c124bd
ウケる
https://gyazo.com/b45cf4fb7063ad3a46e1c9b93c03cbfc
998件のpublic projectがクロールされた
なんの分析をするつもりだったのかは忘れた()
とりあえずZipして共有しようか?w
クロール済みページ数
全781163ページ
シェアするのも大変だな、55GBもある
テキストデータだけでこんなになるんかtakker.icon
開いたらタブがフリーズしたtakker.icon
External Linkっぽいもの出現頻度ランキング
/suto3/google.iconみたいなアイコンがたくさんでるのでそれらは省くことにした
トップが'[/takker/一日を始める前にみるページ]'なの/icons/どうして.icontakker.icon
振り返りページのテンプレートに入れてたせいか
なんかすまん
[/?#\\{}^|<>]がどのprojectにも存在しないのにランキングに上がってる
codeのバグかな
違うなnishio.icon
External linkの出現回数を数えると、同じ人が一つのプロジェクト内で、特定の外のページに言及しまくってる時にそれが強く出ちゃう
そうではなく「異なるプロジェクトから言及されている」をカウントすべきか