はてなブログの全画像をダウンロードする
https://cdn-ak.f.st-hatena.com/images/fotolife.*png|https://cdn-ak.f.st-hatena.com/images/fotolife.*gif|https://cdn-ak.f.st-hatena.com/images/fotolife.*jpg
url一覧を得る
grep
https://gyazo.com/202452d54dcda1545d5e73494a9e9de4
replace
.*(img src) to empty
.*IMAGE: to empty
=" to empty
".* to empty
要するに前後の要らん部分を.*全一致で広く刈り取っていくだけsta.icon
でけた
https://gyazo.com/4bbe000a4f90a0e9b322ce06971a6630
ダウンロードする
フリーソフト使うのあれなので、スクリでいいよな
image.txtにurlリストアップして、
wget -i image.txtでいけるらしい
へーsta.icon
wget持ってません
実行
code:error.terminal
$ D:\bin\wget\bin\wget.exe -i image_of_galapa.txt
SYSTEM_WGETRC = c:/progra~1/wget/etc/wgetrc
syswgetrc = D:\bin\wget/etc/wgetrc
cdn-ak.f.st-hatena.com をDNSに問いあわせています... 23.54.121.240
cdn-ak.f.st-hatena.com|23.54.121.240|:443 に接続しています... 接続しました。
エラー: cdn-ak.f.st-hatena.com の証明書(発行者: /C=US/O=DigiCert Inc/OU=www.digicert.com/CN=GeoT
rust RSA CA 2018)の検証に失敗しました:
発行者の権限を検証できませんでした。
エラー: 証明書に記載されている名前 cdn-ak.b.st-hatena.com' とホスト名 cdn-ak.f.st-hatena.com'
が一致しません
cdn-ak.f.st-hatena.com に安全の確認をしないで接続するには、`--no-check-certificate' を使ってくだ
さい。
no cert でいくしかねえよなこれsta.icon
お、DLされ始めた
code:commandline.terminal
$ D:\bin\wget\bin\wget.exe -i image_of_galapa.txt
https://gyazo.com/d5f3d6c2c7b83e1b94d8255d535a5daa
謎の拡張子
https://gyazo.com/ea6a971584f91aa2c6be015573975b54
なんか同名ファイルが存在してるからっぽい
https://gyazo.com/8c07e3cb6202a7de6cb17fbd48929343
元データの方に存在してたので、消していい
ああ、そうか、同じ画像を複数回ブログ記事で引用すれば、こうなるんだ
おしまい
ガラパゴスタ
code:terminal
終了しました --2021-08-28 20:10:36--
ダウンロード完了: 657 ファイル、72M バイトを 2.5s で取得 (29.1 MB/s)
stamemo
code:terminal
終了しました --2021-08-28 20:17:20--
ダウンロード完了: 657 ファイル、72M バイトを 2.3s で取得 (31.4 MB/s)