Webサイトをまるっとダウンロードしたい
wgetコマンドを用いた再帰的なダウンロード処理が可能.
code: Linux
brew install wget
以下コマンドで、対象のWebサイトをダウンロード
code:Linux
wget -m -p -E -k -np https://
OPTION
-m, -mirror: 再帰的なダウンロード
-p, -page-requisities: HTMLを表示するのに必要なすべての画像ファイルを取得する -E, -adjust-extension: HTML/CSSファイルは適切な拡張子で保存する -k, -convert-links: HTMLやCSS中のリンクをローカルを指すように変更する(相対パスに変換) -np, -no-parent: 親ディレクトリを取得対象にしない(リンク階層を上に)
-nH, -no-host-directions: ホスト名のディレクトリを作らない
-nd, -no-directories: ディレクトリを作らない
-q, -quiet: ダウンロード中の内容を画面表示しない
-i, -input-file=FILE: FILEの中に指定されたURLをダウンロードする
-nc, -no-clobber: 存在しているファイルをダウンロードで上書きしない(-k とは併用不可)
-N, -timestamping: ローカルにあるファイルよりも新しいファイルだけ取得する
-w, -wait=SECONDS: ダウンロード毎にSECONDS秒待つ
-U, -user-agent=AGENT User-AgentとしてWget/VERSIONではなくAGENTを使う