ブラウザからのアクセスが期待されているデータをWgetで保存する

ブラウザからのアクセスが期待されている場合、ブラウザ以外からアクセスすると403 Forbiddenエラーが返される事がある

ブラウザと同じ振る舞いをする必要がある

User-AgentやRefererの情報が必要になる

ブラウザの開発者機能のネットワークタブの、ヘッダー情報から確認できる

pixivにFirefoxでアクセスした場合

要求ヘッダー

User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:120.0) Gecko/20100101 Firefox/120.0

Referer: https://www.pixiv.net/

Wgetにブラウザと同じ振る舞いをしてもらう

user agent spoofing

複数ダウンロードする

$ chmod +x ./script.shで実行許可を与えておく

code:download_images.sh

# 変数の定義

EXT=".jpg"

START_PAGE=0 # 開始ページ番号

END_PAGE=10 # 終了ページ番号

USER_AGENT="Mozilla/5.0"

# ページ数の範囲をループ

for PAGE in $(seq $START_PAGE $END_PAGE); do

URL="${BASE_URL}${PAGE}${EXT}"

echo "Downloading: $URL"

wget --user-agent="$USER_AGENT" --referer="$REFERER" -q "$URL"

# ステータスの確認

echo "Failed to download $URL"

else

echo "Successfully downloaded $URL"

sleep 10

done

echo "Download process completed."