pip
from モジュール
標準モジュール以外でも便利なモジュールがあります。
それを管理してくれるのがpipというコマンドで、パッケージ管理ツールと呼ばれます。
今回はスクレイピングで用いるrequests/BeautifulSoup/lxmlを例にして学びましょう。
注意:Anacondaではpipの代わりに「conda」を使うこともできます。どちらか一方のみを使いましょう。両方を同じ環境で使うと環境が壊れることがあります。
※プロキシ環境下でcondaやpipを使う場合はこちらを参照ください。
Proxy環境下での conda や pip を使用方法
Anacondaでは、pipで導入するツールの中でも利用頻度が高いものや便利なものは予めinstallしてくれています。
インストールされているモジュールを確認するにはlistコマンドを使います。
code:shell
conda list
# conda で表示が出来ない場合
pip list
今回使うrequests/BeautifulSoup4/lxml/chardetがなければinstallコマンドで導入しておきましょう。
code:shell
conda install requests beautifulsoup4 lxml chardet
# conda でインストール出来ない場合
pip install requests beautifulsoup4 lxml chardet
ビルトイン関数のdir()の引数に呼び出したモジュールやクラスを入れて実行すると、モジュールやクラスが持っている変数、メソッドなどを確認できます。
code:sample_module6.py
import requests
from bs4 import BeautifulSoup as soup
print(dir(requests))
print(dir(soup))
from モジュール
next スクレイピング