Pythonによるスクレイピング&機械学習 開発テクニック「BeautifulSoupでスクレイピングしよう」(P.31)をやってみた

Pythonによるスクレイピング&機械学習 開発テクニック BeautifulSoup,scikit-learn,TensorFlowを使ってみようの「BeautifulSoupでスクレイピングしよう」(P.31)をやってみました。BeautifulSoupをインストールして、スクレイピングの基礎を確認するところです。

  • 記事の内容や、操作を理解するための概念などは、このページには書きません。上のリンクから書籍を購入してご覧ください。

プログラムのダウンロード

以下の記事をご覧ください。

Pythonによるスクレイピング&機械学習 開発テクニック「プログラムのダウンロード方法」(P.5)をやってみた

TensorFlow with GPU supportのインストール

以下の記事をご覧ください。

TensorFlow with GPU supportをインストールしてみた

BeautifulSoupのインストール

  1. 」をクリックし、「Anaconda3 (64-bit)」→「Anaconda Prompt」の順番にクリックします。
  2. 「conda info -e」と入力して、Enterキーを押します。

    「tensorflow」実行環境が作成されていることを確認します。
  3. 「activate tensorflow」と入力して、Enterキーを押します。
  4. 書籍記事(P.32)の「pipでBeautifulSoupをインストールするには、以下のコマンドを実行します。」の下に記載されているコマンドを、「pip3」は「pip」に置き換えて入力して、Enterキーを押します。

BeautifulSoupの基本的な使い方

  1. 」をクリックし、「Anaconda3 (64-bit)」→「Anaconda Prompt」の順番にクリックします。
  2. 「conda info -e」と入力して、Enterキーを押します。

    「tensorflow」実行環境が作成されていることを確認します。
  3. 「activate tensorflow」と入力して、Enterキーを押します。
  4. 「D:」と入力して、Enterキーを押します。
  5. 「cd PythonScraping」と入力して、Enterキーを押します。
  6. 「cd src/ch1」と入力して、Enterキーを押します。
  7. 書籍記事(P.33)の「プログラムをコマンドラインから実行してみましょう。」の下に記載されているコマンドを、「python3」は「python」に置き換えて入力して、Enterキーを押します。

    BeautifulSoupによってテキスト部分が抽出されます。