実行環境で使うwebブラウザ用のドライバをいれる(webDriver)
chromeDeiverを入れる。 https://chromedriver.chromium.org/downloads
geckodriverを入れる。 https://github.com/mozilla/geckodriver/releases
linuxなら展開後のバイナリ本体を/usr/local/bin/
へ入れる。
windowsならバイナリ本体をCドライブの任意フォルダへ入れて、PATHを通す
使用するwebドライバで挙動が変わる。 このサンプルはchrome向けにチューンされている。
行なっている手順としては次の通り
- ブラウザの立ち上げ
- URLの入力
- googleの検索バーへ文字列を代入
- 「検索ボタン」をクリック
webページ内にあるウィジェット(部品)の名前等を事前に調べる必要がある。
調べ方は各webブラウザの開発モードにして、webページの構造を解析する。
- test.py : 実行プログラム本体
- requirements.txt : プログラムに必要なモジュール
- setupAndRun.ps1 : powerShell用の環境構築&実行スクリプト
- .gitignore: gitで管理しないファイルとディレクトリの設定