Selenium 與 Python 之間如何才能交融在一起
如果你有想要交流的想法、技術,歡迎在評論區留言。

本文主要內容為 selenium 安裝,并且打通與 Python 之間的聯系。
selenium 安裝
安裝方式有兩種,具體如下。其實不僅僅是 Selenium,任何 Python 中的第三方庫都有兩種安裝方式。
通過 pip 工具安裝
pip 是 Python 的包管理工具,新版本的 Python 安裝之后會自帶該工具,默認該工具所在的路徑為 你電腦 Python的安裝路徑\Python37\Scripts。
安裝完畢之后在 CMD 命令窗口中,使用 pip 可以查閱到如下界面。如果沒有出現,注意排查錯誤。常規情況下是環境變量沒有配置。
安裝 Selenium 之前可以通過下述命令確定本機是否已經安裝過。
pip show selenium
由于我已經安裝過,故展示的界面如下圖所示。
如果沒有安裝,安裝命令如下:
pip install selenium
在國內安裝,經常受網速影響,導致通過 pip 安裝失敗,此時可以切換 pip 源,分為兩種切換方式,永久和臨時切換。
永久方式
修改 Windows 目錄 C:\Users\Administrator\AppData\Roaming 下,找到 pip 文件夾,如果沒有,自行創建一個。
進入 pip 文件夾,新建一個 pip.ini 的配置文件,注意文件后綴名
在 pip.ini 中粘貼下述內容,保存退出
[global] # 超時設置,設置 10 秒 timeout = 10000 # 設定下載源,當前為豆瓣源 index-url = http://pypi.douban.com/simple/ # 指定域名 [install] trusted-host= pypi.douban.com
如果運行命令發現如下錯誤提示。
Configuration file contains invalid cp936 characters in C:\Users\Administrator\AppData\Roaming\pip\pip.ini.
刪掉注釋即可。
pip 國內的一些鏡像
阿里云 http://mirrors.aliyun.com/pypi/simple/
中國科技大學 https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) http://pypi.douban.com/simple/
清華大學 https://pypi.tuna.tsinghua.edu.cn/simple/
中國科學技術大學 http://pypi.mirrors.ustc.edu.cn/simple/
運行安裝命令 pip install selenium 即可快速安裝。
臨時方式
使用 pip 命令可以臨時指定 pip 源,命令如下:
pip install selenium -i https://pypi.mirrors.ustc.edu.cn/simple/
以上在安裝的時候,命令中通過 -i 源地址 可以臨時設置 pip 目標源。
pip 安裝指定版本的 selenium
通過 pip install selenium == 3.141.0 可以安裝對應版本號的 Selenium。
升級 selenium
升級到最新版本的 Selenium 使用的命令是 pip install --upgrade selenium。升級之后舊版本會被覆蓋。
卸載 Selenium
使用 pip uninstall selenium 卸載已經安裝的 Selenium。
pip 常用命令如下
pip download 軟件包名(==版本號) 下載庫的指定版本,如果沒有設定版本號,下載最新版;
pip list 列出當前環境下已經安裝的第三方庫;
pip install 軟件包名(==版本號) 在線安裝指定版本的第三方庫,如果沒有設定版本號,安裝最新版;
pip install 軟件包名.whl 通過 whl 離線包安裝文件安裝第三方庫;
pip install 軟件包 1 軟件包 2 軟件包 3 通過名稱依次安裝第三方庫,注意中間用空格分隔開;
pip install -r list.txt 依次安裝 list.txt 中指定的安裝包;
pip install --upgrade 軟件包名 升級軟件包;
pip uninstall 軟件包名(==版本號) 卸載指定版本的軟件包。
通過官方離線包進行 Selenium 的安裝
訪問 Selenium 官方之后,下載離線文件,下載之后使用 python setup.py install命令安裝,此處不再細說,一般通過 pip 工具都可安裝成功。
pip 安裝包對應的說明地址為:https://pypi.org/project/selenium/
瀏覽器驅動
Selenium 安裝完畢之后,還需要一個瀏覽器驅動,一般叫做 Webdriver,環境配置才算完畢。
不同的瀏覽器需要的驅動不同,針對于每個瀏覽器,Selenium 官方都給出了驅動-。注意谷歌瀏覽器的打不開,參照最后一個地址進行下載。
Chrome: https://sites.google.com/a/chromium.org/chromedriver/downloads
Edge: https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
Firefox: https://github.com/mozilla/geckodriver/releases
Safari: https://webkit.org/blog/6900/webdriver-support-in-safari-10/
以上都為官方地址,鑒于國內特殊原因,上述網站都可能不穩定,所以我們選擇國內相關鏡像。
https://npm.taobao.org/mirrors/
打開上述網址之后,所有的瀏覽器對應的驅動都可以隨意下載,速度快,由于我電腦上一直使用的是 ChromeDriver,所以后續課程都用火狐瀏覽器來完成,即 geckodriver。
下載之前,先看好本地火狐瀏覽器的版本。例如我本地版本為 83.0 版本。
從 Selenium 官方提供的對應關系,找到 Webdriver 的版本。
https://firefox-source-docs.mozilla.org/testing/geckodriver/Support.html
在-中找到對應的 0.28.0 版本。
進入下載 Windows 版本。
瀏覽器驅動目錄
這一步非常重要,翻車必備,在電腦上任意磁盤創建一個 D:\webdriver 文件夾,將下載好的文件拷貝進去,如下圖所示。
注意下述步驟:
計算機 —— 右鍵屬性 —— 高級系統設置 —— 環境變量 —— 系統變量
找到 Path 值,將 D:\webdriver 路徑添加進去
關于環境變量如何配置,自行檢索
接下來任意創建一個 Python 文件,輸入如下代碼。
from selenium import webdriver import time open_driver = webdriver.Firefox() # open_driver = webdriver.Chrome() # open_driver = webdriver.PhantomJS() open_driver.get('https://www.baidu.com') time.sleep(5) open_driver.close()
運行代碼之后,如果沒有任何錯誤,瀏覽器會打開百度首頁,并且成功喚醒了火狐瀏覽器,恭喜自己一下吧,你成功了。
PhantomJS 是一個無界面瀏覽器,因此在運行的時候是不會有瀏覽器窗口顯示的,后續課程中也會用到它。
Python Selenium
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。