[Python3 網絡爬蟲開發實戰] 1.3.2-Beautiful Soup 的安裝
Beautiful Soup 是 Python 的一個 HTML 或 XML 的解析庫,我們可以用它來方便地從網頁中提取數據。它擁有強大的 API 和多樣的解析方式,本節就來了解下它的安裝方式。
1. 相關鏈接
官方文檔:https://www.crummy.com/software/BeautifulSoup/bs4/doc
中文文檔:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh
PyPI:https://pypi.python.org/pypi/beautifulsoup4
2. 準備工作
Beautiful Soup 的 HTML 和 XML 解析器是依賴于 lxml 庫的,所以在此之前請確保已經成功安裝好了 lxml 庫,具體的安裝方式參見上節。
3. pip 安裝
目前,Beautiful Soup 的最新版本是 4.x 版本,之前的版本已經停止開發了。這里推薦使用 pip 來安裝,安裝命令如下:
1
pip3 install beautifulsoup4
命令執行完畢之后即可完成安裝。
4. wheel 安裝
當然,我們也可以從 PyPI 下載 wheel 文件安裝,鏈接如下:https://pypi.python.org/pypi/beautifulsoup4
然后使用 pip 安裝 wheel 文件即可。
5. 驗證安裝
安裝完成之后,可以運行下面的代碼驗證一下:
1
2
3
from bs4 import BeautifulSoup
soup = BeautifulSoup('
Hello
', 'lxml')print(soup.p.string)
運行結果如下:
1
Hello
如果運行結果一致,則證明安裝成功。
注意,這里我們雖然安裝的是 beautifulsoup4 這個包,但是在引入的時候卻是 bs4。這是因為這個包源代碼本身的庫文件夾名稱就是 bs4,所以安裝完成之后,這個庫文件夾就被移入到本機 Python3 的 lib 庫里,所以識別到的庫文件名就叫作 bs4。
因此,包本身的名稱和我們使用時導入的包的名稱并不一定是一致的。
Python 網絡
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。