Python 爬蟲進階二之 PySpider 框架安裝配置
關于
首先,在此附上項目的地址,以及官方文檔 PySpider 官方文檔
安裝
1. pip
首先確保你已經安裝了 pip,若沒有安裝,請參照 pip 安裝
2. phantomjs
PhantomJS 是一個基于 WebKit 的服務器端 JavaScript API。它全面支持 web 而不需瀏覽器支持,其快速、原生支持各種 Web 標準:DOM 處理、CSS 選擇器、JSON、Canvas 和 SVG。 PhantomJS 可以用于頁面自動化、網絡監測、網頁截屏以及無界面測試等。 安裝 以上附有官方安裝方式,如果你是 Ubuntu 或 Mac OS X 用戶,可以直接用命令來安裝 Ubuntu:
1
sudo apt-get install phantomjs
Mac OS X:
1
brew install phantomjs
3. pyspider
直接利用 pip 安裝即可
1
pip install pyspider
如果你是 Ubuntu 用戶,請提前安裝好以下支持類庫
1
sudo apt-get install python python-dev python-distribute python-pip libcurl4-openssl-dev libxml2-dev libxslt1-dev python-lxml
測試 如果安裝過程沒有提示任何錯誤,那就證明一些 OK。 命令行輸入
1
pyspider all
然后瀏覽器訪問 http://localhost:5000 觀察一下效果,如果可以正常出現 PySpider 的頁面,那證明一切 OK 在此附圖一張,這是我寫了幾個爬蟲之后的界面。 好,接下來我會進一步介紹這個框架的使用。
常見錯誤
Python
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。