jQuery選擇器
1000
2025-04-01
使用XPath
XPath,全稱XML Path Language,即XML路徑語言,它是在XML語言中查找信息的語言。它最初是用來搜尋XML文檔的,但是它同樣適用于HTML文檔的搜索。
在上一篇文章中講述了正則表達式的使用方法,正則表達式的難度還是比較大的,如果不花足夠多的時間去做的話還是比較難的,所以今天就來分享比正則簡單的內容,方便大家接下來的學習。
XPath常用規則
XPath的規則是非常豐富的,本篇文章無法一次性全部概括,只能為大家介紹幾個常用的規則。
準備工作
在使用之前得先安裝好lxml這個庫,如果沒有安裝請參考下面的安裝方式。
pip?install?lxml
案例導入
現在通過實例來xpath對網頁解析的過程
from?lxml?import?etree
text?=?'''