Python爬蟲網頁解析神器Xpath快速入門教學!!!

      網友投稿 1143 2022-05-29

      1、Xpath介紹

      2、Xpath路徑表達式

      3、結合實例講解

      1、Xpath介紹

      2、Xpath路徑表達式

      3、結合實例講解

      1、Xpath介紹

      XPath 是一門在 XML 文檔中查找信息的語言。XPath 可用來在 XML 文檔中對元素和屬性進行遍歷。

      2、Xpath路徑表達式

      3、結合實例講解

      這里我就是使用百度的界面為大家進行講解

      ==例==:我想獲取圖中的百度熱榜,打開控制臺,我們可直接根據div標簽的class值進行定位(這是我們平時使用xpath語法比較多的地方)

      from lxml import etree import requests headers = { "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36" } url = "https://www.baidu.com/" response = requests.get(url=url,headers=headers) #使用etree進行解析 data = etree.HTML(response.text) #可參考上表格進行對比,//div可理解為任意路徑下的一個div標簽,@class表示選取class屬性,text()表示獲取text文本 name = data.xpath("http://div[@class='title-text c-font-medium c-color-t']/text()") print(name[0])

      ==例==:我想獲取熱榜有哪些信息,參考下圖可見其全部在ul標簽下,每一個信息對于一個li標簽

      data = etree.HTML(response.text) #//ul表示任意路徑下的ul標簽, #表示獲取ul下的所有li標簽 ul = data.xpath("http://ul[@class='s-hotsearch-content']/li") #當然,大家在爬取過程中可能會遇到沒有class屬性的標簽,這時可使用id定位,又或者定位其父標簽,再往下找 #ul = data.xpath("http://ul[@id='hotsearch-content-wrapper']/li") #遍歷 for li in ul: # .//span表示當前節點下的任意span標簽,我們再根據class值定位,使用text()獲取文本信息 name = li.xpath(".//span[@class='title-content-title']/text()") print(name[0])

      ==例==:定位百度熱榜找它的父節點也就是a標簽的href屬性

      Python爬蟲網頁解析神器Xpath快速入門教學!!!

      data = etree.HTML(response.text) #..表示其父節點 url = data.xpath("http://div[@class='title-text c-font-medium c-color-t']/../@href") print(url[0])

      Xpath語法其實不難的,大家需要多練習,進行實戰,這樣熟練掌握會很快的,可以下方的爬蟲教程索引,里面有很多爬蟲使用xpath寫的,可以閱讀看看。

      博主會持續更新,有興趣的小伙伴可以、關注和下哦,你們的支持就是我創作最大的動力!

      XML

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:MongoDB 正則表達式
      下一篇:Android開發新手——第三方遇到的坑
      相關文章
      亚洲男女一区二区三区| 亚洲成AV人片一区二区| 久久久影院亚洲精品| 国产成人精品久久亚洲高清不卡 | 亚洲AV无码一区二区三区网址| 国产AV旡码专区亚洲AV苍井空| 久久亚洲私人国产精品vA| 色婷婷六月亚洲婷婷丁香| 亚洲成人动漫在线| 亚洲一区精品中文字幕| 亚洲视频中文字幕| 亚洲视频精品在线观看| 亚洲色欲或者高潮影院| 亚洲综合男人的天堂色婷婷| 亚洲国产成人综合| 亚洲Av无码一区二区二三区| 亚洲卡一卡二卡乱码新区| 中国亚洲呦女专区| 亚洲国产aⅴ成人精品无吗| 亚洲AV永久无码精品放毛片| 九九精品国产亚洲AV日韩| 亚洲a∨无码一区二区| 国产成人久久精品亚洲小说| 亚洲视频一区二区| 亚洲熟妇av一区二区三区| 日本亚洲欧洲免费天堂午夜看片女人员 | 亚洲综合精品伊人久久| 亚洲欧美国产国产综合一区| 蜜臀亚洲AV无码精品国产午夜.| 国产成人亚洲精品播放器下载 | 亚洲第一香蕉视频| 亚洲 欧洲 自拍 另类 校园| 亚洲人成网站在线播放2019| 99亚洲精品卡2卡三卡4卡2卡| 亚洲精品国产精品乱码不卡| 亚洲人成人77777网站| 亚洲日韩区在线电影| 亚洲伊人精品综合在合线| 亚洲欧美国产欧美色欲| 亚洲成人一区二区| 亚洲乱亚洲乱妇无码麻豆|