爬蟲學習(10):xpath爬取包圖網高清模板視頻
暫時我就沒有發xpath基礎知識了,編輯太浪費時間了,需要了解或者有問題的可以加我群問我就好了,我也正在努力學習中,不廢話了,上代碼,解釋都在注釋.
先看效果:
開始的時候下載的還不是那么高清,后來我琢磨半天才下載到高清的模板視頻:
import requests#發送請求 from lxml import etree#處理數據 header={ 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36' }#請求頭 url='https://ibaotu.com/shipin/7-0-0-0-0-1.html'#網址 response=Requests.get(url=url,headers=header)#發送請求 html_text=response.content.decode('utf-8')#編譯 html=etree.HTML(html_text)#自動修正html文檔 video_url=html.xpath('//div[@class="video-play"]/video/@src')#視頻網址 video_names=html.xpath('//span[@class="video-title"]/text()')#視頻名稱 # print(video_url,video_names) path='D://code//my python code//爬蟲//shipin//'#視頻存放地址 for src,title in zip(video_url,video_names): video_url = "https:" + src#視頻url url=video_url.replace(".mp4_10s","")#增加畫質url file_name = (title + ".mp4")#文件名 response=requests.get(url=url,headers=header)#在此發送新的請求 with open(path+file_name,'wb') as f: #把文件寫入path地址 f.write(response.content) print("%s下載成功"%file_name)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
還有問題就自己加我群問我吧,其實我覺得解釋挺詳細了,加油吧。
視頻
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。