使用Pandas的read_html方法讀取網頁Table表格數據
本文通過一個小實例,說明使用Pandas的Read_html方法讀取網頁Table表格數據
要讀取的網頁表格數據
http://vip.stock.finance.sina.com.cn/q/go.php/vComStockHold/kind/jjzc/index.phtml
完整代碼
# -*- coding: utf-8 -*- import pandas as pd # 數據出現省略號 pd.set_option('display.width', None) url = 'http://vip.stock.finance.sina.com.cn/q/go.php/vComStockHold/kind/jjzc/index.phtml' # 可能有多個表格,我們取第一個 df = pd.Read_html(url)[0] # print(data) # 保存數據 df.to_csv('./data.csv', encoding='utf-8')
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
打開讀取的數據結果,效果還是非常不錯的
更多的用法可以研究下文檔
參考:
天秀!Pandas還能用來寫爬蟲?
HTML
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。