Python爬蟲：使用pyppeteer爬取動態加載的網站

網友投稿 896 2025-04-01

pyppeteer 類似selenium，可以操作Chrome瀏覽器

文檔：https://miyakogi.github.io/pyppeteer/index.html

github: https://github.com/miyakogi/pyppeteer

安裝

環境要求：

python 3.6+

pip install pyppeteer

代碼示例

# -*- coding: utf-8 -*- import asyncio from pyppeteer import launch from pyquery import PyQuery as pq # 最好指定一下自己瀏覽器的位置，如果不指定會自動下載，太慢了... executable_path = "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" # 示例一：渲染頁面 async def crawl_page(): # 打開瀏覽器 browser = await launch(executablePath=executable_path) # 打開tab page = await browser.newPage() # 輸入網址回車 await page.goto('http://quotes.toscrape.com/js/') # 獲取內容并解析 doc = pq(await page.content()) print('Quotes:', doc('.quote').length) # 關閉瀏覽器 await browser.close() # 示例二：截圖，保存pdf，執行js async def save_pdf(): browser = await launch(executablePath=executable_path) page = await browser.newPage() await page.goto('http://quotes.toscrape.com/js/') # 網頁截圖保存 await page.screenshot(path='example.png') # 網頁導出 PDF 保存 await page.pdf(path='example.pdf') # 執行 JavaScript dimensions = await page.evaluate('''() => { return { width: document.documentElement.clientWidth, height: document.documentElement.clientHeight, deviceScaleFactor: window.devicePixelRatio, } }''') print(dimensions) await browser.close() if __name__ == '__main__': asyncio.get_event_loop().run_until_complete(crawl_page()) # asyncio.get_event_loop().run_until_complete(save_pdf())

Python爬蟲：使用pyppeteer爬取動態加載的網站

異步編程，這個關鍵字太多了，看的眼花繚亂

參考

別只用 Selenium，新神器 Pyppeteer 繞過淘寶更簡單！

Python 網站

標簽：異步編程 Application javaScript

接口測試 --apipost 如何自定義變量">接口測試 --apipost 如何自定義變量

896 2025-04-01

ABAP Netweaver, Hybris Commerce和SAP 云平臺的登錄認證

896 2025-04-01

前生今世，你真的了解嗎">JavaScript的前生今世，你真的了解嗎

896 2025-04-01

Python爬蟲：使用pyppeteer爬取動態加載的網站

接口測試 --apipost 如何自定義變量">接口測試 --apipost 如何自定義變量

ABAP Netweaver, Hybris Commerce和SAP 云平臺的登錄認證

前生今世，你真的了解嗎">JavaScript的前生今世，你真的了解嗎

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

定制家居數字化管理模式：提升品質、智能化和個性化的未

智能定制家居管理系統：重新定義家庭生活方式

友情鏈接