<del id="6gksi"></del>

Scrapyd 的安裝

網(wǎng)友投稿 709 2025-04-04

Scrapyd 是一個用于部署和運行 Scrapy 項目的工具。有了它，你可以將寫好的 Scrapy 項目上傳到云主機(jī)并通過 API 來控制它的運行。

既然是 Scrapy 項目部署，所以基本上都使用 Linux 主機(jī)，所以本節(jié)的安裝是針對于 Linux 主機(jī)的。

相關(guān)鏈接

GitHub：https://github.com/scrapy/scrapyd

PyPi：https://pypi.python.org/pypi/scrapyd

官方文檔：https://scrapyd.readthedocs.io

pip 安裝

推薦使用 pip 安裝，命令如下：

pip3 install scrapyd

配置

安裝完畢之后需要新建一個配置文件 /etc/scrapyd/scrapyd.conf，Scrapyd 在運行的時候會讀取此配置文件。

在 Scrapyd 1.2 版本之后不會自動創(chuàng)建該文件，需要我們自行添加。

執(zhí)行命令新建文件：

sudo mkdir /etc/scrapyd

sudo vi /etc/scrapyd/scrapyd.conf

寫入如下內(nèi)容：

[scrapyd]

eggs_dir = eggs

logs_dir = logs

items_dir =

jobs_to_keep = 5

dbs_dir = dbs

max_proc = 0

max_proc_per_cpu = 10

finished_to_keep = 100

poll_interval = 5.0

bind_address = 0.0.0.0

http_port = 6800

debug = off

runner = scrapyd.runner

application = scrapyd.app.application

launcher = scrapyd.launcher.Launcher

webroot = scrapyd.website.Root

[services]

schedule.json = scrapyd.webservice.Schedule

cancel.json = scrapyd.webservice.Cancel

addversion.json = scrapyd.webservice.AddVersion

listprojects.json = scrapyd.webservice.ListProjects

listversions.json = scrapyd.webservice.ListVersions

listspiders.json = scrapyd.webservice.ListSpiders

delproject.json = scrapyd.webservice.DeleteProject

delversion.json = scrapyd.webservice.DeleteVersion

listjobs.json = scrapyd.webservice.ListJobs

daemonstatus.json = scrapyd.webservice.DaemonStatus

配置文件的內(nèi)容可以參見官方文檔：https://scrapyd.readthedocs.io/en/stable/config.html#example-configuration-file，在這里的配置文件有所修改，其中之一是 max_proc_per_cpu 官方默認(rèn)為 4，即一臺主機(jī)每個 CPU 最多運行 4 個 Scrapy Job，在此提高為 10，另外一個是 bind_address，默認(rèn)為本地 127.0.0.1，在此修改為 0.0.0.0，以使外網(wǎng)可以訪問。

后臺運行

由于 Scrapyd 是一個純 Python 項目，在這里可以直接調(diào)用 scrapyd 來運行，為了使程序一直在后臺運行，Linux 和 Mac 可以使用如下命令：

(scrapyd > /dev/null &)

這樣 Scrapyd 就會在后臺持續(xù)運行了，控制臺輸出直接忽略，當(dāng)然如果想記錄輸出日志可以修改輸出目標(biāo)，如：

(scrapyd > ~/scrapyd.log &)

則會輸出 Scrapyd 運行輸出到～/scrapyd.log 文件中。

運行之后便可以在瀏覽器的 6800 訪問 WebUI 了，可以簡略看到當(dāng)前 Scrapyd 的運行 Job、Log 等內(nèi)容，如圖所示：

當(dāng)然運行 Scrapyd 更佳的方式是使用 Supervisor 守護(hù)進(jìn)程運行，如果感興趣可以參考：http://supervisord.org/。

訪問認(rèn)證

限制配置完成之后 Scrapyd 和它的接口都是可以公開訪問的，如果要想配置訪問認(rèn)證的話可以借助于 Nginx 做反向代理，在這里需要先安裝 Nginx 服務(wù)器。

在此以 Ubuntu 為例進(jìn)行說明，安裝命令如下：

sudo apt-get install nginx

然后修改 Nginx 的配置文件 nginx.conf，增加如下配置：

http {

server {

listen 6801;

location / {

proxy_pass http://127.0.0.1:6800/;

auth_basic "Restricted";

Scrapyd 的安裝

auth_basic_user_file /etc/nginx/conf.d/.htpasswd;

}

在這里使用的用戶名密碼配置放置在 /etc/nginx/conf.d 目錄，我們需要使用 htpasswd 命令創(chuàng)建，例如創(chuàng)建一個用戶名為 admin 的文件，命令如下：

htpasswd -c .htpasswd admin

接下就會提示我們輸入密碼，輸入兩次之后，就會生成密碼文件，查看一下內(nèi)容：

cat .htpasswd

admin:5ZBxQr0rCqwbc

配置完成之后我們重啟一下 Nginx 服務(wù)，運行如下命令：

sudo nginx -s reload

這樣就成功配置了 Scrapyd 的訪問認(rèn)證了。

Nginx

版權(quán)聲明：本文內(nèi)容由網(wǎng)絡(luò)用戶投稿，版權(quán)歸原作者所有，本站不擁有其著作權(quán)，亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容，請聯(lián)系我們jiasou666@gmail.com 處理，核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。

標(biāo)簽：Scrapyd 安裝

相關(guān)文章

安裝】純凈版安裝如何只格式化C盤，其他盤符數(shù)據(jù)仍然保留">【W(wǎng)IN10安裝】純凈版安裝如何只格式化C盤，其他盤符數(shù)據(jù)仍然保留

709 2025-04-04

dAPI 的安裝">ScrapydAPI 的安裝

709 2025-04-04

安裝 vagrant&virtualBox">安裝 vagrant&virtualBox

709 2025-04-04

<ul id="smg2c"></ul>

<fieldset id="smg2c"></fieldset>

<ul id="smg2c"></ul><ul id="smg2c"><sup id="smg2c"></sup></ul>

Scrapyd 的安裝

安裝】純凈版安裝如何只格式化C盤，其他盤符數(shù)據(jù)仍然保留">【W(wǎng)IN10安裝】純凈版安裝如何只格式化C盤，其他盤符數(shù)據(jù)仍然保留

dAPI 的安裝">ScrapydAPI 的安裝

安裝 vagrant&virtualBox">安裝 vagrant&virtualBox

推薦文章

企業(yè)生產(chǎn)管理是什么，企業(yè)生產(chǎn)管理軟件

進(jìn)盤點進(jìn)銷存軟件排行榜前十名

進(jìn)銷存系統(tǒng)哪個簡單好用？進(jìn)銷存系統(tǒng)優(yōu)點

工廠生產(chǎn)管理（工廠生產(chǎn)管理流程及制度）

生產(chǎn)管理軟件，機(jī)械制造業(yè)生產(chǎn)管理，制造業(yè)生產(chǎn)過程管理軟件

進(jìn)銷存軟件和ERP有什么區(qū)別？進(jìn)銷存與erp軟件理解

進(jìn)銷存如何進(jìn)行庫存管理

如何利用excel制作銷售訂單管理系統(tǒng)？

數(shù)據(jù)庫訂單管理系統(tǒng)有哪些功能？數(shù)據(jù)庫訂單管理系統(tǒng)怎么設(shè)計？

什么是數(shù)據(jù)庫管理系統(tǒng)？

最近發(fā)表

熱評文章

零代碼開發(fā)是什么？2022低代碼平臺排行榜">零代碼開發(fā)是什么？2022低代碼平臺排行榜

進(jìn)銷存庫存管理 系統(tǒng)（智慧進(jìn)銷存）">智能進(jìn)銷存庫存管理系統(tǒng)（智慧進(jìn)銷存）

在線文檔哪家強(qiáng)？8款在線文檔編輯軟件推薦">在線文檔哪家強(qiáng)？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

系統(tǒng)的功能有哪些？餐飲服務(wù)系統(tǒng)的構(gòu)成及工作程序">連鎖餐飲管理系統(tǒng)的功能有哪些？餐飲服務(wù)系統(tǒng)的構(gòu)成及工

進(jìn)銷存庫存管理盤點">簡單進(jìn)銷存庫存管理盤點

友情鏈接

Scrapyd 的安裝

安裝】純凈版安裝如何只格式化C盤，其他盤符數(shù)據(jù)仍然保留">【W(wǎng)IN10安裝】純凈版安裝如何只格式化C盤，其他盤符數(shù)據(jù)仍然保留

dAPI 的安裝">ScrapydAPI 的安裝

安裝vagrant&amp;virtualBox">安裝vagrant&amp;virtualBox

推薦文章

最近發(fā)表

熱評文章

零代碼開發(fā)是什么？2022低代碼平臺排行榜">零代碼開發(fā)是什么？2022低代碼平臺排行榜

進(jìn)銷存庫存管理系統(tǒng)（智慧進(jìn)銷存）">智能進(jìn)銷存庫存管理系統(tǒng)（智慧進(jìn)銷存）

在線文檔哪家強(qiáng)？8款在線文檔編輯軟件推薦">在線文檔哪家強(qiáng)？8款在線文檔編輯軟件推薦

系統(tǒng)的功能有哪些？餐飲服務(wù)系統(tǒng)的構(gòu)成及工作程序">連鎖餐飲管理系統(tǒng)的功能有哪些？餐飲服務(wù)系統(tǒng)的構(gòu)成及工

進(jìn)銷存庫存管理盤點">簡單進(jìn)銷存庫存管理盤點

友情鏈接

安裝 vagrant&virtualBox">安裝 vagrant&virtualBox