ucbug軟件站:安全、綠色、放心的專業(yè)下載站!首頁|最近更新|專題集合|標(biāo)簽云|站內(nèi)導(dǎo)航|加入收藏
Crawlab(分布式爬蟲管理平臺(tái))v0.5.1免費(fèi)版

Crawlab(分布式爬蟲管理平臺(tái))v0.5.1免費(fèi)版

  • 軟件大?。?span>1.27 MB
  • 更新日期:2020-10-02
  • 軟件語言:簡體中文
  • 軟件類別:國產(chǎn)軟件
  • 軟件授權(quán):免費(fèi)版
  • 評(píng)分等級(jí):
  • 插件情況:無插件請(qǐng)放心使用
  • 軟件官網(wǎng)://www.evoucherdeals.com
  • 適用平臺(tái):Win All
本地下載文件大?。?.27 MB高速下載高速下載器,提速50%
軟件介紹人氣軟件相關(guān)文章下載地址

Crawlab是基于Golang的分布式爬蟲管理平臺(tái),支持Python、NodeJS、Go、Java、PHP等多種編程語言以及多種爬蟲框架,分為Docker、直接部署、Kubernetes三種安裝方式!

Crawlab(分布式爬蟲管理平臺(tái))

軟件介紹

Crawlab架構(gòu):

Crawlab的架構(gòu)包括了一個(gè)主節(jié)點(diǎn)(Master Node)和多個(gè)工作節(jié)點(diǎn)(Worker Node),以及負(fù)責(zé)通信和數(shù)據(jù)儲(chǔ)存的Redis和MongoDB數(shù)據(jù)庫。

前端應(yīng)用向主節(jié)點(diǎn)請(qǐng)求數(shù)據(jù),主節(jié)點(diǎn)通過MongoDB和Redis來執(zhí)行任務(wù)派發(fā)調(diào)度以及部署,工作節(jié)點(diǎn)收到任務(wù)之后,開始執(zhí)行爬蟲任務(wù),并將任務(wù)結(jié)果儲(chǔ)存到MongoDB。架構(gòu)相對(duì)于v0.3.0之前的Celery版本有所精簡,去除了不必要的節(jié)點(diǎn)監(jiān)控模塊Flower,節(jié)點(diǎn)監(jiān)控主要由Redis完成。

主節(jié)點(diǎn)

主節(jié)點(diǎn)是整個(gè)Crawlab架構(gòu)的核心,屬于Crawlab的中控系統(tǒng)。主節(jié)點(diǎn)負(fù)責(zé)與前端應(yīng)用進(jìn)行通信,并通過Redis將爬蟲任務(wù)派發(fā)給工作節(jié)點(diǎn)。同時(shí),主節(jié)點(diǎn)會(huì)同步(部署)爬蟲給工作節(jié)點(diǎn),通過Redis和MongoDB的GridFS。

工作節(jié)點(diǎn)

工作節(jié)點(diǎn)的主要功能是執(zhí)行爬蟲任務(wù)和儲(chǔ)存抓取數(shù)據(jù)與日志,并且通過Redis的PubSub跟主節(jié)點(diǎn)通信。通過增加工作節(jié)點(diǎn)數(shù)量,Crawlab可以做到橫向擴(kuò)展,不同的爬蟲任務(wù)可以分配到不同的節(jié)點(diǎn)上執(zhí)行。

MongoDB

MongoDB是Crawlab的運(yùn)行數(shù)據(jù)庫,儲(chǔ)存有節(jié)點(diǎn)、爬蟲、任務(wù)、定時(shí)任務(wù)等數(shù)據(jù),另外GridFS文件儲(chǔ)存方式是主節(jié)點(diǎn)儲(chǔ)存爬蟲文件并同步到工作節(jié)點(diǎn)的中間媒介。

Redis

Redis是非常受歡迎的Key-Value數(shù)據(jù)庫,在Crawlab中主要實(shí)現(xiàn)節(jié)點(diǎn)間數(shù)據(jù)通信的功能。例如,節(jié)點(diǎn)會(huì)將自己信息通過HSET儲(chǔ)存在Redis的nodes哈希列表中,主節(jié)點(diǎn)根據(jù)哈希列表來判斷在線節(jié)點(diǎn)。

前端

前端是一個(gè)基于Vue-Element-Admin的單頁應(yīng)用。其中重用了很多Element-UI的控件來支持相應(yīng)的展示。

Crawlab(分布式爬蟲管理平臺(tái))v0.5.1免費(fèi)版【2】

下載地址

Crawlab(分布式爬蟲管理平臺(tái))v0.5.1免費(fèi)版

高速下載器地址:

有問題?不能下載,
下載周排行下載總排行