DiDú爬蟲是一款數(shù)據(jù)采集擴展,強大的爬蟲能力,能夠幫助用戶抓取需要的信息,采集好數(shù)據(jù),簡單操作,就可以滿足采集數(shù)據(jù)的需求,方便快捷。
基本簡介
DiDú專業(yè)數(shù)據(jù)采集軟件,是一款DiDú專業(yè)數(shù)據(jù)采集軟件,是一款Edge瀏覽器擴展插件。其以輕巧敏捷的代碼,塑造強大的爬蟲能力,只需要一臺安裝Edge瀏覽器的電腦,即可采集各種頁面上您所需的信息。與其他爬蟲軟件設計理念不同的,它不僅可以分析頁面原始的HTML代碼,而且還支持動態(tài)加載的DOM元素,按照您預先設計的定義切分組合這些網(wǎng)頁上的數(shù)據(jù),并儲存到您的本地,最后導出成常見的Excel數(shù)據(jù)格式。瀏覽器擴展插件。其以輕巧敏捷的代碼,塑造強大的爬蟲能力,只需要一臺安裝Edge瀏覽器的電腦,即可采集各種頁面上您所需的信息。與其他爬蟲軟件設計理念不同的,它不僅可以分析頁面原始的HTML代碼,而且還支持動態(tài)加載的DOM元素,按照您預先設計的定義切分組合這些網(wǎng)頁上的數(shù)據(jù),并儲存到您的本地,最后導出成常見的Excel數(shù)據(jù)格式。
使用方法
1、整體流程如為:編輯規(guī)則 → 測試規(guī)則 → 編輯任務 → 執(zhí)行采集 → 導出數(shù)據(jù)
2、您需要花幾分鐘創(chuàng)建一個采集規(guī)則,或者花幾秒鐘導入一個采集規(guī)則。
3、在正式采集之前,建議您先進行測試,以檢查所設定的規(guī)則字段是否正常采集。若需要自動翻頁的,還需要測試一下能否正常翻頁。測試無誤后,就可以開始進行您的數(shù)據(jù)采集工作了。
4、如果您希望它能夠每天定時自動的進行數(shù)據(jù)采集,您就需要花30秒鐘定義一個計劃任務,然后綁定某個采集規(guī)則。最后打開任務調度頁面,花1秒鐘啟用任務調度開關,就可以坐等數(shù)據(jù)的自動采集。