bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

如何在Python中使用Scrapy爬蟲框架-創新互聯

這篇文章給大家介紹如何在Python中使用Scrapy爬蟲框架,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

創新互聯是一家專業提供天心企業網站建設,專注與成都做網站、網站設計、HTML5、小程序制作等業務。10年已為天心眾多企業、政府機構等服務。創新互聯專業網站建設公司優惠進行中。

全局命令

全局命令有哪些呢,要想了解在Scrapy中有哪些全局命令,可以在不進入Scrapy項目所在目錄的情況下,運行scrapy-h,如圖所示:

如何在Python中使用Scrapy爬蟲框架

可以看到,此時在可用命令在終端下展示出了常見的全局命令,分別為fetch、runspider、settings、shell、startproject、version、view。

fetch命令

fetch命令主要用來顯示爬蟲爬取的過程.如下圖所示:

如何在Python中使用Scrapy爬蟲框架

在使用fetch命令時,同樣可以使用某些參數進行相應的控制。那么fetch有哪些相關參數可以使用呢?我們可以通過scrpy fetch -h列出所有可以使用的fetch相關參數。比如我們可以使用–headers顯示頭信息,也可以使用–nolog控制不顯示日志信息,還可以使用–spider=SPIDER參數來控制使用哪個爬蟲,通過–logfile=FILE指定存儲日志信息的文件,通過–loglevel=LEVEL控制日志等級。舉個栗子:

# 顯示頭信息,并且不顯示日志信息
scrpay -fetch --headers --nolog http://www.baidu.com

sunspider命令

通過runspider命令可以不依托scrapy的爬蟲項目,直接運行一個爬蟲文件

# first.py為自定義的一個爬蟲文件
scrapy runspider first.py

settings命令

在scrapy項目所在的目錄中使用settings命令查看的使用對應的項目配置信息,如果在scrapy項目所在的目錄外使用settings命令查看的Scrapy默認的配置信息

# 在項目中使用此命令打印的為BOT_NAME對應的值,即scrapy項目名稱。
# 在項目外使用此命令打印的為scrapybot
scrapy settings --get BOT_NAME

shell命令

通過shell命令可以啟動Scrapy的交互終端。

Scrapy的交互終端經常在開發以及調試的時候用到,使用Scrapy的交互終端可以實現在不啟動Scrapy爬蟲的情況下,對網站響應進行調試,同樣,在該交互終端下,我們也可以寫一些Python代碼進行相應測試。

如何在Python中使用Scrapy爬蟲框架

在>>>后面可以輸入交互命令以及相應的代碼

startproject命令

用于創建scrapy項目

version命令

查看scrapy版本

view命令

用于下載某個網頁,然后通過瀏覽器查看

項目命令

bench命令

測試本地硬件的性能

scrapy bench

genspider命令

用于創建爬蟲文件,這是一種快速創建爬蟲文件的方式。

# scrpay genspider -t 基本格式
# basic 模板
# baidu.com 爬取的域名
scrapy genspider -t basic xxx baidu.com

此時在spider文件夾下會生成一個以xxx命名的py文件。可以使用scrapy genspider -l查看所有可用爬蟲模板。當前可用的爬蟲模板有:basic、crawl、csvfeed、xmlfeed

check命令

使用check命令可以實現對某個爬蟲文件進行合同檢查,即測試.

# xxx為爬蟲名
scrapy check xxx

crawl命令

啟動某個爬蟲

# xxx為爬蟲名
scrapy crawl xxx

list命令

列出當前可使用的爬蟲文件

scrapy list

edit命令

編輯爬蟲文件

scrapy edit xxx

parse命令

通過parse命令,我們可以實現獲取指定的URL網址,并使用對應的爬蟲文件進行處理和分析

日志等級

等級名含義
CRITICAL發生了最嚴重的錯誤
ERROR發生了必須立即處理的錯誤
WARNING出現了一些警告信息,即存在潛在錯誤
INFO輸出一些提示顯示
DEBUG輸出一些調試信息

python有哪些常用庫

python常用的庫:1.requesuts;2.scrapy;3.pillow;4.twisted;5.numpy;6.matplotlib;7.pygama;8.ipyhton等。

關于如何在Python中使用Scrapy爬蟲框架就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

另外有需要云服務器可以了解下創新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業上云的綜合解決方案,具有“安全穩定、簡單易用、服務可用性高、性價比高”等特點與優勢,專為企業上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。

網站標題:如何在Python中使用Scrapy爬蟲框架-創新互聯
文章分享:http://vcdvsql.cn/article26/cciscg.html

成都網站建設公司_創新互聯,為您提供Google品牌網站建設虛擬主機企業網站制作定制網站商城網站

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

微信小程序開發