1、使用session對象
專注于為中小企業提供網站制作、網站設計服務,電腦端+手機端+微信端的三站合一,更高效的管理,為中小企業和林格爾免費做網站提供優質的服務。我們立足成都,凝聚了一批互聯網行業人才,有力地推動了上千家企業的穩健成長,幫助中小企業通過網站建設實現規模擴充和轉變。session = requests.session() strhtml = session.get(url) #與當前網站的首次會話
2、設置headers
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) " "Chrome/69.0.3497.100 Safari/537.36", "Accept": "application/json"} session.headers = headers
3、設置cookies
設置與網站首次會話時的cookies為默認的cookies
cookies = session.cookies session.headers.setdefault('cookies', cookies)
此后,可以復用之前會話中的cookies了
strhtml2 = session.get(url2)
另外有需要云服務器可以了解下創新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業上云的綜合解決方案,具有“安全穩定、簡單易用、服務可用性高、性價比高”等特點與優勢,專為企業上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。
文章標題:python爬取網站數據,如何繞過反爬蟲策略-創新互聯
文章起源:http://vcdvsql.cn/article42/dihphc.html
成都網站建設公司_創新互聯,為您提供關鍵詞優化、服務器托管、網站收錄、網站內鏈、Google、用戶體驗
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯