這篇文章主要介紹了怎么建立代理Ip池,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
網站建設哪家好,找創新互聯公司!專注于網頁設計、網站建設、微信開發、微信小程序定制開發、集團企業網站建設等服務項目。為回饋新老客戶創新互聯還提供了會同免費建站歡迎大家使用!
說明
1、首先獲取代理的json信息。
2、使用requests獲取整個頁面的text(字符串),然后使用split('\n') 將每行分割后形成的列表,方便該列表采用json.loads()方法,將每行的字符串轉換成json對象,最終取值。
實例
#!/usr/bin/env python3 # coding:utf-8 #lanxing import json import telnetlib import requests import random proxy_url = 'https://raw.githubusercontent.com/fate0/proxylist/master/proxy.list' # proxyList = [] #定義函數,驗證代理ip是否有效 def verify(ip,port,type): proxies = {} try: telnet = telnetlib.Telnet(ip,port=port,timeout=3) #用這個ip請訪問,3s自動斷開,返回tiemout except: print('unconnected') else: #print('connected successfully') # proxyList.append((ip + ':' + str(port),type)) proxies['type'] = type proxies['host'] = ip proxies['port'] = port proxiesJson = json.dumps(proxies) #保存到本地的proxies_ip.json文件 with open('proxies_ip.json','a+') as f: f.write(proxiesJson + '\n') print("已寫入:%s" % proxies) #定義函數,帶著url地址去獲取數據 def getProxy(proxy_url): response = requests.get(proxy_url) #print(type(response)) # 用split('\n') 將每一行分割之后組成的列表,消除換行影響 proxies_list = response.text.split('\n') for proxy_str in proxies_list: # 用json.loads()方法,將每一行的字符串轉換為json對象,最后取值 proxy_json = json.loads(proxy_str) host = proxy_json['host'] port = proxy_json['port'] type = proxy_json['type'] verify(host,port,type) #主函數,入口 if __name__ == '__main__': getProxy(proxy_url)
感謝你能夠認真閱讀完這篇文章,希望小編分享的“怎么建立代理Ip池”這篇文章對大家有幫助,同時也希望大家多多支持創新互聯,關注創新互聯行業資訊頻道,更多相關知識等著你來學習!
網站欄目:怎么建立代理Ip池
URL鏈接:http://vcdvsql.cn/article42/pcdcec.html
成都網站建設公司_創新互聯,為您提供標簽優化、微信小程序、軟件開發、網站改版、App設計、
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯