bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

Python如何實現(xiàn)簡單網(wǎng)頁圖片

今天就跟大家聊聊有關Python如何實現(xiàn)簡單網(wǎng)頁圖片,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據(jù)這篇文章可以有所收獲。

創(chuàng)新互聯(lián)建站成都企業(yè)網(wǎng)站建設服務,提供成都網(wǎng)站設計、成都做網(wǎng)站、外貿網(wǎng)站建設網(wǎng)站開發(fā),網(wǎng)站定制,建網(wǎng)站,網(wǎng)站搭建,網(wǎng)站設計,成都響應式網(wǎng)站建設,網(wǎng)頁設計師打造企業(yè)風格網(wǎng)站,提供周到的售前咨詢和貼心的售后服務。歡迎咨詢做網(wǎng)站需要多少錢:18980820575

Python實現(xiàn)簡單網(wǎng)頁圖片抓取完整代碼實例

分類專欄: python

文章標簽: 編程語言 python java 大數(shù)據(jù)

版權聲明:本文為博主原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權協(xié)議,轉載請附上原文出處鏈接和本聲明。

本文鏈接:https://blog.csdn.net/chengxun03/article/details/106321564

收起

@本文來源于公眾號:csdn2299,喜歡可以關注公眾號 程序員學府

這篇文章主要介紹了Python實現(xiàn)簡單網(wǎng)頁圖片抓取完整代碼實例,具有一定借鑒價值,需要的朋友可以參考下。

利用python抓取網(wǎng)絡圖片的步驟是:

1、根據(jù)給定的網(wǎng)址獲取網(wǎng)頁源代碼

2、利用正則表達式把源代碼中的圖片地址過濾出來

3、根據(jù)過濾出來的圖片地址下載網(wǎng)絡圖片

以下是比較簡單的一個抓取某一個百度貼吧網(wǎng)頁的圖片的實現(xiàn):

# -*- coding: utf-8 -*-

# feimengjuan

import re

import urllib

import urllib2

#抓取網(wǎng)頁圖片

#根據(jù)給定的網(wǎng)址來獲取網(wǎng)頁詳細信息,得到的html就是網(wǎng)頁的源代碼

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

def getImg(html):

#利用正則表達式把源代碼中的圖片地址過濾出來

reg = r'src="(.+?\.jpg)" pic_ext'

imgre = re.compile(reg)

imglist = imgre.findall(html) #表示在整個網(wǎng)頁中過濾出所有圖片的地址,放在imglist中

x = 0

for imgurl in imglist:

urllib.urlretrieve(imgurl,'%s.jpg' %x) #打開imglist中保存的圖片網(wǎng)址,并下載圖片保存在本地

x = x + 1

html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網(wǎng)址網(wǎng)頁詳細信息,得到的html就是網(wǎng)頁的源代碼

getImg(html)#從網(wǎng)頁源代碼中分析并下載保存圖片

進一步對代碼進行了整理,在本地創(chuàng)建了一個“圖片”文件夾來保存圖片

# -*- coding: utf-8 -*-

# feimengjuan

import re

import urllib

import urllib2

import os

#抓取網(wǎng)頁圖片

#根據(jù)給定的網(wǎng)址來獲取網(wǎng)頁詳細信息,得到的html就是網(wǎng)頁的源代碼

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

#創(chuàng)建保存圖片的文件夾

def mkdir(path):

path = path.strip()

# 判斷路徑是否存在

# 存在 True

# 不存在 Flase

isExists = os.path.exists(path)

if not isExists:

print u'新建了名字叫做',path,u'的文件夾'

# 創(chuàng)建目錄操作函數(shù)

os.makedirs(path)

return True

else:

# 如果目錄存在則不創(chuàng)建,并提示目錄已經(jīng)存在

print u'名為',path,u'的文件夾已經(jīng)創(chuàng)建成功'

return False

# 輸入文件名,保存多張圖片

def saveImages(imglist,name):

number = 1

for imageURL in imglist:

splitPath = imageURL.split('.')

fTail = splitPath.pop()

if len(fTail) > 3:

fTail = 'jpg'

fileName = name + "/" + str(number) + "." + fTail

# 對于每張圖片地址,進行保存

try:

u = urllib2.urlopen(imageURL)

data = u.read()

f = open(fileName,'wb+')

f.write(data)

print u'正在保存的一張圖片為',fileName

f.close()

except urllib2.URLError as e:

print (e.reason)

number += 1

#獲取網(wǎng)頁中所有圖片的地址

def getAllImg(html):

#利用正則表達式把源代碼中的圖片地址過濾出來

reg = r'src="(.+?\.jpg)" pic_ext'

imgre = re.compile(reg)

imglist = imgre.findall(html) #表示在整個網(wǎng)頁中過濾出所有圖片的地址,放在imglist中

return imglist

#創(chuàng)建本地保存文件夾,并下載保存圖片

if __name__ == '__main__':

html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網(wǎng)址網(wǎng)頁詳細信息,得到的html就是網(wǎng)頁的源代碼

path = u'圖片'

mkdir(path) #創(chuàng)建本地文件夾

imglist = getAllImg(html) #獲取圖片的地址列表

saveImages(imglist,path) # 保存圖片

結果在“圖片”文件夾下保存了幾十張圖片,如截圖:

看完上述內容,你們對Python如何實現(xiàn)簡單網(wǎng)頁圖片有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。

名稱欄目:Python如何實現(xiàn)簡單網(wǎng)頁圖片
文章分享:http://vcdvsql.cn/article48/gghdep.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供定制開發(fā)網(wǎng)站維護企業(yè)建站App開發(fā)外貿建站Google

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運營