Python如何實現(xiàn)簡單網(wǎng)頁圖片

今天就跟大家聊聊有關Python如何實現(xiàn)簡單網(wǎng)頁圖片，可能很多人都不太了解，為了讓大家更加了解，小編給大家總結了以下內容，希望大家根據(jù)這篇文章可以有所收獲。

創(chuàng)新互聯(lián)建站成都企業(yè)網(wǎng)站建設服務，提供成都網(wǎng)站設計、成都做網(wǎng)站、外貿網(wǎng)站建設網(wǎng)站開發(fā),網(wǎng)站定制,建網(wǎng)站,網(wǎng)站搭建,網(wǎng)站設計,成都響應式網(wǎng)站建設,網(wǎng)頁設計師打造企業(yè)風格網(wǎng)站,提供周到的售前咨詢和貼心的售后服務。歡迎咨詢做網(wǎng)站需要多少錢:18980820575

Python實現(xiàn)簡單網(wǎng)頁圖片抓取完整代碼實例

分類專欄： python

文章標簽：編程語言 python java 大數(shù)據(jù)

本文鏈接：https://blog.csdn.net/chengxun03/article/details/106321564

收起

@本文來源于公眾號：csdn2299，喜歡可以關注公眾號程序員學府

這篇文章主要介紹了Python實現(xiàn)簡單網(wǎng)頁圖片抓取完整代碼實例，具有一定借鑒價值，需要的朋友可以參考下。

利用python抓取網(wǎng)絡圖片的步驟是：

1、根據(jù)給定的網(wǎng)址獲取網(wǎng)頁源代碼

2、利用正則表達式把源代碼中的圖片地址過濾出來

3、根據(jù)過濾出來的圖片地址下載網(wǎng)絡圖片

以下是比較簡單的一個抓取某一個百度貼吧網(wǎng)頁的圖片的實現(xiàn)：

# -*- coding: utf-8 -*-

# feimengjuan

import re

import urllib

import urllib2

#抓取網(wǎng)頁圖片

#根據(jù)給定的網(wǎng)址來獲取網(wǎng)頁詳細信息，得到的html就是網(wǎng)頁的源代碼

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

def getImg(html):

#利用正則表達式把源代碼中的圖片地址過濾出來

reg = r'src="(.+?\.jpg)" pic_ext'

imgre = re.compile(reg)

imglist = imgre.findall(html) #表示在整個網(wǎng)頁中過濾出所有圖片的地址，放在imglist中

x = 0

for imgurl in imglist:

urllib.urlretrieve(imgurl,'%s.jpg' %x) #打開imglist中保存的圖片網(wǎng)址，并下載圖片保存在本地

x = x + 1

html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網(wǎng)址網(wǎng)頁詳細信息，得到的html就是網(wǎng)頁的源代碼

getImg(html)#從網(wǎng)頁源代碼中分析并下載保存圖片

進一步對代碼進行了整理，在本地創(chuàng)建了一個“圖片”文件夾來保存圖片

# -*- coding: utf-8 -*-

# feimengjuan

import re

import urllib

import urllib2

import os

#抓取網(wǎng)頁圖片

#根據(jù)給定的網(wǎng)址來獲取網(wǎng)頁詳細信息，得到的html就是網(wǎng)頁的源代碼

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

#創(chuàng)建保存圖片的文件夾

def mkdir(path):

path = path.strip()

# 判斷路徑是否存在

# 存在 True

# 不存在 Flase

isExists = os.path.exists(path)

if not isExists:

print u'新建了名字叫做',path,u'的文件夾'

# 創(chuàng)建目錄操作函數(shù)

os.makedirs(path)

return True

else:

# 如果目錄存在則不創(chuàng)建，并提示目錄已經(jīng)存在

print u'名為',path,u'的文件夾已經(jīng)創(chuàng)建成功'

return False

# 輸入文件名，保存多張圖片

def saveImages(imglist,name):

number = 1

for imageURL in imglist:

splitPath = imageURL.split('.')

fTail = splitPath.pop()

if len(fTail) > 3:

fTail = 'jpg'

fileName = name + "/" + str(number) + "." + fTail

# 對于每張圖片地址，進行保存

try:

u = urllib2.urlopen(imageURL)

data = u.read()

f = open(fileName,'wb+')

f.write(data)

print u'正在保存的一張圖片為',fileName

f.close()

except urllib2.URLError as e:

print (e.reason)

number += 1

#獲取網(wǎng)頁中所有圖片的地址

def getAllImg(html):

#利用正則表達式把源代碼中的圖片地址過濾出來

reg = r'src="(.+?\.jpg)" pic_ext'

imgre = re.compile(reg)

imglist = imgre.findall(html) #表示在整個網(wǎng)頁中過濾出所有圖片的地址，放在imglist中

return imglist

#創(chuàng)建本地保存文件夾，并下載保存圖片

if __name__ == '__main__':

html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網(wǎng)址網(wǎng)頁詳細信息，得到的html就是網(wǎng)頁的源代碼

path = u'圖片'

mkdir(path) #創(chuàng)建本地文件夾

imglist = getAllImg(html) #獲取圖片的地址列表

saveImages(imglist,path) # 保存圖片

結果在“圖片”文件夾下保存了幾十張圖片，如截圖：

看完上述內容，你們對Python如何實現(xiàn)簡單網(wǎng)頁圖片有進一步的了解嗎？如果還想了解更多知識或者相關內容，請關注創(chuàng)新互聯(lián)行業(yè)資訊頻道，感謝大家的支持。

名稱欄目：Python如何實現(xiàn)簡單網(wǎng)頁圖片
文章分享：http://vcdvsql.cn/article48/gghdep.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián)，為您提供定制開發(fā)、網(wǎng)站維護、企業(yè)建站、App開發(fā)、外貿建站、Google

聲明：本網(wǎng)站發(fā)布的內容（圖片、視頻和文字）以用戶投稿、用戶轉載內容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內容未經(jīng)允許不得轉載，或轉載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內容

bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

Python如何實現(xiàn)簡單網(wǎng)頁圖片