原文標(biāo)題:10 Python image manipulation tools.
公司主營業(yè)務(wù):成都網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)、移動網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競爭能力。成都創(chuàng)新互聯(lián)公司是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會用頭腦與智慧不斷的給客戶帶來驚喜。成都創(chuàng)新互聯(lián)公司推出懷安免費(fèi)做網(wǎng)站回饋大家。
作者 | Parul Pandey
翻譯 | 安其羅喬爾、JimmyHua
今天,在我們的世界里充滿了數(shù)據(jù),圖像成為構(gòu)成這些數(shù)據(jù)的重要組成部分。但無論是用于何種用途,這些圖像都需要進(jìn)行處理。圖像處理就是分析和處理數(shù)字圖像的過程,主要旨在提高其質(zhì)量或從中提取一些信息,然后可以將其用于某種用途。
圖像處理中的常見任務(wù)包括顯示圖像,基本操作如裁剪、翻轉(zhuǎn)、旋轉(zhuǎn)等,圖像分割,分類和特征提取,圖像恢復(fù)和圖像識別。Python成為這種圖像處理任務(wù)是一個恰當(dāng)選擇,這是因?yàn)樗鳛橐环N科學(xué)編程語言正在日益普及,并且在其生態(tài)系統(tǒng)中免費(fèi)提供許多最先進(jìn)的圖像處理工具供大家使用。
讓我們看一下可以用于圖像處理任務(wù)中的常用 Python 庫有哪些吧。
1.scikit-image
scikit-image是一個開源的Python包,適用于numpy數(shù)組。它實(shí)現(xiàn)了用于研究,教育和工業(yè)應(yīng)用的算法和實(shí)用工具。即使是那些剛接觸Python生態(tài)系統(tǒng)的人,它也是一個相當(dāng)簡單直接的庫。此代碼是由活躍的志愿者社區(qū)編寫的,具有高質(zhì)量和同行評審的性質(zhì)。
資源
文檔里記錄了豐富的例子和實(shí)際用例,閱讀下面的文檔:
用法
該包作為skimage導(dǎo)入,大多數(shù)功能都在子模塊中找的到。下面列舉一些skimage的例子:
圖像過濾
使用match_template函數(shù)進(jìn)行模板匹配
你可以通過此處查看圖庫找到更多示例。
2. Numpy
Numpy是Python編程的核心庫之一,并為數(shù)組提供支持。圖像本質(zhì)上是包含數(shù)據(jù)點(diǎn)像素的標(biāo)準(zhǔn)Numpy數(shù)組。因此,我們可以通過使用基本的NumPy操作,例如切片、掩膜和花式索引,來修改圖像的像素值。可以使用skimage加載圖像并使用matplotlib顯示圖像。
資源
Numpy的官方文檔頁面提供了完整的資源和文檔列表:
用法
使用Numpy來掩膜圖像.
3.Scipy
scipy是Python的另一個類似Numpy的核心科學(xué)模塊,可用于基本的圖像操作和處理任務(wù)。特別是子模塊scipy.ndimage,提供了在n維NumPy數(shù)組上操作的函數(shù)。該包目前包括線性和非線性濾波,二值形態(tài)學(xué),B樣條插值和對象測量等功能函數(shù)。
資源
有關(guān)scipy.ndimage包提供的完整功能列表,請參閱下面的鏈接:
用法
使用SciPy通過高斯濾波器進(jìn)行模糊:
4. PIL/ Pillow
PIL( Python圖像庫 )是Python編程語言的一個免費(fèi)庫,它支持打開、操作和保存許多不同的文件格式的圖像。然而, 隨著2009年的最后一次發(fā)布,它的開發(fā)停滯不前。但幸運(yùn)的是還有有Pillow,一個PIL積極開發(fā)的且更容易安裝的分支,它能運(yùn)行在所有主要的操作系統(tǒng),并支持Python3。這個庫包含了基本的圖像處理功能,包括點(diǎn)運(yùn)算、使用一組內(nèi)置卷積核的濾波和色彩空間的轉(zhuǎn)換。
資源
文檔中有安裝說明,以及涵蓋庫的每個模塊的示例:
用法
在 Pillow 中使用 ImageFilter 增強(qiáng)圖像:
5. OpenCV-Python
OpenCV( 開源計(jì)算機(jī)視覺庫 )是計(jì)算機(jī)視覺應(yīng)用中應(yīng)用最廣泛的庫之一 。OpenCV-Python 是OpenCV的python版API。OpenCV-Python的優(yōu)點(diǎn)不只有高效,這源于它的內(nèi)部組成是用C/C++編寫的,而且它還容易編寫和部署(因?yàn)榍岸耸怯肞ython包裝的)。這使得它成為執(zhí)行計(jì)算密集型計(jì)算機(jī)視覺程序的一個很好的選擇。
資源
OpenCV-Python-Guide指南可以讓你使用OpenCV-Python更容易:
用法
下面是一個例子,展示了OpenCV-Python使用金字塔方法創(chuàng)建一個名為“Orapple”的新水果圖像融合的功能。
6. SimpleCV
SimpleCV 也是一個用于構(gòu)建計(jì)算機(jī)視覺應(yīng)用程序的開源框架。有了它,你就可以訪問幾個高性能的計(jì)算機(jī)視覺庫,如OpenCV,而且不需要先學(xué)習(xí)了解位深度、文件格式、顏色空間等。
它的學(xué)習(xí)曲線大大小于OpenCV,正如它們的口號所說“計(jì)算機(jī)視覺變得簡單”。一些支持SimpleCV的觀點(diǎn)有:
即使是初學(xué)者也可以編寫簡單的機(jī)器視覺測試攝像機(jī)、視頻文件、圖像和視頻流都是可互操作的資源
官方文檔非常容易理解,而且有大量的例子和使用案例去學(xué)習(xí):
用法
7. Mahotas
Mahotas 是另一個計(jì)算機(jī)視覺和圖像處理的Python庫。它包括了傳統(tǒng)的圖像處理功能例如濾波和形態(tài)學(xué)操作以及更現(xiàn)代的計(jì)算機(jī)視覺功能用于特征計(jì)算,包括興趣點(diǎn)檢測和局部描述符。該接口是Python語言,適合于快速開發(fā),但是算法是用C語言實(shí)現(xiàn)的,并根據(jù)速度進(jìn)行了調(diào)優(yōu)。Mahotas庫速度快,代碼簡潔,甚至具有最小的依賴性。通過原文閱讀它們的官方論文以獲得更多的了解。
資源
文檔包括安裝指導(dǎo),例子,以及一些教程,可以更好的幫助你開始使用mahotas。
用法
Mahotas庫依賴于使用簡單的代碼來完成任務(wù)。關(guān)于‘Finding Wally’的問題,Mahotas做的很好并且代碼量很少。下面是源碼:
8. SimpleITK
ITK 或者 Insight Segmentation and Registration Toolkit是一個開源的跨平臺系統(tǒng),為開發(fā)人員提供了一套廣泛的圖像分析軟件工具 。其中, SimpleITK是建立在ITK之上的簡化層,旨在促進(jìn)其在快速原型設(shè)計(jì)、教育、解釋語言中的應(yīng)用。SimpleITK 是一個圖像分析工具包,包含大量支持一般過濾操作、圖像分割和匹配的組件。SimpleITK本身是用C++寫的,但是對于包括Python以內(nèi)的大部分編程語言都是可用的。
資源
大量的Jupyter Notebooks 表明了SimpleITK在教育和研究領(lǐng)域已經(jīng)被使用。Notebook展示了用Python和R編程語言使用SimpleITK來進(jìn)行交互式圖像分析。
用法
下面的動畫是用SimpleITK和Python創(chuàng)建的剛性CT/MR匹配過程的可視化 。點(diǎn)擊此處可查看源碼!
9. pgmagick
pgmagick是GraphicsMagick庫的一個基于python的包裝。 GraphicsMagick圖像處理系統(tǒng)有時被稱為圖像處理的瑞士軍刀。它提供了一個具有強(qiáng)大且高效的工具和庫集合,支持以88種主要格式(包括重要格式,如DPX、GIF、JPEG、JPEG-2000、PNG、PDF、PNM和TIFF)讀取、寫入和操作圖像。
資源
有一個專門用于PgMagick的Github庫 ,其中包含安裝和需求說明。還有關(guān)于這個的一個詳細(xì)的用戶指導(dǎo):
用法
使用pgmagick可以進(jìn)行的圖像處理活動很少,比如:
圖像縮放
邊緣提取
10. Pycairo
Pycairo是圖像處理庫cairo的一組Python捆綁。Cairo是一個用于繪制矢量圖形的2D圖形庫。矢量圖形很有趣,因?yàn)樗鼈冊谡{(diào)整大小或轉(zhuǎn)換時不會失去清晰度 。Pycairo是cairo的一組綁定,可用于從Python調(diào)用cairo命令。
資源
Pycairo的GitHub庫是一個很好的資源,有關(guān)于安裝和使用的詳細(xì)說明。還有一個入門指南,其中有一個關(guān)于Pycairo的簡短教程。
庫:指南:用法
使用Pycairo繪制線條、基本形狀和徑向梯度:
總結(jié)
有一些有用且免費(fèi)的Python圖像處理庫可以使用,有的是眾所周知的,有的可能對你來說是新的,試著多去了解它們。
模板匹配是通過一張模板圖片去另一張圖中找到與模板相似部分的一種算法。一個模板是一張小圖片,這個圖片有一定的尺寸,有角度(一般是不旋轉(zhuǎn)的矩形, 角度為0)。
模板匹配算法一般是通過滑窗的方式在待匹配的圖像上滑動,通過比較模板與子圖的相似度,找到相似度最大的子圖。這種算法最核心部分在于如何設(shè)計(jì)一個相似性函數(shù)。
最容易想到的一個相似性函數(shù)便是歐式距離:
將這個相似性函數(shù)展開,可以得:
可以看出,只有第二項(xiàng)是有意義的,因?yàn)榈谝豁?xiàng)和第三項(xiàng)的值在選定模板后是固定的。對于歐式距離相似函數(shù),值越大表示越不相似,也就是說,第二項(xiàng)的值越小則越不相似。
將第二項(xiàng)進(jìn)行歸一化:
那么當(dāng)R(i, j)為1時,表示模板與子圖完全相等。
cv::matchTemplate(const CvArr* image, //欲搜索的圖像。它應(yīng)該是單通道、8-比特或32-比特 浮點(diǎn)數(shù)圖像
const CvArr* template,//搜索模板,不能大于輸入圖像,且與輸入圖像具有一樣的數(shù)據(jù)類型
CvArr* result, //比較結(jié)果的映射圖像。單通道、32-比特浮點(diǎn)數(shù).
若圖像是W×H而templ是w×h,則result一定是(W-w+1)×(H-h+1)
int method//CV_TM_SQDIFF、CV_TM_SQDIFF_NORMED、CV_TM_CCORR、
CV_TM_CCORR_NORMED、CV_TM_CCOEFF、CV_TM_CCOEFF_NORMED
);
函數(shù)來進(jìn)行模板匹配。其中的method參數(shù)具體如下:
在通過matchTemplate函數(shù)進(jìn)行模板匹配后,可以得到一個映射圖,這張圖中最大值的地方便是匹配度最大的子圖的左上角坐標(biāo),可以使用cv::minMaxLoc函數(shù)獲得子圖位置和相應(yīng)分?jǐn)?shù),再進(jìn)行后續(xù)操作。
使用傳統(tǒng)的模板匹配速度較快,但是無法應(yīng)對旋轉(zhuǎn)和縮放問題。要解決旋轉(zhuǎn)不變的 問題,必須要得到旋轉(zhuǎn)不變的特征量,例如特征點(diǎn)。
使用SIFT或SURF計(jì)算得到模板和待匹配圖像的特征點(diǎn),然后使用RANSAC或者FLANN進(jìn)行特征點(diǎn)匹配, 最后進(jìn)行仿射變換便可得到匹配的位置。
python opencv實(shí)現(xiàn)(surf):
# - - coding:utf-8 - -
author = 'Microcosm'
運(yùn)行的具體信息如下:
操作系統(tǒng):ubuntu 14.04
運(yùn)行環(huán)境:
opencv版本:opencv 3.0
模板大小:126x96 png
匹配圖像大小:750x407 jpg
特征提取時間:0.15 s
KNN匹配時間:0.0024s
匹配效果:
在寫爬蟲的時候難免會遇到驗(yàn)證碼識別的問題,常見的驗(yàn)證碼識別的流程為:
- 圖像灰度化
- 圖像去噪(如圖像二值化)
- 切割圖片
- 提取特征
- 訓(xùn)練
但這種方法要切割圖片,而且破解驗(yàn)證碼的重點(diǎn)和難點(diǎn)就在于 能否成功分割字符 。
本文要介紹的算法 不需要進(jìn)行圖片切割,也不需要進(jìn)行機(jī)器訓(xùn)練 ,這種方法就是模板匹配:將待識別的文字切割成一個個模板,在待識別的圖像中去匹配模板。
這篇文章將分為兩個部分:
第一部分介紹模板匹配的基本概念以及模板匹配的一種實(shí)現(xiàn)算法:快速歸一化互相關(guān)匹配算法;
第二部分是一個具體實(shí)例。
模板匹配是在圖像中尋找目標(biāo)的方法之一,目的就是在一幅圖像中尋找和模板圖像最相似的區(qū)域。
模板匹配的大致過程是這樣的:通過在輸入圖像上滑動圖像塊對實(shí)際的圖像塊和輸入圖像進(jìn)行匹配。
假設(shè)我們有一張100x100的輸入圖像,有一張10x10的模板圖像,查找的過程是這樣的:
從輸入圖像的左上角(0,0)開始,切割一塊(0,0)至(10,10)的臨時圖像;
用某種方法得出臨時圖像與模板的相似度c,存放到相似度矩陣中(矩陣大小為91 x91);
切割輸入圖像從(0,1)至(10,11)的臨時圖像,對比,并記錄到相似度矩陣;
重復(fù)上述步驟,直到輸入圖像的右下角。
最終得到一個相似度矩陣,找到矩陣中的最大或最小值,最大值(最小值)對應(yīng)的臨時圖像即為與模板最相似的圖像。
在步驟b中,求模板與圖像的相似度有多種方法,如平均絕對差算法(MAD)、絕對誤差和算法(SAD)、誤差平方和算法(SSD)、歸一化互相關(guān)算法(NCC),本文使用的是歸一化互相關(guān)算法。
什么是歸一化互相關(guān)?
從幾何圖形上來看,空間中的兩個向量,同方向平行時,歸一化互相關(guān)系數(shù)為1,表示兩個向量最相似,反方向平行時歸一化互相關(guān)系數(shù)為-1,垂直時為0,表示最不相似(用互相垂直的三個向量來代表整個空間也是這個道理,垂直的向量之間不包含對方的信息,相關(guān)系數(shù)為0),存在一定夾角時處于(-1,1),是不是跟余弦函數(shù)很像,cos(0)=1,cos(pi/2)=0,cos(pi)=-1。就是這個樣子的,相關(guān)系數(shù)可以看作是兩個向量之間夾角的cosine函數(shù)。
在數(shù)學(xué)中是這么計(jì)算cosine函數(shù)的,假設(shè)兩個n維向量X,Y,對應(yīng)的坐標(biāo)分別為(x1,x2,…xn), (y1,y2,…yn) 則:
(如果想要了解更多,請參考文獻(xiàn)【2】)
但這是一維的,在模板匹配中要再加一個維度 (具體算法請參考文獻(xiàn)【3】) ,簡要說一下文獻(xiàn)【3】的內(nèi)容:如果直接計(jì)算二維相似度的話計(jì)算復(fù)雜度會非常高,文獻(xiàn)【3】利用快速傅里葉變換與積分圖像快速算法來降低計(jì)算復(fù)雜度。
接下來讓我們看一個具體的應(yīng)用。
模板匹配識別驗(yàn)證碼的具體步驟為:
1. 找出圖片中所有可能出現(xiàn)的字符,制作成模板集合
2. 圖像灰度化
3. 圖片去噪(二值化)
4. 模板匹配
5. 匹配結(jié)果優(yōu)化
要識別的圖片如下,以識別圖片中的加字為例:
要從image中找到與模板最匹配的部分,Template圖像是事先從image圖像中截取的一部分。所用的為python模塊skimage中的match_template方法,match_template方法使用的是快速歸一化互相關(guān)算法 【2】 。
遍歷模板圖像集合,與圖像匹配,如果dist大于閾值h,則認(rèn)為此模板在圖像中存在,否則不存在,繼續(xù)匹配下一個模板,直到遍歷完所有模板。
以模板‘加’為例,圖像大小為40x260,模板大小27x27,result是一個大小為(14,234)的矩陣,即上文提到的相似度矩陣,矩陣中的數(shù)值屬于[-1,1],找到result中最大值所處的對應(yīng)位置即為與模板最匹配的圖像位置:x=66,y=11,正好對應(yīng)模板圖像在image中所處的位置。 (更多內(nèi)容請參閱參考文獻(xiàn)【4】)
但這是比較好的情況,因?yàn)樵谄ヅ鋾r遍歷了所有的模板,而一張圖片中出現(xiàn)的模板數(shù)量是有限的,比如數(shù)字’四’在圖片中是沒有的,這時就要根據(jù)某種規(guī)則去掉這些在圖片中沒有出現(xiàn)的模板:程序中使用dist變量來過濾匹配結(jié)果,如果dist變量大于某個值則認(rèn)為此模板在圖像中不存在。
最后的result_list中可能仍然存在一些圖片中不存在的模板或者匹配不精確的模板,比如數(shù)字‘一’在模板中不存在,但仍然可以匹配到,因?yàn)閿?shù)字‘二’中可以匹配到‘一’,需要進(jìn)一步優(yōu)化,優(yōu)化方法有很多,比如當(dāng)匹配到的兩個模板距離過近時,選擇較大的那個模板,其余方法留給讀者自行考慮吧。
后續(xù)將會推出如何使用深度學(xué)習(xí)識別驗(yàn)證碼,敬請期待~
參考文獻(xiàn):
J. P. Lewis, “Fast Normalized Cross-Correlation”, Industrial Light and Magic.
本文作者 :李暉(點(diǎn)融黑幫),畢業(yè)于電子科技大學(xué),現(xiàn)就職于點(diǎn)融成都Data部門,對一切新鮮事物充滿好奇,對跳舞毫無抵抗力的活力女青年一枚。
新聞名稱:python模板匹配函數(shù),MATLAB模板匹配
分享路徑:http://vcdvsql.cn/article28/hedsjp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、建站公司、Google、網(wǎng)站策劃、網(wǎng)站營銷、云服務(wù)器
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)