Python提供了很多模塊用于數據可視化,其中matplotlib、pygal等模塊。我參考網上熱門書籍《Python編程從入門到實戰》,在測試與學習過程中遇到的些許問題加以解決,才寫下這一項目實戰的心得,對于Python基礎部分就不細講,主要是項目核心要點和解決方案的描述。本小節先講述pyplot模塊的基本使用。
創新互聯公司是一家企業級云計算解決方案提供商,超15年IDC數據中心運營經驗。主營GPU顯卡服務器,站群服務器,服務器機柜租用,海外高防服務器,機柜大帶寬,動態撥號VPS,海外云手機,海外云服務器,海外服務器租用托管等。針對新手,真心覺得不要直接使用Python下載來的IDLE來開發,因為功能太少了,也不好使用。我的建議是對于Python初學者,先安裝Anaconda,這是一個基于Python的數據處理和科學計算平臺,它已經內置了許多非常有用的第三方庫,我們裝上Anaconda,就相當于把數十個第三方模塊自動安裝好了,非常簡單易用,在安裝界面添加Anaconda到PATH環境變量中勾上,這樣就會自動添加環境變量了。Anaconda 自帶了一個編輯器-Spyder,可以使用Spyder編寫代碼,知道有這個編輯器就好。然后再安裝一個PyCharm,它是一種Python IDE,帶有一整套可以幫助用戶在使用Python語言開發時提高其效率的工具。
Anaconda和PyCharm安裝過程和方法文檔鏈接,我是摘抄網上有用的資料再總結出來的:鏈接:https://pan.baidu.com/s/10KcfLLvI9omIRSJ6JMK9Uw 密碼:cgf8
我們先導入模塊pyplot,然后使用該模塊的plot函數來繪制折線圖,接著調用該模塊的相關函數來調整、設置圖表的標題、橫縱標簽、刻度標記內容或大小。注意, pyplot模塊的plot函數可以接收輸入參數和輸出參數,還有線條粗細等參數,但是若plot函數只指定輸出參數(列表),那么輸入參數默認由0開始。
(1)plot函數指定輸出參數(1,2,3,4,5的平方數列表)
import matplotlib.pyplot as plt
# pyplot模塊的plot函數可以接收輸入參數和輸出參數,還有線條粗細等參數,,例如下方的示例
squares = [1, 4, 9, 16, 25]
plt.plot(squares, linewidth=5) # 這里只指定了一個列表,那么就當作是輸出參數,輸入參數從0開始,就會發現沒有正確繪制數據
plt.title("Square Numbers", fontsize=24) # 指定標題,并設置標題字體大小
plt.xlabel("Value", fontsize=14) # 指定X坐標軸的標簽,并設置標簽字體大小
plt.ylabel("Square of Value", fontsize=14) # 指定Y坐標軸的標簽,并設置標簽字體大小
plt.tick_params(axis='both', labelsize=14) # 參數axis值為both,代表要設置橫縱的刻度標記,標記大小為14
plt.show() # 打開matplotlib查看器,并顯示繪制的圖形
運行結果如下:
(2)plot函數指定輸入參數和輸出參數
我們知道,上面并沒有按照我們的意愿來繪制圖形,Y軸指定為[1,4,9,16,25],上面采用默認輸入參數處理X軸變成[0,1,2,3,4]。X軸應該對應值為[1,2,3,4,5]才是我們的目的,所以我們必須同時指定輸入參數和輸出參數才行。觀察運行結果圖的X軸變化了。
import matplotlib.pyplot as plt
# 我也可以指定輸入參數和輸出參數,這樣就能按照我的意愿繪制圖形了
input_values = [1, 2, 3, 4, 5] # 指定輸入參數
squares = [1, 4, 9, 16, 25] # 指定輸出參數
plt.plot(input_values, squares, linewidth=5) # 調用繪制函數,傳入輸入參數和輸出參數
plt.title("Square Numbers", fontsize=24) # 指定標題,并設置標題字體大小
plt.xlabel("Value", fontsize=14) # 指定X坐標軸的標簽,并設置標簽字體大小
plt.ylabel("Square of Value", fontsize=14) # 指定Y坐標軸的標簽,并設置標簽字體大小
plt.tick_params(axis='both', labelsize=14) # 參數axis值為both,代表要設置橫縱的刻度標記,標記大小為14
plt.show() # 打開matplotlib查看器,并顯示繪制的圖形
運行結果如下:
繪制散點圖只不過是繪制函數不同,從上面的plot變為scatter,其他設置標題、橫縱標簽等的方式一樣。
(1)scatter函數繪制單個點
import matplotlib.pyplot as plt
plt.scatter(2, 4, s=200) # 傳遞一對x和y坐標。它將在指定位置繪制一個點,參數s是設置繪制圖形時使用的點的尺寸
plt.title("Square Numbers", fontsize=24) # 指定標題,并設置標題字體大小
plt.xlabel("Value", fontsize=14) # 指定X坐標軸的標簽,并設置標簽字體大小
plt.ylabel("Square of Value", fontsize=14) # 指定Y坐標軸的標簽,并設置標簽字體大小
plt.tick_params(axis='both', labelsize=14) # 參數axis值為both,代表要設置橫縱的刻度標記,標記大小為14
plt.show() # 打開matplotlib查看器,并顯示繪制的圖形
運行結果如下:
(2)scatter函數繪制一系列點
import matplotlib.pyplot as plt
x_values = [1, 2, 3, 4, 5]
y_values = [1, 4, 9, 16, 25]
plt.scatter(x_values, y_values, s=100) # 傳入兩個列表,列表x_values的元素作為x坐標,列表y_values的元素作為y坐標,兩個組合成一個點的坐標,所以一共有5個點
plt.title("Square Numbers", fontsize=24) # 指定標題,并設置標題字體大小
plt.xlabel("Value", fontsize=14) # 指定X坐標軸的標簽,并設置標簽字體大小
plt.ylabel("Square of Value", fontsize=14) # 指定Y坐標軸的標簽,并設置標簽字體大小
plt.tick_params(axis='both', labelsize=14) # 參數axis值為both,代表要設置橫縱的刻度標記,標記大小為14
plt.show() # 打開matplotlib查看器,并顯示繪制的圖形
運行結果如下:
(3)自動計算Y軸的數據
前面個兩個實例挺簡單,但也只是我們自己定義的短列表,如果要繪制的點有很多,那么還手動寫當然不實際,所以我們寫一個根據我們指定的X軸的數據,自動計算Y軸的數據就省事很多了。
import matplotlib.pyplot as plt
x_values = list(range(1, 1001)) # 我們是利用range函數生成一個從1到1000的可迭代對象(不包括1001),然后強制轉換為列表
y_values = [x ** 2 for x in x_values] # 這個語法是列表推導式,將x_values每個元素的值進行平方再逐一放入列表,最后這個列表推導式返回整個列表
plt.scatter(x_values, y_values, s=40) # 在2.0.0版本后的matplotlib中,scatter()函數的實參edgecolor(數據點的輪廓)默認為'none',則刪除輪廓。
plt.title("Square Numbers", fontsize=24) # 指定標題,并設置標題字體大小
plt.xlabel("Value", fontsize=14) # 指定X坐標軸的標簽,并設置標簽字體大小
plt.ylabel("Square of Value", fontsize=14) # 指定Y坐標軸的標簽,并設置標簽字體大小
plt.axis([0, 1100, 0, 1100000]) # 設置每個坐標軸的取值范圍。其實最右側就是1100,但是沒有顯示標簽而已
plt.show() # 打開matplotlib查看器,并顯示繪制的圖形
運行結果如下:
注意, 在2.0.0版本后的matplotlib中scatter()函數的實參edgecolor(數據點的輪廓)不寫則默認為'none',代表刪除輪廓。也可以通過以下修改代碼:
plt.scatter(x_values, y_values, s=40, edgecolor='red')
上述修改后的代碼指定數據點輪廓的顏色為紅色,由于默認點的顏色為藍色,所以你將會看到下面這樣,只有右上角是藍色,其他都是紅色,這是因為繪制很多點,紅色輪廓都粘連在一起了,所以看不出來。
修改代碼后運行結果如下:
上面說了默認數據點的顏色為藍色,我們也可以通過參數c修改數據點的顏色,至于顏色值可以采用直接寫顏色英文如'red'、'black'等,或者使用RGB顏色模式自定義顏色,這個自定義顏色設置為一個元組,其中包含三個0~1之間的小數值,它們分別表示紅色、綠色和藍色分量,如(0,0,0.8)。可以通過下面這樣修改代碼:
import matplotlib.pyplot as plt
x_values = list(range(1, 1001))
y_values = [x ** 2 for x in x_values]
plt.scatter(x_values, y_values, c=(0, 0.8, 0), s=40) # 指定了c參數,使用的是RGB顏色值方式
plt.title("Square Numbers", fontsize=24) # 指定標題,并設置標題字體大小
plt.xlabel("Value", fontsize=14) # 指定X坐標軸的標簽,并設置標簽字體大小
plt.ylabel("Square of Value", fontsize=14) # 指定Y坐標軸的標簽,并設置標簽字體大小
plt.axis([0, 1100, 0, 1100000]) # 設置每個坐標軸的取值范圍。其實最右側就是1100,但是沒有顯示標簽而已
plt.show() # 打開matplotlib查看器,并顯示繪制的圖形
運行結果如下:
(4)使用顏色映射和自動保存圖表
照書上P294頁的使用顏色映射小節的描述對于初學者可能有點模棱兩可,這里采用我自己的代碼來理解什么是顏色映射,原理是什么。
測試代碼如下:
import matplotlib.pyplot as plt
x_values = [1, 2, 3, 4, 5] # 含x值的列表
y_values = [1, 4, 2, 6, 5] # 含y值的列表
# 我們知道根據上面兩個列表,我們調用scatter可以繪制一系列的點
# 模塊pyplot內置了一組顏色映射,通過設置c參數為y列表的值(這個y列表的是[1,2,3,4,5])然后利用參數cmap根據y列表的大小映射到由x_values和y_values組成的五個點從淺到深的顏色,可以看出y列表[1,2,3,4,5]分別映射到(1,1),(2,4),(3,2),(4,6),(5,5)五個點,其中(1,1)點顏色最淺,(5,5)點顏色最深。
plt.scatter(x_values, y_values, c=[1, 2, 3, 4, 5], cmap=plt.cm.Blues, s=100)
plt.title("Square Numbers", fontsize=24) # 指定標題,并設置標題字體大小
plt.xlabel("Value", fontsize=14) # 指定X坐標軸的標簽,并設置標簽字體大小
plt.ylabel("Square of Value", fontsize=14) # 指定Y坐標軸的標簽,并設置標簽字體大小
plt.savefig("3.png", bbox_inches='tight') # 打開matplotlib查看器,并顯示繪制的圖形
# 值的注意的是,要讓程序自動將圖表保存到文件中,可將對plt.show()的調用替換為對plt.savefig()的調用。
# 如果指定了bbox_inches='tight'將圖表多余的空白區域裁剪掉,明顯更符合用戶需求,如果沒指定,生成的圖片顯示不出Y軸的標簽。
運行結果如下(需要注意,其實(1,1)點的位置還有一個非常淺藍色的點,只是淺到看不到而已):
如果還不理解,那么你就修改以下測試代碼來運行觀察:
plt.scatter(x_values, y_values, c=[1, 5, 3, 4, 5], cmap=plt.cm.Blues, s=100)
運行結果如下(可以發現(2,4)點的顏色也變成深藍色了哦):
有了上面的理解基礎,我們可以修改為書本源代碼,來觀察一下藍色彗星的殘影,哈哈O(∩_∩)O
書本源代碼:
import matplotlib.pyplot as plt
x_values = list(range(1,1001)) # 含x值的列表
y_values = [x ** 2 for x in x_values] # 含y值的列表
# 我們知道根據上面兩個列表,我們調用scatter可以繪制一系列的點
# 根據y列表的值大小進行顏色映射的,值大的顏色深,值小的顏色淺。如果y列表的值按順序,并且映射到按順序的點,那么自然顏色也是從淺到深。
# 模塊pyplot內置了一組顏色映射,通過設置c參數為y列表的值(這個y列表的是[1,2,3,4,5])然后利用參數cmap根據y列表的大小映射到由x_values和y_values組成的五個點從淺到深的顏色,可以看出y列表[1,2,3,4,5]分別映射到(1,1),(2,4),(3,2),(4,6),(5,5)五個點,其中(1,1)點顏色最淺,(5,5)點顏色最深。
plt.scatter(x_values, y_values, c=y_values, cmap=plt.cm.Blues, s=40)
plt.title("Square Numbers", fontsize=24) # 指定標題,并設置標題字體大小
plt.xlabel("Value", fontsize=14) # 指定X坐標軸的標簽,并設置標簽字體大小
plt.ylabel("Square of Value", fontsize=14) # 指定Y坐標軸的標簽,并設置標簽字體大小
plt.savefig("3.png", bbox_inches='tight') # 打開matplotlib查看器,并顯示繪制的圖形
運行結果圖如下(藍色彗星殘影):
套用書本原話來說,隨機漫步:每次行走都完全是隨機的,沒有明確的方向,結果是由一系列隨機決策決定的。
為了實現隨機漫步,需要做以下幾步就可以完成:
1.創建RandomWalk類來生成隨機漫步數據
2.利用獲取的隨機漫步數據繪制隨機漫步圖
3.模擬多次隨機漫步
4.設置隨機漫步圖的樣式
(1)創建RandomWalk類來生成隨機漫步數據
在項目里創建一個random_walk.py文件,該文件代碼如下:
from random import choice
# 一個生成隨機漫步數據的類
class RandomWalk:
# 默認為5000個點,代表5000步
def __init__(self, num_points=5000):
self.num_points = num_points
self.x_values = [0]
self.y_values = [0]
# 獲取隨機方向和步數的乘積
def get_step(self):
return choice([1, -1]) * choice([0, 1, 2, 3, 4])
def fill_walk(self):
while len(self.x_values) < self.num_points:
# 獲取往哪個方向走幾步
x_step = self.get_step()
y_step = self.get_step()
# 如果原地踏步則continue處理
if x_step == 0 and y_step == 0:
continue
# 計算下一步走的位置
next_x = self.x_values[-1] + x_step
next_y = self.y_values[-1] + y_step
# 將下一次走的位置保存在列表中
self.x_values.append(next_x)
self.y_values.append(next_y)
(2)利用獲取的隨機漫步數據繪制隨機漫步圖
在項目里創建一個rw_visual.py文件,該文件代碼如下:
import matplotlib.pyplot as plt
from random_walk import RandomWalk
# 創建一個RandomWalk實例,并指定走5000步
rw = RandomWalk(5000)
rw.fill_walk() # 開始獲取隨機漫步數據,其實獲取的是兩個包含x和y值的數據點列表
plt.scatter(rw.x_values, rw.y_values, s=15)
plt.show()
運行結果如下:
(3)模擬多次隨機漫步
在rw_visual.py文件代碼上加以修改,修改代碼如下:
import matplotlib.pyplot as plt
from random_walk import RandomWalk
while True:
rw = RandomWalk(5000)
rw.fill_walk()
plt.scatter(rw.x_values, rw.y_values,s=15)
plt.show()
keep_running = input("Make another walk?(y/n):")
if keep_running == 'n':
break
運行結果如下(你點擊右上角關閉按鈕,在PyCharm下方會彈出詢問是否繼續漫步):
(4)設置隨機漫步圖的樣式
我們將設置隨機漫步圖的樣式,定制一個好看的隨機漫步圖,有給點著色、重新繪制起點和終點、隱藏坐標軸、調整尺寸以適合屏幕。
import matplotlib.pyplot as plt
from random_walk import RandomWalk
while True:
rw = RandomWalk(5000)
rw.fill_walk()
plt.figure(figsize=(20, 6))
# 顏色映射就是用列表賦值給c,而這個列表的值可以隨意,大的代表顏色深,小的代表顏色淺。
point_number = list(range(rw.num_points)) # [0-4999]
plt.scatter(rw.x_values, rw.y_values, c=point_number, cmap=plt.cm.Blues, s=4)
# 突出起點和終點,點變大,用不同顏色來顯示起點和終點
plt.scatter(0, 0, c='green', s=100)
plt.scatter(rw.x_values[-1], rw.y_values[-1], c='red', s=100)
# 隱藏坐標軸
plt.axes().get_xaxis().set_visible(False)
plt.axes().get_yaxis().set_visible(False)
plt.show()
keep_running = input("Make another walk?(y/n):")
if keep_running == 'n':
break
運行結果如下:
另外有需要云服務器可以了解下創新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業上云的綜合解決方案,具有“安全穩定、簡單易用、服務可用性高、性價比高”等特點與優勢,專為企業上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。
當前文章:談談Python實戰數據可視化之matplotlib模塊(基礎篇)-創新互聯
URL網址:http://vcdvsql.cn/article0/gihio.html
成都網站建設公司_創新互聯,為您提供外貿建站、網站設計、標簽優化、移動網站建設、電子商務、Google
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯