這篇文章將為大家詳細(xì)講解有關(guān)怎么用Python為直方圖繪制擬合曲線,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
目前創(chuàng)新互聯(lián)公司已為千余家的企業(yè)提供了網(wǎng)站建設(shè)、域名、虛擬主機(jī)、網(wǎng)站托管維護(hù)、企業(yè)網(wǎng)站設(shè)計(jì)、紅河哈尼網(wǎng)站維護(hù)等服務(wù),公司將堅(jiān)持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長(zhǎng),共同發(fā)展。python的五大特點(diǎn):1.簡(jiǎn)單易學(xué),開發(fā)程序時(shí),專注的是解決問題,而不是搞明白語言本身。2.面向?qū)ο螅c其他主要的語言如C++和Java相比, Python以一種非常強(qiáng)大又簡(jiǎn)單的方式實(shí)現(xiàn)面向?qū)ο缶幊獭?.可移植性,Python程序無需修改就可以在各種平臺(tái)上運(yùn)行。4.解釋性,Python語言寫的程序不需要編譯成二進(jìn)制代碼,可以直接從源代碼運(yùn)行程序。5.開源,Python是 FLOSS(自由/開放源碼軟件)之一。
直方圖是用于展示數(shù)據(jù)的分組分布狀態(tài)的一種圖形,用矩形的寬度和高度表示頻數(shù)分布,通過直方圖,用戶可以很直觀的看出數(shù)據(jù)分布的形狀、中心位置以及數(shù)據(jù)的離散程度等。
在python中一般采用matplotlib庫的hist來繪制直方圖,至于如何給直方圖添加擬合曲線(密度函數(shù)曲線),一般來說有以下兩種方法。
方法一:采用matplotlib中的mlab模塊
mlab模塊是Python中強(qiáng)大的3D作圖工具,立體感效果極佳。在這里使用mlab可以跳出直方圖二維平面圖形的限制,在此基礎(chǔ)上再添加一條曲線。在這里,我們以鳶尾花iris中的數(shù)據(jù)為例,來舉例說明。
import numpy as np import matplotlib.mlab as mlab import matplotlib.pyplot as plt import pandas # Load dataset url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data" names = ['sepal-length', 'sepal-width','petal-length', 'petal-width', 'class'] dataset = pandas.read_csv(url, names=names) print(dataset.head(10)) # descriptions print(dataset.describe()) x = dataset.iloc[:,0] #提取第一列的sepal-length變量 mu =np.mean(x) #計(jì)算均值 sigma =np.std(x) mu,sigma
以上為通過python導(dǎo)入鳶尾花iris數(shù)據(jù),然后提取第一列的sepal-length變量為研究對(duì)象,計(jì)算出其均值、標(biāo)準(zhǔn)差,接下來就繪制帶擬合曲線的直方圖。
num_bins = 30 #直方圖柱子的數(shù)量 n, bins, patches = plt.hist(x, num_bins,normed=1, facecolor='blue', alpha=0.5) #直方圖函數(shù),x為x軸的值,normed=1表示為概率密度,即和為一,綠色方塊,色深參數(shù)0.5.返回n個(gè)概率,直方塊左邊線的x值,及各個(gè)方塊對(duì)象 y = mlab.normpdf(bins, mu, sigma)#擬合一條最佳正態(tài)分布曲線y plt.plot(bins, y, 'r--') #繪制y的曲線 plt.xlabel('sepal-length') #繪制x軸 plt.ylabel('Probability') #繪制y軸 plt.title(r'Histogram : $\mu=5.8433$,$\sigma=0.8253$')#中文標(biāo)題 u'xxx' plt.subplots_adjust(left=0.15)#左邊距 plt.show()
以上命令主要采用mlab.normpdf基于直方圖的柱子數(shù)量、均值、方差來擬合曲線,然后再用plot畫出來,這種方法的一個(gè)缺點(diǎn)就是畫出的正態(tài)分布擬合曲線(紅色虛線)并不一定能很好反映數(shù)據(jù)的分布情況,如上圖所示。
方法二:采用seaborn庫中的distplot繪制
Seaborn其實(shí)是在matplotlib的基礎(chǔ)上進(jìn)行了更高級(jí)的API封裝,從而使得作圖更加容易,在大多數(shù)情況下使用seaborn就能做出很具有吸引力的圖,而使用matplotlib就能制作具有更多特色的圖。應(yīng)該把Seaborn視為matplotlib的補(bǔ)充,而不是替代物。
import seaborn as sns sns.set_palette("hls") #設(shè)置所有圖的顏色,使用hls色彩空間 sns.distplot(x,color="r",bins=30,kde=True) plt.show()
在這里主要使用sns.distplot(增強(qiáng)版dist),柱子數(shù)量bins也設(shè)置為30,kde=True表示是否顯示擬合曲線,如果為False則只出現(xiàn)直方圖。
在這里注意一下它與前邊mlab.normpdf方法不同的是,擬合曲線不是正態(tài)的,而是更好地?cái)M合了數(shù)據(jù)的分布情況,如上圖,因此比mlab.normpdf更為準(zhǔn)確。
進(jìn)一步設(shè)置sns.distplot,可以采用kde_kws(擬合曲線的設(shè)置)、hist_kws(直方柱子的設(shè)置),可以得到:
import seaborn as sns import matplotlib as mpl sns.set_palette("hls") mpl.rc("figure", figsize=(6,4)) sns.distplot(x,bins=30,kde_kws={"color":"seagreen", "lw":3 }, hist_kws={ "color": "b" }) plt.show()
其中,lw為曲線粗細(xì)程度。
關(guān)于“怎么用Python為直方圖繪制擬合曲線”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
分享文章:怎么用Python為直方圖繪制擬合曲線-創(chuàng)新互聯(lián)
當(dāng)前地址:http://vcdvsql.cn/article28/cssccp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站策劃、標(biāo)簽優(yōu)化、靜態(tài)網(wǎng)站、用戶體驗(yàn)、動(dòng)態(tài)網(wǎng)站、品牌網(wǎng)站制作
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容