1、Pandas模塊
10多年專注成都網站制作,企業網站設計,個人網站制作服務,為大家分享網站制作知識、方案,網站設計流程、步驟,成功服務上千家企業。為您提供網站建設,網站制作,網頁設計及定制高端網站建設服務,專注于企業網站設計,高端網頁制作,對建筑動畫等多個領域,擁有豐富的網站運維經驗。DataFrame提供的是一個類似表的結構,由多個Series組成,而Series在DataFrame中columns。
附: pandas模塊文檔
2、安裝IPython解釋器:
其實,一鍵安裝Anaconda可以幫助使用者,一次性配置好我所有需要的工具包以及IPython解釋器環境。但是,出于我想學習更加透徹,所以自己安裝工具包和IPython解釋器環境。
(1)因為,python在windows下通過pip安裝帶有c擴展的包時,如果是python2.7,需要vs2008,如果是 python 3.x,需要vs2010,版本錯了都不行(建議直接裝編譯好的安裝包:
http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)。
但鏈接里沒有IPython,所以我用的方法是官網下載并安裝VCForPython27.msi。
然后在控制臺里輸入:
pip install ipython
pip install “ipython[notebook]”
進入ipynb文件所在目錄,輸入ipython notebook,會在瀏覽器中打開ipynb文件。
ipython notebook在下一個版本被命名為Jupyter Notebook。
通過pip install jupyter安裝
jupyter notebook運行
3、
使用plot()繪圖時,如果指定樣式參數為僅繪制數據點,那么所繪制的就是一幅散列圖。但是這種方法所繪制的點無法單獨指定顏色和大小。
scatter()所繪制的散列圖卻可以指定每個點的顏色和大小。
scatter()的前兩個參數是數組,分別指定每個點的X軸和Y軸的坐標。
s參數指定點的大 小,值和點的面積成正比。它可以是一個數,指定所有點的大小;也可以是數組,分別對每個點指定大小。
c參數指定每個點的顏色,可以是數值或數組。這里使用一維數組為每個點指定了一個數值。通過顏色映射表,每個數值都會與一個顏色相對應。默認的顏色映射表中藍色與最小值對應,紅色與大值對應。當c參數是形狀為(N,3)或(N,4)的二維數組時,則直接表示每個點的RGB顏色。
marker參數設置點的形狀,可以是個表示形狀的字符串,也可以是表示多邊形的兩個元素的元組,第一個元素表示多邊形的邊數,第二個元素表示多邊形的樣式,取值范圍為0、1、2、3。0表示多邊形,1表示星形,2表示放射形,3表示忽略邊數而顯示為圓形。
alpha參數設置點的透明度。
lw參數設置線寬,lw是line width的縮寫。
facecolors參數為“none”時,表示散列點沒有填充色。
4、Sigmoid函數是一個在生物學中常見的S型的函數,也稱為S型生長曲線。
sigmoid函數是一個良好的閾值函數,連續,光滑,嚴格單調,關于(0,0.5)中心對稱。
http://blog.csdn.net/chl033/article/details/4851541
5、讀取 .csv 文件
#讀取 .csv 文件練習 import csv csvfile = file('csv_test.csv', 'wb') writer = csv.writer(csvfile) writer.writerow(['姓名', '年齡', '電話']) data = [ ('小河', '25', '1234567'), ('小芳', '18', '789456') ] writer.writerows(data) #csvfile.close() csvfile = file('csv_test.csv', 'rb') reader = csv.reader(csvfile) for line in reader: print line csvfile.close() ['\xe5\xa7\x93\xe5\x90\x8d', '\xe5\xb9\xb4\xe9\xbe\x84', '\xe7\x94\xb5\xe8\xaf\x9d'] ['\xe5\xb0\x8f\xe6\xb2\xb3', '25', '1234567'] ['\xe5\xb0\x8f\xe8\x8a\xb3', '18', '789456']
6、train_test_split(分割train與test數據)函數練習
>>> import numpy as np >>> from sklearn.model_selection import train_test_split >>> X, y = np.arange(10).reshape((5, 2)), range(5) >>> Xarray([[0, 1], [2, 3], [4, 5], [6, 7], [8, 9]]) >>> list(y) [0, 1, 2, 3, 4] >>> >>> X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.33, random_state=42) >>> X_train array([[4, 5], [0, 1], [6, 7]]) >>> y_train [2, 0, 3] >>> X_test array([[2, 3], [8, 9]]) >>> y_test [1, 4]
另外有需要云服務器可以了解下創新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業上云的綜合解決方案,具有“安全穩定、簡單易用、服務可用性高、性價比高”等特點與優勢,專為企業上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。
分享標題:MachineLearning簡介篇-創新互聯
標題網址:http://vcdvsql.cn/article8/ejsop.html
成都網站建設公司_創新互聯,為您提供Google、品牌網站建設、面包屑導航、品牌網站設計、App設計、用戶體驗
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯