1、Pandas模塊
DataFrame提供的是一個(gè)類似表的結(jié)構(gòu),由多個(gè)Series組成,而Series在DataFrame中columns。
附: pandas模塊文檔
2、安裝IPython解釋器:
其實(shí),一鍵安裝Anaconda可以幫助使用者,一次性配置好我所有需要的工具包以及IPython解釋器環(huán)境。但是,出于我想學(xué)習(xí)更加透徹,所以自己安裝工具包和IPython解釋器環(huán)境。
(1)因?yàn)椋琾ython在windows下通過pip安裝帶有c擴(kuò)展的包時(shí),如果是python2.7,需要vs2008,如果是 python 3.x,需要vs2010,版本錯(cuò)了都不行(建議直接裝編譯好的安裝包:
http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)。
但鏈接里沒有IPython,所以我用的方法是官網(wǎng)下載并安裝VCForPython27.msi。
然后在控制臺(tái)里輸入:
pip install ipython
pip install “ipython[notebook]”
進(jìn)入ipynb文件所在目錄,輸入ipython notebook,會(huì)在瀏覽器中打開ipynb文件。
ipython notebook在下一個(gè)版本被命名為Jupyter Notebook。
通過pip install jupyter安裝
jupyter notebook運(yùn)行
3、
使用plot()繪圖時(shí),如果指定樣式參數(shù)為僅繪制數(shù)據(jù)點(diǎn),那么所繪制的就是一幅散列圖。但是這種方法所繪制的點(diǎn)無法單獨(dú)指定顏色和大小。
scatter()所繪制的散列圖卻可以指定每個(gè)點(diǎn)的顏色和大小。
scatter()的前兩個(gè)參數(shù)是數(shù)組,分別指定每個(gè)點(diǎn)的X軸和Y軸的坐標(biāo)。
s參數(shù)指定點(diǎn)的大 小,值和點(diǎn)的面積成正比。它可以是一個(gè)數(shù),指定所有點(diǎn)的大小;也可以是數(shù)組,分別對(duì)每個(gè)點(diǎn)指定大小。
c參數(shù)指定每個(gè)點(diǎn)的顏色,可以是數(shù)值或數(shù)組。這里使用一維數(shù)組為每個(gè)點(diǎn)指定了一個(gè)數(shù)值。通過顏色映射表,每個(gè)數(shù)值都會(huì)與一個(gè)顏色相對(duì)應(yīng)。默認(rèn)的顏色映射表中藍(lán)色與最小值對(duì)應(yīng),紅色與大值對(duì)應(yīng)。當(dāng)c參數(shù)是形狀為(N,3)或(N,4)的二維數(shù)組時(shí),則直接表示每個(gè)點(diǎn)的RGB顏色。
marker參數(shù)設(shè)置點(diǎn)的形狀,可以是個(gè)表示形狀的字符串,也可以是表示多邊形的兩個(gè)元素的元組,第一個(gè)元素表示多邊形的邊數(shù),第二個(gè)元素表示多邊形的樣式,取值范圍為0、1、2、3。0表示多邊形,1表示星形,2表示放射形,3表示忽略邊數(shù)而顯示為圓形。
alpha參數(shù)設(shè)置點(diǎn)的透明度。
lw參數(shù)設(shè)置線寬,lw是line width的縮寫。
facecolors參數(shù)為“none”時(shí),表示散列點(diǎn)沒有填充色。
4、Sigmoid函數(shù)是一個(gè)在生物學(xué)中常見的S型的函數(shù),也稱為S型生長(zhǎng)曲線。
sigmoid函數(shù)是一個(gè)良好的閾值函數(shù),連續(xù),光滑,嚴(yán)格單調(diào),關(guān)于(0,0.5)中心對(duì)稱。
http://blog.csdn.net/chl033/article/details/4851541
5、讀取 .csv 文件
#讀取 .csv 文件練習(xí) import csv csvfile = file('csv_test.csv', 'wb') writer = csv.writer(csvfile) writer.writerow(['姓名', '年齡', '電話']) data = [ ('小河', '25', '1234567'), ('小芳', '18', '789456') ] writer.writerows(data) #csvfile.close() csvfile = file('csv_test.csv', 'rb') reader = csv.reader(csvfile) for line in reader: print line csvfile.close() ['\xe5\xa7\x93\xe5\x90\x8d', '\xe5\xb9\xb4\xe9\xbe\x84', '\xe7\x94\xb5\xe8\xaf\x9d'] ['\xe5\xb0\x8f\xe6\xb2\xb3', '25', '1234567'] ['\xe5\xb0\x8f\xe8\x8a\xb3', '18', '789456']
6、train_test_split(分割train與test數(shù)據(jù))函數(shù)練習(xí)
>>> import numpy as np >>> from sklearn.model_selection import train_test_split >>> X, y = np.arange(10).reshape((5, 2)), range(5) >>> Xarray([[0, 1], [2, 3], [4, 5], [6, 7], [8, 9]]) >>> list(y) [0, 1, 2, 3, 4] >>> >>> X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.33, random_state=42) >>> X_train array([[4, 5], [0, 1], [6, 7]]) >>> y_train [2, 0, 3] >>> X_test array([[2, 3], [8, 9]]) >>> y_test [1, 4]
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
分享標(biāo)題:MachineLearning簡(jiǎn)介篇-創(chuàng)新互聯(lián)
標(biāo)題網(wǎng)址:http://m.kartarina.com/article8/ejsop.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供Google、品牌網(wǎng)站建設(shè)、面包屑導(dǎo)航、品牌網(wǎng)站設(shè)計(jì)、App設(shè)計(jì)、用戶體驗(yàn)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容