sklearn中怎么實現數據縮放功能

今天就跟大家聊聊有關sklearn中怎么實現數據縮放功能,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

創新互聯建站主營高邑網站建設的網絡公司,主營網站建設方案,APP應用開發,高邑h5微信小程序定制開發搭建,高邑網站營銷推廣歡迎高邑等地區企業咨詢

一、數據縮放

你的預處理數據集中可能包含各種各樣、不同比例的特征字段,比如美元、千克、價格,有的特征列數值范圍在100以內,有的卻達到幾百萬,差異很大。

很多機器學習模型不希望有這樣大的差異,如果數據集各個屬性之間的數值差異越小,則模型表現的會越好。這里不一概而論,具體原因小伙伴們自行探索下。

 

方法1:數據歸一化

數據歸一化是指將原始數據縮放到0和1之間。

對于依賴于值的大小的模型,這種對輸入屬性的縮放很管用。比如在K近鄰模型的距離測量和回歸系數的準備。

接下來用都知道的鳶尾花數據集演示數據歸一化:

# 對鳶尾花數據集進行數據歸一化處理.
from sklearn.datasets import load_iris
from sklearn import preprocessing
# 加載數據
iris = load_iris()
print(iris.data.shape)
# 分離原始數據集,分為自變量和因變量
X = iris.data
y = iris.target
# 歸一化處理
normalized_X = preprocessing.normalize(X)

方法2:數據標準化

數據標準化是指:將數據縮放,改變每個屬性的分布,使其平均值為0,標準差為1。

諸如高斯過程等依賴于特征分布的模型,對特征進行標準化是非常有用的。

依然用鳶尾花的例子:

# 對鳶尾花數據集進行數據標準化處理.
from sklearn.datasets import load_iris
from sklearn import preprocessing
# 加載數據
iris = load_iris()
print(iris.data.shape)
# 分離原始數據集,分為自變量和因變量
X = iris.data
y = iris.target
# 標準化處理
standardized_X = preprocessing.scale(X)

看完上述內容,你們對sklearn中怎么實現數據縮放功能有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注創新互聯行業資訊頻道,感謝大家的支持。

本文題目:sklearn中怎么實現數據縮放功能
分享網址:http://m.kartarina.com/article24/gecice.html

成都網站建設公司_創新互聯,為您提供網站建設自適應網站移動網站建設建站公司網站制作標簽優化

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

外貿網站制作
主站蜘蛛池模板: 国产综合无码一区二区三区| 无码人妻精品一区二区三区久久| 精品无码久久久久久久动漫 | 夜夜添无码一区二区三区| 中文字幕乱码无码人妻系列蜜桃| 国产成人无码区免费网站| 中文字幕韩国三级理论无码| 人妻无码久久久久久久久久久| 亚洲a∨无码男人的天堂| 成人无码网WWW在线观看| 无码人妻精品一区二区三区久久久| 少妇无码一区二区三区免费| 最新亚洲人成无码网站| 无码里番纯肉h在线网站| 91精品久久久久久无码| 久久无码AV中文出轨人妻| 69久久精品无码一区二区 | 无码成A毛片免费| 一级毛片中出无码| 无码少妇一区二区浪潮免费| 久久人妻av无码中文专区| 国产在线无码一区二区三区视频| 精品久久久无码中文字幕| 亚洲日韩国产二区无码| 精品无码av无码专区| 无码高潮少妇毛多水多水免费| 国产精品无码亚洲一区二区三区| 无码人妻精品一区二区三| 中文字幕日韩精品无码内射| 亚洲人成国产精品无码| 精品无码国产AV一区二区三区 | 亚洲av成人中文无码专区| 日韩精品无码一区二区三区不卡| 久久国产精品无码网站| 2014AV天堂无码一区| 中文字幕人妻三级中文无码视频| 日韩av无码中文无码电影| a级毛片无码免费真人久久| 免费无码又爽又刺激网站直播 | 日韩av无码中文字幕| 亚洲AV成人无码天堂|