PythonAI中如何使用機器學習回歸模型預測房價

本篇文章給大家分享的是有關Python AI中如何使用機器學習回歸模型預測房價,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

專業從事企業網站建設和網站設計服務,包括網站建設、域名注冊、網絡空間、企業郵箱、微信公眾號開發、微信支付寶微信平臺小程序開發、app軟件開發公司、軟件開發、等服務。公司始終通過不懈的努力和以更高的目標來要求自己,在不斷完善自身管理模式和提高技術研發能力的同時,大力倡導推行新經濟品牌戰略,促進互聯網事業的發展。

一、回歸預測

今天我們來具體了解一下使用機器學習算法進行回歸預測。

回歸預測主要用于預測與對象關聯的連續值屬性,得到數值型的預測數據。回歸預測的應用場景有各類的價格預測、相關性的反應預測等。

下面,我們就使用sklearn模塊,以一個sklearn中集成的波士頓房價數據集來演示如何進行回歸預測。

二、波士頓房價預測

1、引入數據集

在sklearn中內置的數據集都位于datasets子模塊下,我們可以直接進行導入:

Python AI中如何使用機器學習回歸模型預測房價

導入之后,看看數據集中的內容:

Python AI中如何使用機器學習回歸模型預測房價

其中有五個鍵,從字面意思上理解,可以發現data是數據集中所有的數據特征,DESCR是數據集的描述信息,target是數據集特征對應的目標值,feature_name則是數據特征的名稱。

我們先來看看數據特征的名稱:

Python AI中如何使用機器學習回歸模型預測房價

可以發現數據集中有13個特征,每個特征具體是什么意思,倒不清楚,我們可以在DESCR描述中找到具體意思:

Python AI中如何使用機器學習回歸模型預測房價

最后可以知道每個數據特征的含義如下:

  • CRIM:人均犯罪率 ;

  • ZN:住宅用地超過兩萬五千平方英尺的比例 ;

  • INDUS:城鎮的非零售營業比例;

  • CHAS:河流分界;

  • NOX:一氧化氮濃度 ;

  • RM:住宅平均房間數;

  • AGE:1940年之前建造的房屋業主比例;

  • DIS:距離波士頓五個就業中心的加權距離;

  • RAD:徑向公路的可達指數;

  • TAX :每一萬美元財產的全額財產稅率

  • PTRATIO :城鄉教師比例;

  • B :黑人比例

  • LSTAT :低層人群比例

  • MEDV :房屋價格中值

再來看看具體的數據特征和目標數據值:


數據特征形狀:

Python AI中如何使用機器學習回歸模型預測房價

數據特征概覽:

Python AI中如何使用機器學習回歸模型預測房價

數據特征一共有506行,13列,正好對應13個數據特征。而目標數據值的也正好是506個:

Python AI中如何使用機器學習回歸模型預測房價

相當于是已經處理好的數據了。

但是對于初學者來說,這樣處理好的數據看起來不是太直觀,我們使用Pandas將其還原為DataFrame的形式,可以直觀地看出這個數據集到底是什么樣的:

Python AI中如何使用機器學習回歸模型預測房價

對于熟悉使用pandas的同學來說,這樣看這個數據集是不是親切多了。

好了,我們可以直接進行下一步。

2、分割訓練數據和測試數據

為了檢驗我們創建和訓練好的機器學習模型的效果,將數據集分割為訓練集和測試集是必須的。

而在sklearn中,也有一個專門的接口方法用于分割數據集的訓練集和測試集——train_test_split,我們首先導入它:

Python AI中如何使用機器學習回歸模型預測房價

然后將我們的數據集data傳入,并設置測試集的比例為15%:

Python AI中如何使用機器學習回歸模型預測房價

3、選擇一個回歸算法估計器

在sklearn中,所有的機器學習算法都以“估計器”的形式來呈現,每一個估計器都是一個類,機器學習模型通過實例化一個估計器的類來進行創建。比如線性回歸的算法估計器:

Python AI中如何使用機器學習回歸模型預測房價

每一個算法估計器,無論是監督學習算法還是非監督學習算法,都擁有一個fit()方法,用于接收訓練數據集來訓練數據,比如這樣:

Python AI中如何使用機器學習回歸模型預測房價

同時每一個算法估計器都有用一個predict()方法,用于接收數據來進行預測,比如這樣:

Python AI中如何使用機器學習回歸模型預測房價

在sklearn中,各類機器學習算法的API設計根據不同的用途的算法進行劃分,我們可以方便地調用自己想要的算法,每一個監督學習算法,都由一個單獨的子模塊構成,其下包含算法的具體類,比如廣義的線性回歸算法:

Python AI中如何使用機器學習回歸模型預測房價

其中根據用途,有的算法 可細分為用于回歸的估計器和用于分類的估計器。

在此,我們選擇隨機森林算法的用于回歸的估計器:

Python AI中如何使用機器學習回歸模型預測房價

首先,導入算法估計器:

Python AI中如何使用機器學習回歸模型預測房價

接著,實例化隨機森林回歸估計器,設置算法的參數并將訓練集傳入進行訓練:

Python AI中如何使用機器學習回歸模型預測房價

訓練好模型之后,再使用predict()方法對訓練集進行預測:

Python AI中如何使用機器學習回歸模型預測房價

這樣,我們就獲得了使用隨機森林回歸模型對測試集進行預測的數據了,其為一個一維數組,我們可以直接打印出來看到:

Python AI中如何使用機器學習回歸模型預測房價

還記得我們分割訓練測試集的時候,有過一個y_test的數組吧?它是測試集x_test數據特征對應正確的房價結果,我們也來看看其數據:

Python AI中如何使用機器學習回歸模型預測房價

如何比較正確數組和預測出來的數組的值的正確度呢?一個比較蠢的方法是通過遍歷這兩個數組進行對比,查看其差值:

Python AI中如何使用機器學習回歸模型預測房價

如果測試數據集少的話,這樣來比較似乎工作量還不大,要是測試集很大那就沒辦法了。幸而,sklearn中也提供了對模型的評估方法,所有的評估方法都集成在sklearn.metrics子模塊中。針對回歸模型,我們可以使用平均絕對誤差MAE和均方差MSE以及R2分數來對回歸模型評估:

Python AI中如何使用機器學習回歸模型預測房價

然后在評估方法中傳入預測數組和正確數組:

Python AI中如何使用機器學習回歸模型預測房價

最終得到了我們的平均絕對誤差值、均方差值和R2分數。其中,R2分數理論最佳值為1,平均絕對誤差理論最佳值為0.0,均方差理論最佳值也為0.0.

嗯,這個機器學習隨機森林回歸模型的效果如何?大家自己評估,也可以自己調用其他的回歸模型來測試,看看哪個算法對這個數據集的預測效果較好。

以上就是Python AI中如何使用機器學習回歸模型預測房價,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注創新互聯行業資訊頻道。

文章名稱:PythonAI中如何使用機器學習回歸模型預測房價
網站鏈接:http://m.kartarina.com/article22/igcccc.html

成都網站建設公司_創新互聯,為您提供電子商務外貿建站網站內鏈微信小程序服務器托管網站設計

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

成都做網站
主站蜘蛛池模板: 自拍偷在线精品自拍偷无码专区| 国产精品无码一区二区三区在 | 亚洲AV无码久久精品狠狠爱浪潮| 国产精品成人无码久久久久久 | 无码av中文一二三区| 中文字幕无码不卡在线| 99热门精品一区二区三区无码| 日韩放荡少妇无码视频| 无码av免费网站| 无码日韩人妻AV一区二区三区| 人妻丰满熟妇AV无码片| 亚洲精品无码精品mV在线观看 | 久久美利坚合众国AV无码| 亚洲AV无码专区电影在线观看| 人妻无码中文字幕免费视频蜜桃| 久久午夜夜伦鲁鲁片免费无码影视| 成年无码av片在线| 亚洲aⅴ无码专区在线观看春色| 久久午夜伦鲁片免费无码| 亚洲中文字幕无码一区二区三区| 真人无码作爱免费视频| 亚洲Aⅴ在线无码播放毛片一线天| 无码成人一区二区| 久久精品aⅴ无码中文字字幕| 中文字幕无码av激情不卡| 日韩精品无码Av一区二区| 日本无码一区二区三区白峰美| 亚洲AV无码成人专区| 精品人妻系列无码一区二区三区| 国产热の有码热の无码视频| 熟妇人妻中文a∨无码| 狠狠躁狠狠爱免费视频无码| 无码日韩精品一区二区人妻| 亚洲?V无码成人精品区日韩 | 欧洲精品无码成人久久久| 国产乱妇无码大片在线观看| 亚洲AV无码乱码在线观看代蜜桃 | 亚洲精品无码久久久久久久 | 无码喷水一区二区浪潮AV | 亚洲AV日韩AV无码污污网站| 91久久九九无码成人网站|