機器學習2-線性回歸
前言

本案例觀察蟋蟀鳴叫的規律,訓練一個模型,預測鳴叫與溫度的關系。
蟋蟀在較為炎熱的天氣里鳴叫更為頻繁,數十年來,專業和業余昆蟲學者已將每分鐘的喵叫和溫度方面的數據編入目錄。
溫度與蟋蟀鳴叫的數據,先了解數據的分布情況:
上圖表示每分鐘的鳴叫與溫度的關系。
此曲線圖中能看到隨著溫度的升,蟋蟀鳴叫次數特增加。鳴叫聲與溫度之間的關系是線性關系。
可以繪制一條直線來近視地表示這種關系,如下圖所示:
雖然圖中的每個點不是完全分布在直線上,但基本都在直線附近;線性關系用公式表示如下:
其中:
y是指溫度,是預測的值;
m是指直線的斜率;
x是指每分鐘的鳴叫聲次數,即輸入特征的值。
b是指y軸截距。
按照機器學習的方式,寫一個模型方程式:
其中:
是指預測的標簽(輸出值)
b是指偏差(對應y軸截距),一些機器學習文檔中,稱為
是指特征1的權重。權重與上文中用m表示“斜率”的概念相同。
是指特征。(輸出向)
要根據新的每分鐘的鳴叫聲值 推斷(預測)溫度 ,只需將 值代入此模型即可。
下標(例如 和 )預示著可以用多個特征來表示更復雜的模型。例如,具有三個特征的模型可以采用以下方程式:
參考:https://developers.google.cn/machine-learning/crash-course/descending-into-ml/linear-regression
偏差(bias),距離原點的截距或偏移。偏差(也稱為偏差項)在機器學習模型中用b或 表示。例如,在下面的公式中,偏差為b:
推斷(inference),在機器學習中,推斷通常指以下過程:通過將訓練過的模型應用于無標簽樣本來做出雨雪。在統計學中,推斷是指在某些觀察數據條件下擬合分布參數的過程。(請參閱維基百科中有關統計學推斷的文章。)
線性回歸(linear regression),一種回歸模型,通過將輸入特征進行線性組合輸出連續值。
權重(weight),模型中特征的系數,或深度網絡中的邊。訓練模型的目標是確定每個特征的理想權重。如果權重為0,則相應的特征對模型來說沒有任何影響。
機器學習 線性回歸
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。