Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.3.3 強化學習">《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.3.3 強化學習
705
2025-04-02
3.5.2? 數(shù)據(jù)預處理
由于帶Adj前綴的數(shù)據(jù)是除權(quán)后的數(shù)據(jù),更能反映股票數(shù)據(jù)特征,所以主要使用的數(shù)據(jù)特征為調(diào)整后的開盤價、最高價、最低價、收盤價和交易額(即Adj.Open、Adj.High、Adj.Low、Adj.Close和Adj.Volume)。
兩個數(shù)據(jù)特征如下:
HL_PCT(股票最高價與最低價變化百分比):
(3-9)
PCT_change(股票收盤價與開盤價的變化百分比):
(3-10)
于是,自變量為:Adj.Close、HL_PCT、PCT_change和Adj.Volume。因變量為:Adj.Close。
最后,對自變量數(shù)據(jù)進行規(guī)范化處理,使之服從正態(tài)分布。只需要執(zhí)行以下語句就可以達到預處理的目的,代碼如下:
X = preprocessing.scale(X)
使用Sklearn做線性回歸,首先導入相關(guān)函數(shù):
from sklearn.linear_model import LinearRegression
建立線性回歸模型:
clf = LinearRegression(n_jobs=-1)
進行線性模擬:
clf.fit(X_train, y_train)
使用predict()函數(shù)對需要預測的數(shù)據(jù)進行預測:
forecast_set = clf.predict(X_lately)
模型的評估主要使用精度(accuracy)參數(shù)。調(diào)用線型模型中的精度評估函數(shù)score()。
accuracy = clf.score(X_test, y_test)
機器學習 Python 數(shù)據(jù)挖掘
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。