《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—3.5.2 數(shù)據(jù)預處理

網(wǎng)友投稿 705 2025-04-02

3.5.2? 數(shù)據(jù)預處理

由于帶Adj前綴的數(shù)據(jù)是除權(quán)后的數(shù)據(jù)，更能反映股票數(shù)據(jù)特征，所以主要使用的數(shù)據(jù)特征為調(diào)整后的開盤價、最高價、最低價、收盤價和交易額（即Adj.Open、Adj.High、Adj.Low、Adj.Close和Adj.Volume）。

兩個數(shù)據(jù)特征如下：

HL_PCT（股票最高價與最低價變化百分比）：

（3-9）

PCT_change（股票收盤價與開盤價的變化百分比）：

（3-10）

于是，自變量為：Adj.Close、HL_PCT、PCT_change和Adj.Volume。因變量為：Adj.Close。

最后，對自變量數(shù)據(jù)進行規(guī)范化處理，使之服從正態(tài)分布。只需要執(zhí)行以下語句就可以達到預處理的目的，代碼如下：

X = preprocessing.scale(X)

使用Sklearn做線性回歸，首先導入相關(guān)函數(shù)：

from sklearn.linear_model import LinearRegression

建立線性回歸模型：

clf = LinearRegression(n_jobs=-1)

進行線性模擬：

clf.fit(X_train, y_train)

使用predict()函數(shù)對需要預測的數(shù)據(jù)進行預測：

forecast_set = clf.predict(X_lately)

模型的評估主要使用精度（accuracy）參數(shù)。調(diào)用線型模型中的精度評估函數(shù)score()。

accuracy = clf.score(X_test, y_test)

機器學習 Python 數(shù)據(jù)挖掘

版權(quán)聲明：本文內(nèi)容由網(wǎng)絡(luò)用戶投稿，版權(quán)歸原作者所有，本站不擁有其著作權(quán)，亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容，請聯(lián)系我們jiasou666@gmail.com 處理，核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。

標簽：Python數(shù)據(jù)挖掘與機器學習實戰(zhàn) 3.5.2

相關(guān)文章

Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.3.3 強化學習">《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.3.3 強化學習

705 2025-04-02

Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.7.4 Jupyter Notebook簡介">《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.7.4 Jupyter Notebook簡介

705 2025-04-02

《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—3.5.2 數(shù)據(jù)預處理

Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.3.3 強化學習">《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.3.3 強化學習

Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.7.4 Jupyter Notebook簡介">《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.7.4 Jupyter Notebook簡介

推薦文章

企業(yè)生產(chǎn)管理是什么，企業(yè)生產(chǎn)管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統(tǒng)哪個簡單好用？進銷存系統(tǒng)優(yōu)點

工廠生產(chǎn)管理（工廠生產(chǎn)管理流程及制度）

生產(chǎn)管理軟件，機械制造業(yè)生產(chǎn)管理，制造業(yè)生產(chǎn)過程管理軟件

進銷存軟件和ERP有什么區(qū)別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統(tǒng)？

數(shù)據(jù)庫訂單管理系統(tǒng)有哪些功能？數(shù)據(jù)庫訂單管理系統(tǒng)怎么設(shè)計？

什么是數(shù)據(jù)庫管理系統(tǒng)？

最近發(fā)表

熱評文章

零代碼開發(fā)是什么？2022低代碼平臺排行榜">零代碼開發(fā)是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統(tǒng)（智慧進銷存）">智能進銷存庫存管理系統(tǒng)（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

系統(tǒng)的功能有哪些？餐飲服務系統(tǒng)的構(gòu)成及工作程序">連鎖餐飲管理系統(tǒng)的功能有哪些？餐飲服務系統(tǒng)的構(gòu)成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接

《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—3.5.2 數(shù)據(jù)預處理

Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.3.3 強化學習">《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.3.3 強化學習

Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.7.4 Jupyter Notebook簡介">《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)》—1.7.4 Jupyter Notebook簡介

推薦文章

最近發(fā)表

熱評文章

零代碼開發(fā)是什么？2022低代碼平臺排行榜">零代碼開發(fā)是什么？2022低代碼平臺排行榜

進銷存庫存管理系統(tǒng)（智慧進銷存）">智能進銷存庫存管理系統(tǒng)（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

系統(tǒng)的功能有哪些？餐飲服務系統(tǒng)的構(gòu)成及工作程序">連鎖餐飲管理系統(tǒng)的功能有哪些？餐飲服務系統(tǒng)的構(gòu)成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦