機(jī)器學(xué)習(xí)服務(wù)提取圖片的特征向量">使用SAP Leonardo上的機(jī)器學(xué)習(xí)服務(wù)提取圖片的特征向量
1073
2025-04-01
本文介紹機(jī)器學(xué)習(xí)的框架指南,基本是免費(fèi)和開源的。
包括:通用機(jī)器學(xué)習(xí)、自動化機(jī)器學(xué)習(xí)、集成方法、不平衡的數(shù)據(jù)集、隨機(jī)森林、極限學(xué)習(xí)機(jī)、內(nèi)核方法、梯度提升等。
文章結(jié)構(gòu)分為“目錄版”和“簡介版”。
目錄版
1? 通用機(jī)器學(xué)習(xí)
scikit-learn?- Python 中的機(jī)器學(xué)習(xí)
Shogun?- 機(jī)器學(xué)習(xí)工具箱
xLearn?- 高性能、易于使用且可擴(kuò)展的機(jī)器學(xué)習(xí)包
可重復(fù)實(shí)驗(yàn)平臺 (REP)?- 人類機(jī)器學(xué)習(xí)工具箱
modAL?-?Python3的模塊化主動學(xué)習(xí)框架
Sparkit-learn?- PySpark + Scikit-learn = Sparkit-learn
mlpack?- 一個(gè)可擴(kuò)展的 C++ 機(jī)器學(xué)習(xí)庫(Python 綁定)
dlib?- 用于在 C++(Python 綁定)中制作真實(shí)世界機(jī)器學(xué)習(xí)和數(shù)據(jù)分析應(yīng)用程序的工具包
MLxtend?- Python 數(shù)據(jù)分析和機(jī)器學(xué)習(xí)庫的擴(kuò)展和幫助模塊
tick?- 統(tǒng)計(jì)學(xué)習(xí)模塊,特別強(qiáng)調(diào)時(shí)間相關(guān)建模
sklearn-extensions?- scikit-learn 小擴(kuò)展的綜合包
civisml-extensions?- 來自 Civis Analytics 的 scikit-learn 兼容估計(jì)器
scikit-multilearn?- python 的多標(biāo)簽分類
tslearn?- 專用于時(shí)間序列數(shù)據(jù)的機(jī)器學(xué)習(xí)工具包
seqlearn?- seqlearn 是 Python 的序列分類工具包
pystruct?- 簡單的 Python 結(jié)構(gòu)化學(xué)習(xí)框架
sklearn-expertsys?- 用于 scikit 學(xué)習(xí)的高度可解釋的分類器,生成易于理解的決策規(guī)則而不是黑盒模型
skutil?- 一組 scikit-learn 和 h2o 擴(kuò)展類(以及 Python 的插入符類)
sklearn-crfsuite?- 受 scikit-learn 啟發(fā)的 CRFsuite API
RuleFit?-規(guī)則擬合的實(shí)現(xiàn)
metric-learn?- Python 中的度量學(xué)習(xí)算法
pyGAM?- Python 中的廣義加性模型
luminol?- 異常檢測和關(guān)聯(lián)庫
2 自動化機(jī)器學(xué)習(xí)
TPOT?- 自動機(jī)器學(xué)習(xí)工具,使用遺傳編程優(yōu)化機(jī)器學(xué)習(xí)管道
auto-sklearn?- 是一個(gè)自動化機(jī)器學(xué)習(xí)工具包,是 scikit-learn 估算器的替代品
MLBox?- 一個(gè)強(qiáng)大的自動化機(jī)器學(xué)習(xí) python 庫。
3 集成方法
ML-Ensemble?- 高性能集成學(xué)習(xí)
brew?- Python 集成學(xué)習(xí) API
Stacking?- 用 Python 編寫的簡單而有用的堆棧庫。
stacked_generalization?- 用于機(jī)器學(xué)習(xí)堆疊泛化的庫。
vecstack?- 用于堆疊的 Python 包(機(jī)器學(xué)習(xí)技術(shù))
4 不平衡的數(shù)據(jù)集
不平衡學(xué)習(xí)- 使用各種技術(shù)執(zhí)行欠采樣和過采樣的模塊
不平衡算法- 基于 Python 的算法實(shí)現(xiàn),用于學(xué)習(xí)不平衡數(shù)據(jù)。
5 隨機(jī)森林
rpforest?- 隨機(jī)投影樹的森林
隨機(jī)森林聚類- 使用隨機(jī)森林的無監(jiān)督聚類
sklearn-random-bits-forest?- 由 (Wang et al., 2016) 編寫的隨機(jī)位森林程序的包裝器
rgf_python?- 正則化貪婪森林的 Python 包裝器
6 極限學(xué)習(xí)機(jī)
Python-ELM?-?Python 中的極限學(xué)習(xí)機(jī)實(shí)現(xiàn)
Python 極限學(xué)習(xí)機(jī) (ELM)?- 一種用于分類/回歸任務(wù)的機(jī)器學(xué)習(xí)技術(shù)
hpelm?![alt text][gpu] - 極限學(xué)習(xí)機(jī)(快速隨機(jī)神經(jīng)網(wǎng)絡(luò))的高性能實(shí)現(xiàn)。
7 內(nèi)核方法
pyFM?- python 中的分解機(jī)
fastFM?- 分解機(jī)庫
tffm?- 任意階分解機(jī)的 TensorFlow 實(shí)現(xiàn)
LiquidSVM?- SVM 的實(shí)現(xiàn)
scikit-rvm?- 使用 scikit-learn API 的相關(guān)向量機(jī)實(shí)現(xiàn)
8 梯度提升
XGBoost?![alt text][gpu] - 可擴(kuò)展、便攜和分布式梯度提升
LightGBM?![alt text][gpu] - 一種快速、分布式、高性能的微軟梯度提升
CatBoost?![alt text][gpu] -?Yandex 的決策樹庫上的開源梯度提升
InfiniteBoost?- 使用梯度下降構(gòu)建無限集成
TGBoost?- 微小的梯度提升樹
簡介版
1? 通用機(jī)器學(xué)習(xí)
scikit-learn?- Python 中的機(jī)器學(xué)習(xí)
一個(gè)簡單高效的預(yù)測數(shù)據(jù)分析工具;基于 NumPy、SciPy 和 matplotlib 構(gòu)建 ;開源,可商用 - BSD 許可。
Shogun?- 機(jī)器學(xué)習(xí)工具箱
Shogun 是一個(gè)開源機(jī)器學(xué)習(xí)庫,提供了廣泛的高效統(tǒng)一的機(jī)器學(xué)習(xí)方法。
支持多種語言(Python、Octave、R、Java/Scala、Lua、C#、Ruby 等)和平臺(Linux/Unix、MacOS 和 Windows)并與其科學(xué)計(jì)算環(huán)境集成。
通過瀏覽器在云端試用 Shogun?。
高效的實(shí)現(xiàn)(從標(biāo)準(zhǔn)到尖端算法),C++ 中的現(xiàn)代軟件架構(gòu)。
多種數(shù)據(jù)表示、算法類和通用工具的輕松組合,用于數(shù)據(jù)管道的快速原型設(shè)計(jì)。
免費(fèi)軟件、基于社區(qū)的開發(fā)和機(jī)器學(xué)習(xí)教育。
GPLv3 許可證并致力于 BSD 兼容性。
xLearn?- 高性能、易于使用且可擴(kuò)展的機(jī)器學(xué)習(xí)包
xLearn 是一個(gè)高性能、易于使用、可擴(kuò)展的機(jī)器學(xué)習(xí)包,包含線性模型 (LR)、分解機(jī) (FM) 和場感知分解機(jī) (FFM),所有這些都可以用于解決大型- 規(guī)模機(jī)器學(xué)習(xí)問題。xLearn 對于解決大規(guī)模稀疏數(shù)據(jù)的機(jī)器學(xué)習(xí)問題特別有用。許多現(xiàn)實(shí)世界的數(shù)據(jù)集處理高維稀疏特征向量,如推薦系統(tǒng),其中類別和用戶的數(shù)量在數(shù)百萬的數(shù)量級。
可重復(fù)實(shí)驗(yàn)平臺 (REP)?- 人類機(jī)器學(xué)習(xí)工具箱
REP是基于 ipython 的環(huán)境,用于以一致和可重復(fù)的方式進(jìn)行數(shù)據(jù)驅(qū)動的研究。
modAL?-?Python3的模塊化主動學(xué)習(xí)框架
modAL 是 Python3 的主動學(xué)習(xí)框架,設(shè)計(jì)時(shí)考慮了模塊化、靈活性和可擴(kuò)展性。它建立在 scikit-learn 之上,讓我們可以幾乎完全自由地快速創(chuàng)建主動學(xué)習(xí)工作流程。此外,我們可以使用定制的解決方案輕松更換零件,從而輕松設(shè)計(jì)新穎的算法。
Sparkit-learn?- PySpark + Scikit-learn = Sparkit-learn
Sparkit-learn 旨在在 PySpark 上提供 scikit-learn 功能和 API。該庫的主要目標(biāo)是創(chuàng)建一個(gè)接近 sklearn 的 API。
mlpack?- 一個(gè)可擴(kuò)展的 C++ 機(jī)器學(xué)習(xí)庫(Python 綁定)
mlpack是一個(gè)直觀、快速且靈活的 C++ 機(jī)器學(xué)習(xí)庫,可以綁定到其他語言。它旨在成為 LAPACK 的機(jī)器學(xué)習(xí)類比,旨在實(shí)現(xiàn)廣泛的機(jī)器學(xué)習(xí)方法和功能,作為機(jī)器學(xué)習(xí)研究人員的“瑞士軍刀”。除了強(qiáng)大的 C++ 接口,mlpack 還提供命令行程序、Python 綁定、Julia 綁定、Go 綁定和 R 綁定。
dlib?- 用于在 C++(Python 綁定)中制作真實(shí)世界機(jī)器學(xué)習(xí)和數(shù)據(jù)分析應(yīng)用程序的工具包
Dlib 是一個(gè)現(xiàn)代 C++ 工具包,包含機(jī)器學(xué)習(xí)算法和工具,用于在 C++ 中創(chuàng)建復(fù)雜的軟件以解決現(xiàn)實(shí)世界的問題。
MLxtend?- Python 數(shù)據(jù)分析和機(jī)器學(xué)習(xí)庫的擴(kuò)展和幫助模塊
Mlxtend(機(jī)器學(xué)習(xí)擴(kuò)展)是一個(gè) Python 庫,包含用于日常數(shù)據(jù)科學(xué)任務(wù)的有用工具。
tick?- 統(tǒng)計(jì)學(xué)習(xí)模塊,特別強(qiáng)調(diào)時(shí)間相關(guān)建模
tick是一個(gè)用于統(tǒng)計(jì)學(xué)習(xí)的 Python 3 模塊,特別強(qiáng)調(diào)與時(shí)間相關(guān)的建模。它是在 3-Clause BSD 許可下分發(fā)的。
sklearn-extensions?- scikit-learn 小擴(kuò)展的綜合包
Scikit-Learn 擴(kuò)展 (sklearn_extensions) 是scikit-learn擴(kuò)展的單一源存儲庫。它旨在補(bǔ)充 scikit-learn 在添加新預(yù)測器和模塊方面較慢、更謹(jǐn)慎的方法,并為可能不符合這些標(biāo)準(zhǔn)的 sklearn 兼容模塊提供單獨(dú)的 pip 可安裝源。
civisml-extensions?- 來自 Civis Analytics 的 scikit-learn 兼容估計(jì)器
scikit-multilearn?- python 的多標(biāo)簽分類
tslearn?- 專用于時(shí)間序列數(shù)據(jù)的機(jī)器學(xué)習(xí)工具包
seqlearn?- seqlearn 是 Python 的序列分類工具包
pystruct?- 簡單的 Python 結(jié)構(gòu)化學(xué)習(xí)框架
sklearn-expertsys?- 用于 scikit 學(xué)習(xí)的高度可解釋的分類器,生成易于理解的決策規(guī)則而不是黑盒模型
skutil?- 一組 scikit-learn 和 h2o 擴(kuò)展類(以及 Python 的插入符類)
sklearn-crfsuite?- 受 scikit-learn 啟發(fā)的 CRFsuite API
RuleFit?-規(guī)則擬合的實(shí)現(xiàn)
metric-learn?- Python 中的度量學(xué)習(xí)算法
pyGAM?- Python 中的廣義加性模型
luminol?- 異常檢測和關(guān)聯(lián)庫
2 自動化機(jī)器學(xué)習(xí)
TPOT?- 自動機(jī)器學(xué)習(xí)工具,使用遺傳編程優(yōu)化機(jī)器學(xué)習(xí)管道
TPOT 將通過智能探索數(shù)以千計(jì)的可能管道來為您的數(shù)據(jù)找到最佳管道,從而自動化機(jī)器學(xué)習(xí)中最乏味的部分。
auto-sklearn?- 是一個(gè)自動化機(jī)器學(xué)習(xí)工具包,是 scikit-learn 估算器的替代品
MLBox?- 一個(gè)強(qiáng)大的自動化機(jī)器學(xué)習(xí) python 庫。
MLBox 是一個(gè)強(qiáng)大的自動化機(jī)器學(xué)習(xí) python 庫。它提供以下功能:
快速讀取和分布式數(shù)據(jù)預(yù)處理/清理/格式化
高度穩(wěn)健的特征選擇和泄漏檢測
高維空間中精確的超參數(shù)優(yōu)化
最先進(jìn)的分類和回歸預(yù)測模型(深度學(xué)習(xí)、堆疊、LightGBM 等)
帶有模型解釋的預(yù)測
詳情請參考官方文檔
3 集成方法
ML-Ensemble?- 高性能集成學(xué)習(xí)
brew?- Python 集成學(xué)習(xí) API
Stacking?- 用 Python 編寫的簡單而有用的堆棧庫。
stacked_generalization?- 用于機(jī)器學(xué)習(xí)堆疊泛化的庫。
vecstack?- 用于堆疊的 Python 包(機(jī)器學(xué)習(xí)技術(shù))
4 不平衡的數(shù)據(jù)集
不平衡學(xué)習(xí)- 使用各種技術(shù)執(zhí)行欠采樣和過采樣的模塊
不平衡算法- 基于 Python 的算法實(shí)現(xiàn),用于學(xué)習(xí)不平衡數(shù)據(jù)。
5 隨機(jī)森林
rpforest?- 隨機(jī)投影樹的森林
隨機(jī)森林聚類- 使用隨機(jī)森林的無監(jiān)督聚類
sklearn-random-bits-forest?- 由 (Wang et al., 2016) 編寫的隨機(jī)位森林程序的包裝器
rgf_python?- 正則化貪婪森林的 Python 包裝器
6 極限學(xué)習(xí)機(jī)
Python-ELM?-?Python 中的極限學(xué)習(xí)機(jī)實(shí)現(xiàn)
Python 極限學(xué)習(xí)機(jī) (ELM)?- 一種用于分類/回歸任務(wù)的機(jī)器學(xué)習(xí)技術(shù)
hpelm?![alt text][gpu] - 極限學(xué)習(xí)機(jī)(快速隨機(jī)神經(jīng)網(wǎng)絡(luò))的高性能實(shí)現(xiàn)。
7 內(nèi)核方法
pyFM?- python 中的分解機(jī)
fastFM?- 分解機(jī)庫
tffm?- 任意階分解機(jī)的 TensorFlow 實(shí)現(xiàn)
LiquidSVM?- SVM 的實(shí)現(xiàn)
scikit-rvm?- 使用 scikit-learn API 的相關(guān)向量機(jī)實(shí)現(xiàn)
8 梯度提升
XGBoost?![alt text][gpu] - 可擴(kuò)展、便攜和分布式梯度提升
LightGBM?![alt text][gpu] - 一種快速、分布式、高性能的微軟梯度提升
CatBoost?![alt text][gpu] -?Yandex 的決策樹庫上的開源梯度提升
InfiniteBoost?- 使用梯度下降構(gòu)建無限集成
TGBoost?- 微小的梯度提升樹
AI Python 機(jī)器學(xué)習(xí)
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。