MXNet深度學習實戰》">《MXNet深度學習實戰》
834
2025-04-04
1.1.3 深度學習
在介紹深度學習之前首先需要了解下神經網絡,神經網絡是機器學習算法中的一個重要分支,通過疊加網絡層模擬人類大腦對輸入信號的特征提取,根據標簽和損失函數的不同,既可以做分類任務,又可以做回歸任務。我們知道在機器學習的大部分算法中,特征提取一般都是手動構造的,這部分需要非常豐富的經驗和業務知識,特征構造的優劣將會直接影響到模型的效果,而神經網絡可以通過疊加網絡層直接基于輸入數據提取特征,然后將提取到的特征作為分類或回歸層的輸入來完成分類或回歸任務,這在非結構化數據(圖像、語音、自然語言)處理方面已經初見成效。
深度學習就是基于神經網絡發展而來的,所謂“深度”,一方面是指神經網絡層越來越深,另一方面是指學習的能力越來越強,越來越深入。神經網絡是一個概念很大的詞,一般常聽到的多層感知機也大致與神經網絡相對應,所以下次當你聽到多層感知機這個名詞時就不再會是一頭霧水了。神經網絡是由多個層搭建起來的,這就好比一棟幾十層的房子是一層一層搭建起來的一樣,稍有不同的是,在神經網絡中層的類型更多樣,而且層與層之間的聯系復雜多變。深度學習中的深度主要就是來描述神經網絡中層的數量,目前神經網絡可以達到成百上千層,整個網絡的參數量從萬到億不等,所以深度學習并不是非常深奧的概念,其本質上就是神經網絡。
神經網絡并不是最近幾年才有的概念,早在20世紀中期就已經有人提出了神經網絡,那么既然深度學習是基于神經網絡發展而來的,為什么到最近幾年才引起人們的注意呢?因為訓練深層神經網絡需要大量的數據和計算力!大量的數據可以通過人為標注輸送給模型,這相當于為模型提供了燃料;強大的計算力可以在短時間內訓練好模型,這相當于為模型提供了引擎。最近幾年正是有了數據和計算力的支持,深度學習才得以大爆發。即便如此,神經網絡的結構搭建、訓練優化等過程依然十分耗時,許多底層的層操作都需要自己實現,網上相關的開源項目也非常少,相當于一直在重復造輪子,效率非常低下。在這種背景下,各種開源的深度學習框架開始誕生,這些深度學習框架封裝了大部分的底層操作,支持GPU加速,并為用戶提供了各種語言的接口,以方便用戶使用。隨著這些框架的不斷發展和優化,文檔越來越詳細、清晰,顯存優化越來越好,接口支持的語言也越來越多。因此現在利用深度學習框架提供的接口,我們可以像搭積木一樣靈活地搭建我們想要的網絡,然后訓練網絡得到結果,這也大大加快了算法的產出。
深度學習 神經網絡
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。