吳恩達機器學習課程筆記——應用場景、定義及分類
學習吳恩達老師的機器學習課程,記了些筆記,整理出來,與大家分享。
應用場景
機器學習的應用場景主要有4個:
數據挖掘:Data Mini
例如,挖掘Web點擊數據、醫院病歷數據、生物學中的各項數據等。
完成無法編程實現的任務:Applications can’t program by hand
例如,自動無人機,無人駕駛,手寫識別任務,自然語言處理(NLP),計算機視覺等。
個性化定制任務:Self-customizing programs
最常見是各個商城平臺的商品推薦,例如淘寶、京東,亞馬遜等。
了解人類
通過機器學習,通過AI來了解人類的學習機制,了解人類的大腦,逐步實現真正的人工智能。
定義:什么是機器學習
Arthur Samuel (1959) :
機器學習是給予計算機無需明確的編程即可擁有學習的能力。
Field of study that gives computers the ability to learn without being explicitly programmed.
Tom Mitchell (1998):
學習問題是,對于某個任務T,其性能指標為P,通過從經驗E學習,能夠對執行任務T時,提高P值。
拿電腦下棋來說,下棋為Task T,已經下過的棋盤為Experience E,下棋贏得概率為Performance P。
Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
機器學習的分類
機器學習可劃分為監督學習(Supervised Learning)與無監督學習(Unsupervised Learning)。
監督學習
監督學習,即teach computer how to do something,通俗的來說,就是給定一些數據的正確答案,然后通過學習,使得機器能夠產生其他數據的正確答案。Give the algorithm a data set, in which the “right answers” were given, and the task of algorithm was to just produce more of these “right answers”.
比如房價預測,通過過往歷年完整的房價數據來“學習”“訓練”,使得能夠一定程度上預測數值的輸出。又比如通過對醫院中的病歷分析,判斷新病人的腫瘤是良性還是惡性。
在監督學習中,每個樣品都被明確標明為陽性樣本或陰性樣本,我們已經被告知了什么是所謂的正確答案。
無監督學習
無監督學習,即learn by itself。在無監督學習中,數據沒有任何標簽或都具有相同的標簽,我們拿到一個數據集,但是不知道要拿它來做什么,也不知道每個數據點究竟是什么,只是被告知這里有一個數據集,你能在其中找到某種結構嗎。
比如聚類算法,來分析社交網絡,劃分市場等等,沒有明確的指標。又比如語音識別領域的雞尾酒會問題,如何從多個混合一個聲波信號中分離出多個獨立正確的聲波。
其他
吳恩達老師推薦使用Octave 開源免費的編程環境軟件來學習與實現機器學習算法,當確認算法可以實現后,才用C或者Python等高級語言來實現。
Octave是一個類Matlab的開源程序。
機器學習
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。