遷移學習基礎研究問題及適用場景

      網友投稿 1172 2022-05-30

      由于知識獲取與表示的困難,以及當時計算機計算能力的限制,符號主義的主張沒有得到應有的發(fā)展和大規(guī)模的應用,以知識為基礎的學習方法也同樣受到重創(chuàng)。21 世紀初,機器學習中的一個分支——概率統(tǒng)計學習(特別是深度學習)異軍突起,獲得巨大成功。它不僅建立了較好的理論基礎和有效的算法,還成功地得到商業(yè)應用,成為推動產業(yè)和社會發(fā)展的重要力量,使 AI 進入了以數(shù)據驅動為主導的第二代 AI 發(fā)展時代。為了邁向真正的 AI,我們需要第三代 AI,而遷移學習正在向這一道路邁進。本文節(jié)選自《遷移學習》一書,由楊強教授與其學生在多年研究的基礎上撰寫的,它包含了遷移學習的基礎、方法、技術和應用。

      人工智能(Artificial Intelligence,AI)是艾倫·圖靈受其提出的“機器會思考嗎?”這一著名圖靈測試問題啟發(fā)而得到的愿景。該圖靈測試問題激勵了幾代研究人員探索機器智能運行的方法。然而縱觀最近二三十年的發(fā)展,人工智能研究經歷了多次起伏,其中大部分都圍繞著機器如何從外部世界獲取知識這一核心問題而演變。

      從人工建立基于規(guī)則的知識庫到從數(shù)據中進行機器學習,使機器像人類一樣思考的嘗試已經走了很長的路。目前,機器學習(machine learning)已經從一個模糊的學科發(fā)展成為一種推動工業(yè)和社會發(fā)展的重要力量,可以實現(xiàn)從電子商務和廣告投放到教育和醫(yī)療等領域的自動化決策。由于機器學習具有使機器通過在標注和未標注的數(shù)據中進行學習和適應來獲得知識的強大能力,因此它正在成為一種**用的技術。機器學習根據數(shù)據生成預測模型,因此往往需要高質量的數(shù)據作為“老師”來幫助調控統(tǒng)計模型。這種對未來事件進行準確預測的能力是基于對任務領域的觀察和理解。訓練樣本中的數(shù)據通常是被標注的,也就是說訓練樣本中的觀察和預測結果是相互耦合和相關的。之后,這些樣本就能夠被機器學習算法當成“老師”來“訓練”可應用到新數(shù)據的模型。現(xiàn)實生活中有許多應用機器學習的成功例子。基于計算機的圖像分析領域中的人臉識別是一個很好的例子。假設我們已經獲得了大量的醫(yī)療影像照片。那么,機器學習系統(tǒng)可以使用這些照片訓練模型,從而判斷新照片中是否有某種疾病的可能性。機器學習模型還可以應用于公司的安保系統(tǒng)中,以判斷訪客是否是公司的員工。

      盡管機器學習模型可以具有高質量,但它也有可能出錯,尤其是當模型應用于有別于訓練環(huán)境的場景中時。例如,如果從具有不同光照強度和不同程度的噪聲(如陰影、不同角度的光照、路人的遮擋等)的室外環(huán)境拍攝照片,那么系統(tǒng)的識別能力將會顯著下降。這是由于由機器學習系統(tǒng)訓練的模型被應用于“不同”的場景。性能下降表明模型可能已過時,當出現(xiàn)新情況時需要及時更新。正是這種將模型從一種場景更新或者遷移到另一場景的需求體現(xiàn)了本書主題的重要性。

      對遷移學習(transfer learning)的需求不僅僅局限于圖像理解,通過自然語言處理(Natural Language Processing,NLP)技術理解 Twitter 文本消息是另一個例子。假設我們希望將 Twitter 消息根據用戶的不同情緒(如高興、傷心等)進行分類。那么,當使用來自青少年群體的一組 Twitter 消息構建一個模型然后將其用于成年人的新數(shù)據時,模型的性能就會急劇下降,因為不同群體很可能會以不同的方式表達他們的觀點。

      如上面的例子所述,在許多應用中使用機器學習的一個重要挑戰(zhàn)是,現(xiàn)有的模型不能很好地適應到新的領域中。究其原因,訓練數(shù)據量小、場景變化、任務變化等都可能導致這一問題。例如,在醫(yī)學診斷和醫(yī)學圖像領域,短期內往往無法獲得新病癥的大量高質量訓練數(shù)據用于模型的重訓練。沒有充足的訓練數(shù)據的支撐,機器學習模型的性能往往不盡如人意。獲得和標注新應用場景下的數(shù)據通常要花費很多精力和資源,這已然是現(xiàn)實生活中實現(xiàn)人工智能的一個主要障礙。打個比方,擁有一個精心設計卻沒有訓練數(shù)據的 AI 系統(tǒng)就像一輛沒有油或電的跑車。

      上述討論顯示了將機器學習應用于實際場景的一個主要障礙:在應用機器學習算法前,我們無法獲得各個領域的大量訓練數(shù)據。除此之外,還有其他幾個重要原因:

      遷移學習的基礎研究問題及適用場景

      1)許多應用場景數(shù)據量小。當前機器學習的成功應用依賴于大量有標簽數(shù)據的可用性。然而,高質量有標簽數(shù)據總是供不應求。傳統(tǒng)的機器學習算法常常因為數(shù)據量小而產生過擬合問題,因而無法很好地泛化到新的場景中。

      2)機器學習模型需要強魯棒性。傳統(tǒng)的機器學習算法假設訓練和測試數(shù)據來自相同的數(shù)據分布。然而,這種假設對于許多實際應用場景來說太強。在許多情況下,數(shù)據分布不僅會隨著時間和空間而變化,也會隨著不同的情況而變化,因此我們可能無法使用相同的數(shù)據分布來對待新的訓練數(shù)據。在不同于訓練數(shù)據的新場景下,已經訓練完成的模型需要在使用前進行調整。

      3)個性化和定制問題。根據個人喜好和需求為每個用戶提供個性化的服務是至關重要且具有經濟效應的。在許多實際應用中,我們只能從單個用戶收集到非常少的個人數(shù)據。因此,當我們嘗試將通用的模型應用到特定的場景時,傳統(tǒng)的機器學習算法會遇到冷啟動問題。

      4)用戶隱私和數(shù)據安全。在實際應用中,我們常常需要和其他組織合作,從而需要利用多個數(shù)據集。這些數(shù)據集通常屬于不同的所有者,并且出于隱私或者安全考慮不能彼此泄露。當利用多個數(shù)據集構建同一模型時,我們希望提取每個數(shù)據集的“本質”并在構建模型中擬合它們。例如,如果能夠在網絡設備的“邊緣”調整通用模型,那么就不需要上傳存儲在設備上的數(shù)據來增強該通用模型,因此邊緣設備的隱私將得以保證。

      智能系統(tǒng)的上述目標促進了遷移學習的發(fā)展。簡而言之,遷移學習是一種機器學習范式,其算法能夠從一個或多個應用場景中提取知識以幫助提高目標場景中的學習性能。與需要大量精心準備的訓練數(shù)據作為輸入的傳統(tǒng)機器學習技術相比,遷移學習可以被理解為一種新的學習范式,我們將在本書對其進行詳細介紹。除此之外,遷移學習也是解決許多大規(guī)模線上應用中數(shù)據稀疏性和冷啟動問題的一種方式,例如,線上推薦場景中可能因為有標簽用戶評分數(shù)據太少而無法構建高質量的推薦系統(tǒng)。

      基于遷移學習的方法,一旦我們在一個領域中獲得了訓練好的模型,就可以將這個模型引入其他類似的領域。因此,為了設計一個合理的遷移學習方法,找到不同領域任務間準確的“距離”度量方式是必需的。如果兩個領域間的“距離”過大,那么我們可能不希望應用遷移學習技術,因為這樣的學習可能產生一些負面影響。另一方面,如果兩個領域非常“靠近”,則可以有效地應用遷移學習。

      在機器學習中,領域之間的距離通常根據描述數(shù)據的特征來度量。在圖像分析中,特征可以是圖像中的像素或者區(qū)域,例如顏色和形狀。在自然語言處理中,特征可以是單詞或者短語。一旦了解兩個領域非常接近,我們就能確保 AI 模型可以從一個已開發(fā)好的領域遷移到一個欠開發(fā)的領域,從而使 AI 應用更少地依賴數(shù)據。這對于成功的遷移學習應用來說是一個好的預兆。

      能夠將知識從一個領域遷移到另一個領域說明機器學習系統(tǒng)能夠將其適用范圍擴展到其源域外。這種泛化能力使得在 AI 能力或者計算能力、數(shù)據和硬件等資源相對匱乏的領域內,更加容易實現(xiàn) AI 且 AI 更加魯棒。在某種程度上,遷移學習可以促進 AI 成為一種更為包容的、為每個人服務的技術。

      為了給出一個直觀的例子,我們可以使用類比的方式突出遷移學習背后的關鍵要素。考慮在世界不同國家開車的情況。在美國和中國,駕駛員位置在汽車的左側并且汽車靠右行駛。在英國,駕駛位置在汽車右側并且汽車靠左行駛。對于習慣在美國開車的人來說,在英國開車時,其駕駛習慣的轉換尤為困難。然而,遷移學習能夠幫助我們找到兩個駕駛領域中的不變性并將其作為一種共同特征。仔細觀察可以發(fā)現(xiàn),無論駕駛員坐在哪邊,其離道路中心始終是最近的。換言之,駕駛員坐在離路邊最遠的位置。這一事實能夠使駕駛員將駕駛習慣順利地從一個國家“遷移”到另一個國家。因此,遷移學習背后的關鍵要素是尋找不同領域和任務之間的“不變性”。在人工智能領域,遷移學習已在知識重用、基于案例的推理、類比學習、領域自適應、預訓練和微調等不同術語下得到了廣泛研究。在教育和學習心理學領域,學習遷移與機器學習中的遷移學習有類似的概念。具體地說,學習遷移是指從之前的源任務中獲得的歷史經驗可用于影響目標情境中的未來學習和表現(xiàn)(L.Thorndike 和 S.Woodworth,1901)。教育領域中的學習遷移和機器學習中的遷移學習有一個共同目標,即在一個場景中處理學習的過程,然后將學習應用到另一個場景中。在這兩個領域中,學習到的知識或者模型都在進行了一定程度的適應后應用到后繼的目標任務中。深入研究教育理論和學習心理學的文獻 (Ellis,1965;Pugh 和 Bergin,2006;Schunk,1965;Cree 和 Macaulay,2000) 可以發(fā)現(xiàn),盡管機器學習中的遷移學習旨在賦予機器適應場景的能力,教育領域中的學習遷移試圖研究人在教育中的適應性,但是二者在遷移的過程或者處理方式上卻是相似的。

      最后關于遷移學習的好處需要提及的是模擬技術。在諸如機器人和藥物設計等復雜任務中,在真實的環(huán)境中進行試驗的成本通常是非常昂貴的。在機器人領域,移動機器人或自動駕駛汽車需要收集大量的訓練數(shù)據。例如,汽車碰撞可能有多種方式,但在現(xiàn)實生活中造成汽車碰撞的成本太高。相反,研究人員通常建立復雜的模擬器,以便在模擬環(huán)境訓練出來的模型可以通過遷移學習應用到實際環(huán)境中。遷移學習的作用是考慮模擬環(huán)境中許多未知的未來情況,并使模擬環(huán)境中得到的預測模型(諸如汽車自動駕駛中的躲避障礙物模型)適應不可預見的未來情況。

      正如上面提到的,遷移學習中存在三個研究問題,即“遷移什么”“如何遷移”和“何時遷移”。由于遷移學習的目標是跨不同領域遷移知識,因此第一個問題就是可以遷移哪些跨域的知識來提高目標域的泛化性能,也就是“遷移什么”問題。在確定了要遷移的知識后,后續(xù)問題便是如何將知識編碼到學習算法中進行遷移,這對應于“如何遷移”問題。“何時遷移”是詢問在哪些情況下應該進行遷移學習或者可以安全地進行遷移學習。這三個問題背后的一個基本研究問題是如何衡量任何一對域或者任務之間的“距離”。通過域或者任務之間的距離度量,可以確定任務之間的哪些共有知識可以用于減少域或者任務之間的距離,即“遷移什么”,并根據識別出來的共有知識確定如何減少域或者任務之間的距離,即“如何遷移”。此外,通過域或任務之間的距離度量,可以在邏輯上決定“何時遷移”:如果距離太大,則建議不進行遷移學習。否則,遷移才是“安全的”。

      因此,隨后的問題是如何進行距離度量。傳統(tǒng)上,對于任何兩個概率分布之間的距離存在各種類型的統(tǒng)計度量方法。其中,典型的度量方法包括但不限于 KL 散度、A 距離和最大均值差異(Maximum Mean Discrepancy,MMD)。回顧一下,域包含特征空間和邊緣概率分布兩個組成部分,任務也包含標簽空間和條件概率分布兩個組成部分。因此,通過假設源域(源任務)和目標域(目標任務)共享一個特征(標簽)空間,可以將現(xiàn)有的概率分布間距離的統(tǒng)計度量方法用于度量域或者任務之間的距離。但是,使用統(tǒng)計距離度量方法進行遷移學習存在一些限制。首先,研究人員發(fā)現(xiàn)這些基于通用分布的距離度量通常過于粗糙,并且在兩個域或者任務之間的可遷移性距離度量方面不能很好地發(fā)揮作用。其次,如果域具有不同的特征空間和 / 或標簽空間,則必須首先將數(shù)據映射到相同的特征空間和 / 或標簽空間,然后將統(tǒng)計距離度量方法應用到后續(xù)步驟中。因此,需要對兩個域或者任務之間距離的泛化度量進行更多的研究。

      從目標識別到行為識別的很多圖像理解任務已經運用了遷移學習。通常,這些計算機視覺任務需要大量有標簽數(shù)據來訓練模型,例如使用眾所周知的 ImageNet 數(shù)據集。然而,當計算機視覺的情景稍有變化(例如從室內到室外、從靜止攝像機變?yōu)橐苿訑z像機)時,需要調整模型以適應新情況。遷移學習是解決這些適應問題的常用技術。

      在圖像分析領域,許多最近的方法將深度學習架構和遷移學習相結合。例如,Long 等人(2015)利用深度學習框架將源域和目標域之間的距離最小化。在 Facebook 上發(fā)表的一篇文章中,Mahajan 等人(2018)將遷移學習應用到圖像分類中。該方法首先在非常大的圖像數(shù)據集上訓練深度學習模型,然后在目標域的特定任務中利用相對少量的有標簽數(shù)據對預先訓練的模型進行調整。該模型是一個為基于數(shù)十億社交媒體圖片主題標簽的分類任務而訓練的深度卷積網絡,目標任務是目標識別或圖像分類。他們的分析表明,增加預訓練數(shù)據集的大小以及在源任務和目標任務之間選擇密切相關的標簽空間都很重要。這一觀察結果說明,遷移學習需要設計“標簽空間工程”方法以匹配源和目標的學習任務。他們的工作還表明,可以通過提高源模型的復雜度和增加數(shù)據集大小獲得對目標任務的改進。

      遷移學習還使得圖像分析在具有巨大社會影響的應用中發(fā)揮重要作用。在 Xie 等人(2016)的研究中,斯坦福大學地球科學的學者基于衛(wèi)星圖像, 利用遷移學習來預測全球貧困水平。首先,他們使用白天的圖像預測夜間光照圖像,然后將所得模型遷移到預測貧困的問題上。與傳統(tǒng)的基于調查的方法相比,該方法得到了非常準確的預測結果并且只需要很少的人工標注工作。

      在生物學中,許多實驗成本高昂且數(shù)據很少。例如,醫(yī)生嘗試使用計算機發(fā)現(xiàn)潛在疾病時的生物成像,以及使用軟件模型掃描復雜的 DNA 和蛋白質序列以尋找特定疾病以及治愈的模式。遷移學習越來越多地被用于幫助將知識從一個領域遷移到另一個領域來解決生物學中有標簽數(shù)據獲取成本高昂的難題。例如,Xu 和 Yang(2011)對在生物信息學應用中利用遷移學習和多任務學習進行了早期調研。Xu 等人(2011)提出了一種遷移學習過程以識別在有標簽數(shù)據極少的目標域中的蛋白質細胞結構。在生物醫(yī)學圖像分析中,一個難題是收集足夠的訓練數(shù)據來訓練模型以識別諸如癌癥等指定疾病的圖像模式。這種識別需要大量的訓練數(shù)據。然而,這些數(shù)據通常因為需要專家進行標注而十分昂貴。此外,預訓練模型和未來模型的數(shù)據通常來自不同的分布。這些問題激發(fā)了許多應用遷移學習來使預訓練模型適應新任務的研究工作。例如,在 Shin 等人(2016)的研究中,基于 ImageNet 數(shù)據的預訓練模型被用作源域模型,然后被遷移到醫(yī)學成像領域中用于胸腹淋巴結檢測和間質性肺病分類,該研究取得了巨大的成功。

      通常情況下,由于冷啟動問題,在線產品推薦系統(tǒng)難以建立。如果我們能發(fā)現(xiàn)域之間的相似性并將推薦模型從一個成熟域適應到新域,那么就可以緩和冷啟動問題。這通常可以節(jié)省成功完成一個原本不可能的任務所耗費的時間和資源。例如,Li 等人(2009b)和 Pan 等人(2010b)開創(chuàng)性地將遷移學習應用到了在線推薦領域。在他們的應用中,跨域推薦系統(tǒng)將用戶偏好模型從現(xiàn)有域(如圖書推薦領域)遷移到一個新域(如電影推薦領域)中。該場景對應于在線商務站點開放新業(yè)務線時希望在新業(yè)務線中快速部署推薦模型的商業(yè)案例。在這樣做時,必須克服新業(yè)務線中缺少交易數(shù)據的問題。另一項工作是整合強化學習(reinforcement learning)和推薦系統(tǒng),從而使依據用戶歷史記錄和潛在的興趣多樣性推薦的項目是準確的。例如,Liu 等人(2018)提出了一種在推薦準確度和主體多樣性中達到平衡的 bandit 算法,以允許系統(tǒng)挖掘新主題以及迎合用戶最近的選擇。關于遷移學習,該工作表明平衡探索和利用的推薦策略確實可以在域之間進行遷移。

      在設計機器人和汽車自動駕駛時,從模擬場景中學習是一種特別有用的方法。在硬件交互部分,收集用于訓練強化學習和監(jiān)督學習模型的有標簽數(shù)據是十分昂貴的。正如 Taylor 和 Stone(2007) 所描述的,遷移學習能夠幫助研究人員在一個或多或少理想的域(源域)中構建模型,然后在目標域中學習處理預期事件的策略。目標域模型可以處理更多現(xiàn)實世界中的情況,以進一步處理更多未預料到的噪聲數(shù)據。當模型很好地適應后,可以在重新訓練目標域模型的過程中節(jié)省大量勞動力和資源。Tai 等人(2017)設計了基于 10 維稀疏范圍發(fā)現(xiàn)的無地圖支持運動規(guī)劃器,并通過端到端的深度強化學習算法對其進行了訓練,然后通過真實樣本將學習好的規(guī)劃器泛化遷移到了現(xiàn)實場景中。

      文本挖掘是遷移學習算法的一個很好的應用場景。文本挖掘旨在從文本中發(fā)現(xiàn)有用的結構性知識并將其應用于其他領域中。在文本挖掘的所有問題中,文本分類旨在用不同的類標簽標記新的文本文檔。一個典型的文本分類問題是情感分類。在線論壇、博客、社交網絡等在線網站上有大量用戶生成的內容,能夠總結消費者對產品和服務的看法非常重要。情感分類能夠通過將評論分為正面和負面兩個類別來解決這個問題。但是,在不同的域中,例如不同類型的產品、不同類型的在線網站、不同的行業(yè),用戶可能使用不同的詞語表達他們具有相同情感的觀點。因此,在一個域上訓練的情感分類器可能在其他域上表現(xiàn)不佳。在這種情況下,遷移學習可以幫助調整已訓練完成的情感分類器以適應不同的領域。

      近期,對預訓練的研究獲得了遷移學習本質的新見解。Devlin 等人(2018)發(fā)現(xiàn)了遷移學習應用成功的一個條件:擁有足夠數(shù)量的源域訓練數(shù)據。例如,谷歌的自然語言處理系統(tǒng) BERT(Bidirectional Encoder Representations from Transformers,Transformer 的雙向編碼器表示)(Devlin 等人,2018)將遷移學習應用于許多 NLP 任務中,證明使用強大的預訓練模型可以解決許多傳統(tǒng)自然語言處理領域的棘手問題(如問答系統(tǒng))。在公開的 SQuAD 2.0 競賽中,BERT 在許多任務中取得了令人驚訝的領先結果(Rajpurkar 等人,2016)。其源域由非常龐大的自然語言文本語料庫組成,BERT 使用該語料庫訓練基于注意力機制的雙向 Transformer 模型。預訓練模型能夠使語言模型中的各種預測比以前更準確,并且其預測能力隨著源域中訓練數(shù)據量的增加而增加。然后,通過在諸如下一句子分類、問答和命名實體識別(Named Entity Recognition,NER)中向源模型添加額外的較小的層,便可以將 BERT 模型應用于目標域中的特定任務。這種遷移學習方法屬于基于模型的遷移,其中大多數(shù)超參數(shù)保持相同,但是會選擇幾個超參數(shù)通過目標域中的新數(shù)據進行調整。

      網絡 網絡智能體

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:到底什么是數(shù)據中臺?
      下一篇:邊境安檢系統(tǒng):LeSS與離岸開發(fā)
      相關文章
      久久久久久久综合日本亚洲| 相泽亚洲一区中文字幕| 亚洲成色www久久网站夜月| 亚洲第一黄片大全| 国产亚洲视频在线| 亚洲AV香蕉一区区二区三区| 亚洲欧美自偷自拍另类视| 亚洲日本VA中文字幕久久道具| 国产成人精品亚洲日本在线| 亚洲ts人妖网站| 国产成人精品日本亚洲网址 | 亚洲高清免费在线观看| 无码专区—VA亚洲V天堂| 亚洲成年轻人电影网站www | 国产亚洲精品资源在线26u| 亚洲中久无码不卡永久在线观看| 久久久久国产成人精品亚洲午夜| 中文字幕亚洲不卡在线亚瑟| 亚洲永久精品ww47| 亚洲国产精品无码av| 亚洲成在人天堂一区二区| 内射少妇36P亚洲区| 亚洲精品日韩专区silk| 亚洲午夜精品在线| 伊人久久五月丁香综合中文亚洲| 亚洲永久网址在线观看| 亚洲美国产亚洲AV| 亚洲A∨精品一区二区三区| 2022中文字字幕久亚洲| 亚洲熟女少妇一区二区| 久久精品亚洲日本佐佐木明希| 亚洲免费视频网站| 亚洲一级毛片免观看| 一本色道久久88—综合亚洲精品 | 一本色道久久88—综合亚洲精品 | 国产亚洲男人的天堂在线观看| 亚洲另类激情专区小说图片| 久久久久久久综合日本亚洲| 色婷婷亚洲十月十月色天| 亚洲一区二区三区精品视频| 亚洲人成网站免费播放|