Survey | 多任務(wù)學(xué)習(xí)綜述

      網(wǎng)友投稿 1193 2025-03-31

      1.簡(jiǎn)介

      深度學(xué)習(xí)模型通常需要大量有標(biāo)簽數(shù)據(jù)才能訓(xùn)練出一個(gè)優(yōu)良的分類器。但是,包括醫(yī)學(xué)圖像分析在內(nèi)的一些應(yīng)用無(wú)法滿足這種數(shù)據(jù)要求,因?yàn)闃?biāo)注數(shù)據(jù)需要很多人力勞動(dòng)。在這些情況下,多任務(wù)學(xué)習(xí)(MTL)可以通過使用來(lái)自其它相關(guān)學(xué)習(xí)任務(wù)的有用信息來(lái)幫助緩解這種數(shù)據(jù)稀疏問題。

      微眾銀行首席智能官、香港科技大學(xué)講座教授、國(guó)際人工智能聯(lián)合會(huì)理事會(huì)主席、吳文俊人工智能杰出貢獻(xiàn)獎(jiǎng)獲得者楊強(qiáng)教授是多任務(wù)學(xué)習(xí)的先驅(qū)。楊強(qiáng)教授在本文中對(duì)MTL進(jìn)行了研究總結(jié),根據(jù)任務(wù)的性質(zhì),MTL被分類成多任務(wù)監(jiān)督學(xué)習(xí)、多任務(wù)無(wú)監(jiān)督學(xué)習(xí)、多任務(wù)主動(dòng)學(xué)習(xí)、多任務(wù)強(qiáng)化學(xué)習(xí)、多任務(wù)在線學(xué)習(xí)和多任務(wù)多視角學(xué)習(xí),楊強(qiáng)教授總結(jié)了每一類中的代表性方法,并重點(diǎn)討論了多任務(wù)監(jiān)督學(xué)習(xí)的五種方法,之后分析了并行和分布式MTL,最后提出在未來(lái)的MTL研究中還需解決的問題。

      2. 多任務(wù)學(xué)習(xí)

      定義中有兩個(gè)基本因素:一是任務(wù)的相關(guān)性,任務(wù)相關(guān)性是基于對(duì)不同任務(wù)關(guān)聯(lián)方式的理解;二是任務(wù)的定義,在機(jī)器學(xué)習(xí)中學(xué)習(xí)任務(wù)主要包含分類和回歸等監(jiān)督學(xué)習(xí)任務(wù)、聚類等無(wú)監(jiān)督學(xué)習(xí)任務(wù)、半監(jiān)督學(xué)習(xí)任務(wù)、主動(dòng)學(xué)習(xí)任務(wù)、強(qiáng)化學(xué)習(xí)任務(wù)、在線學(xué)習(xí)任務(wù)和多視角學(xué)習(xí)任務(wù),因此不同的學(xué)習(xí)任務(wù)對(duì)應(yīng)于不同的MTL設(shè)置。

      在MTL定義的基礎(chǔ)上,由于大多數(shù)MTL研究都是在這種背景下進(jìn)行的,因此主要研究監(jiān)督學(xué)習(xí)任務(wù),再對(duì)其它類型學(xué)習(xí)任務(wù)進(jìn)行回顧。

      3. 多任務(wù)監(jiān)督學(xué)習(xí)

      為了描述MTL中的任務(wù)相關(guān)性,需要解決三個(gè)問題:何時(shí)共享、共享什么以及如何共享。其中“何時(shí)共享”決定使用單任務(wù)模型還是多任務(wù)模型來(lái)解決多任務(wù)問題;“共享什么”確定所有任務(wù)之間共享什么信息,通常包括特征、實(shí)例和參數(shù)三種信息;“如何共享”確定實(shí)現(xiàn)信息共享的具體方法,目前的MTL研究主要集中在基于特征和基于參數(shù)的兩種形式,其中,基于特征形式的方法主要有特征學(xué)習(xí)方法,基于參數(shù)形式的方法主要有低軼方法、任務(wù)聚類方法、任務(wù)關(guān)系學(xué)習(xí)方法和分解法。

      3.1特征學(xué)習(xí)方法

      MTL中多個(gè)任務(wù)是相關(guān)的,可以假設(shè)不同任務(wù)之間擁有共同的特征表示,這個(gè)共同的特征表示是從原始數(shù)據(jù)中學(xué)習(xí)到的,依據(jù)原始特征表示和學(xué)習(xí)后的特征表示之間的關(guān)系,可以將特征學(xué)習(xí)方法分為特征轉(zhuǎn)換方法和特征選擇方法。

      1)特征轉(zhuǎn)換方法

      在特征轉(zhuǎn)換方法中,對(duì)原始特征進(jìn)行線性或非線性變換得到共同的特征表示,學(xué)習(xí)到的特征表示中的每一個(gè)特征都不同于原來(lái)的特征,主要介紹四種模型:多層前饋神經(jīng)網(wǎng)絡(luò)、多任務(wù)特征學(xué)習(xí)(MTFL)、多任務(wù)稀疏編碼方式和深層模型。

      多層前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,輸入層接收來(lái)自所有任務(wù)的訓(xùn)練樣本,并且輸出層具有多個(gè)輸出單元,每個(gè)任務(wù)對(duì)應(yīng)一個(gè)輸出單元,隱藏層的輸出可以看作是多個(gè)任務(wù)學(xué)習(xí)的共同特征表示,從原始表示到學(xué)習(xí)的特征表示的轉(zhuǎn)換取決于連接輸入和隱藏層的權(quán)重以及隱藏層中采用的激活功能單位。

      圖1 多任務(wù)前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

      與多層前饋神經(jīng)網(wǎng)絡(luò)不同,多任務(wù)特征學(xué)習(xí)(MTFL)方法是在正則化框架下設(shè)計(jì)的,前者的隱含層表示可能是冗余的,而MTFL方法中所使用的平方變換矩陣可以避免出現(xiàn)冗余現(xiàn)象。與MTFL相似的一種方法是多任務(wù)稀疏編碼方式,用于學(xué)習(xí)特征的線性變換。上述模型的特征變換只有一個(gè)層次,而一些深層的MTL模型可以有多層特征轉(zhuǎn)換,許多深層MTL方法假設(shè)任務(wù)共享前幾個(gè)隱藏層,然后在后續(xù)層中設(shè)有特定于任務(wù)的參數(shù)。

      Survey | 多任務(wù)學(xué)習(xí)綜述

      2)特征選擇方法

      特征選擇方法通過不同的標(biāo)準(zhǔn)消除無(wú)用的特征,選擇原始特征的子集作為所有任務(wù)的特征表示,這使得特征選擇法具有更好的可解釋性,當(dāng)特征轉(zhuǎn)換法的變換矩陣為對(duì)角0/1矩陣時(shí),特征選擇法可視為特征轉(zhuǎn)換法的特例,其中值為1的對(duì)角線對(duì)應(yīng)于所選的特性。如果應(yīng)用程序需要一些決策支持,則特征選擇方法比特征轉(zhuǎn)換法可能更合適。

      3.2低軼方法

      由于多個(gè)任務(wù)之間相互關(guān)聯(lián)且不同任務(wù)的特征之間存在相關(guān)性,假設(shè)不同任務(wù)的模型參數(shù)共享一個(gè)低軼空間,可以顯式地學(xué)習(xí)權(quán)重矩陣的低軼空間,也可以通過凸正則化或非凸正則化隱式地實(shí)現(xiàn)這一點(diǎn)。其中,利用跡范數(shù)作為正則元使權(quán)重矩陣具有較低的軼是一種常見的方式,譜k支持范數(shù)是對(duì)跡范數(shù)正則化的一種改進(jìn),還有研究者提出使用基于矩陣跡范數(shù)的張量跡范數(shù)作為正則元來(lái)識(shí)別參數(shù)張量的低軼結(jié)構(gòu)。

      3.3任務(wù)聚類方法

      在任務(wù)層次上進(jìn)行聚類來(lái)識(shí)別任務(wù)簇,每個(gè)任務(wù)簇由相似的任務(wù)組成,可以捕獲同一簇中任務(wù)之間的正相關(guān)。第一個(gè)被提出的基于任務(wù)聚類的算法是加權(quán)最近鄰分類器,在訓(xùn)練時(shí)針對(duì)每個(gè)任務(wù)都會(huì)通過調(diào)整權(quán)重實(shí)現(xiàn)最小化類內(nèi)距離并最大化類間距離來(lái)實(shí)現(xiàn)任務(wù)分類,在所有任務(wù)中獲取集群結(jié)構(gòu)后,將同一個(gè)簇中多個(gè)任務(wù)的訓(xùn)練數(shù)據(jù)集合在一起,學(xué)習(xí)最終加權(quán)最近鄰分類器。任務(wù)聚類法的局限在于會(huì)忽略不同簇中任務(wù)之間的負(fù)相關(guān),此外,即使這類方法中的一些方法可以自動(dòng)確定集群的數(shù)量,但它們中的大多數(shù)仍然需要交叉驗(yàn)證等模型選擇方法來(lái)確定它,這可能帶來(lái)更多的計(jì)算成本。

      3.4任務(wù)關(guān)系學(xué)習(xí)方法

      任務(wù)關(guān)系學(xué)習(xí)方法可同時(shí)學(xué)習(xí)模型參數(shù)和成對(duì)任務(wù)之間的關(guān)系。任務(wù)的相關(guān)性可以通過一些定量關(guān)系(如任務(wù)相似性、任務(wù)協(xié)方差等)來(lái)量化,在早期對(duì)MTL的研究中,通常會(huì)利用任務(wù)的相似性來(lái)設(shè)計(jì)正則化器指導(dǎo)學(xué)習(xí)多個(gè)任務(wù)。多任務(wù)高斯過程(MTGP)用于從數(shù)據(jù)中自動(dòng)學(xué)習(xí)任務(wù)關(guān)系,為解決MTGP中的過擬合問題又提出多任務(wù)廣義t過程,非貝葉斯模型有任務(wù)關(guān)系學(xué)習(xí)模型(MTRL)等,局部學(xué)習(xí)模型有k近鄰(kNN)分類器等,通過這些任務(wù)關(guān)系學(xué)習(xí)方法學(xué)習(xí)到的任務(wù)關(guān)系有助于我們觀察任務(wù)之間的相關(guān)性,提高任務(wù)的可解釋性。

      3.5分解方法

      該方法假設(shè)權(quán)重矩陣W可以分解成兩個(gè)或多個(gè)分量矩陣,通過對(duì)分量矩陣的不同設(shè)計(jì)可提出不同的分解模型,可以消除所有任務(wù)的不重要特征。分解法可看作一種‘深層’方法,‘深’體現(xiàn)在模型參數(shù)方面,是其他基于參數(shù)的方法的擴(kuò)展,可通過配置多層次的參數(shù),建立更復(fù)雜的任務(wù)結(jié)構(gòu)——樹結(jié)構(gòu)。

      4.多任務(wù)無(wú)監(jiān)督學(xué)習(xí)

      多任務(wù)無(wú)監(jiān)督學(xué)習(xí)的訓(xùn)練集僅由數(shù)據(jù)樣本構(gòu)成,其目標(biāo)是挖掘數(shù)據(jù)集中所包含的信息。多任務(wù)無(wú)監(jiān)督學(xué)習(xí)主要關(guān)注多任務(wù)聚類,聚類是指將一個(gè)數(shù)據(jù)集分成多個(gè)簇,其中每簇中都有相似的實(shí)例,因此多任務(wù)聚類的目的是通過利用不同數(shù)據(jù)集中包含的有用信息來(lái)在多個(gè)數(shù)據(jù)集上同時(shí)執(zhí)行聚類。

      5.多任務(wù)半監(jiān)督學(xué)習(xí)及多任務(wù)自主學(xué)習(xí)

      多任務(wù)半監(jiān)督學(xué)習(xí)能夠利用未標(biāo)記數(shù)據(jù)中包含的幾何信息,多任務(wù)自主學(xué)習(xí)目的是選擇有代表性的無(wú)標(biāo)記數(shù)據(jù)查詢預(yù)示,二者均可利用未標(biāo)記數(shù)據(jù)中包含的有用信息來(lái)進(jìn)一步提高M(jìn)TL的性能,常見模型有半監(jiān)督多任務(wù)學(xué)習(xí)、多任務(wù)自主學(xué)習(xí)和半監(jiān)督多任務(wù)自主學(xué)習(xí)模型。

      6.多任務(wù)強(qiáng)化學(xué)習(xí)

      強(qiáng)化學(xué)習(xí)研究的是如何在環(huán)境中采取行動(dòng)以最大化累積獎(jiǎng)勵(lì),多任務(wù)強(qiáng)化學(xué)習(xí)中,當(dāng)環(huán)境相似時(shí),不同的強(qiáng)化學(xué)習(xí)任務(wù)可以使用相似的策略來(lái)進(jìn)行決策。

      7.多任務(wù)多視角學(xué)習(xí)

      多視角學(xué)習(xí)假設(shè)每個(gè)數(shù)據(jù)點(diǎn)與多組特征相關(guān)聯(lián),其中每個(gè)集合對(duì)應(yīng)一個(gè)視角,并且它通常利用包含在多個(gè)視角中的信息來(lái)執(zhí)行監(jiān)督或非監(jiān)督任務(wù),多任務(wù)多視角學(xué)習(xí)是將多視角學(xué)習(xí)擴(kuò)展到多任務(wù)設(shè)置,其中每個(gè)任務(wù)都是一個(gè)多視角學(xué)習(xí)問題。

      8.并行和分布式MTL

      當(dāng)任務(wù)數(shù)量很大時(shí),如果我們直接應(yīng)用一個(gè)多任務(wù)學(xué)習(xí)器,那可能就會(huì)有很高的計(jì)算復(fù)雜度。現(xiàn)在計(jì)算機(jī)使用了多 CPU 和多 GPU 架構(gòu),其計(jì)算能力非常強(qiáng)大。所以我們可以使用這些強(qiáng)大的計(jì)算設(shè)備來(lái)設(shè)計(jì)并行 MTL 算法,從而加速訓(xùn)練過程。

      在某些情況中,用于不同任務(wù)的訓(xùn)練數(shù)據(jù)可能存在不同的機(jī)器中,這會(huì)使傳統(tǒng)的 MTL 模型難以工作。如果將所有的訓(xùn)練數(shù)據(jù)都可轉(zhuǎn)移到一臺(tái)機(jī)器上,這會(huì)造成額外的傳輸和存儲(chǔ)成本。設(shè)計(jì)能夠直接處理分布在多臺(tái)機(jī)器上數(shù)據(jù)的分布式 MTL 模型是更好的選擇。

      9. MTL的應(yīng)用

      MTL在不同領(lǐng)域有不同應(yīng)用,其模型各不相同,解決的應(yīng)用問題也不盡相同,但在各自的領(lǐng)域都存在著一些特點(diǎn)。在計(jì)算機(jī)視覺中圖像和視頻數(shù)據(jù)通常位于高維空間,使用特征選擇方法可識(shí)別低維表示,提高學(xué)習(xí)效率,深層模型在計(jì)算機(jī)視覺問題上也表現(xiàn)出良好的性能。在生物信息學(xué)和健康信息學(xué)中,學(xué)習(xí)模型的可解釋性在某種意義上更為重要,所以通常使用特征選擇來(lái)識(shí)別出有用的特征。在語(yǔ)音和自然語(yǔ)言處理中,數(shù)據(jù)呈現(xiàn)出順序結(jié)構(gòu),這使得基于RNN的深層模型發(fā)揮了主導(dǎo)作用。web應(yīng)用具有大規(guī)模數(shù)據(jù),因此這個(gè)領(lǐng)域傾向于簡(jiǎn)單的淺層模型或基于增強(qiáng)的組件,從而進(jìn)一步提高性能。

      10. 討論

      本文中提出在未來(lái)的研究中,有幾個(gè)主要的問題有待解決:第一,離群任務(wù)與其它任務(wù)無(wú)關(guān),當(dāng)它們共同學(xué)習(xí)時(shí),所有任務(wù)的性能都會(huì)受到影響,雖然有一些方法可以緩解異常值任務(wù)帶來(lái)的負(fù)面影響,但是對(duì)由此產(chǎn)生的負(fù)面影響的研究缺乏原則性的方法和理論分析。第二,當(dāng)所有任務(wù)相關(guān)時(shí),深層學(xué)習(xí)方法是強(qiáng)大的,但是它容易受到噪聲和離群任務(wù)的影響,這會(huì)極大地降低性能,需要更靈活、健壯的多任務(wù)深度模型。第三,現(xiàn)有的研究主要集中在監(jiān)督學(xué)習(xí)任務(wù)上,只有少數(shù)研究聚焦于半監(jiān)督學(xué)習(xí)、自主學(xué)習(xí)等其它學(xué)習(xí)任務(wù),需要為適應(yīng)和擴(kuò)展這些任務(wù)設(shè)計(jì)合適的模型。

      參考資料

      論文鏈接:https://arxiv.xilesou.top/abs/1707.08114

      機(jī)器學(xué)習(xí) 神經(jīng)網(wǎng)絡(luò)

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。

      上一篇:excel中建立副本的教程
      下一篇:wpsPPT怎么快速設(shè)計(jì)簡(jiǎn)約商務(wù)型標(biāo)題樣式?
      相關(guān)文章
      亚洲爽爽一区二区三区| 亚洲人成网站在线播放2019| 国产偷国产偷亚洲清高APP| 亚洲白色白色永久观看| 亚洲A∨无码一区二区三区| 亚洲国产成人一区二区精品区| 亚洲无线观看国产精品| 亚洲男人的天堂在线va拉文| 亚洲AⅤ永久无码精品AA| 国产精品亚洲а∨天堂2021| 久久精品国产亚洲AV天海翼| 精品久久久久久亚洲综合网| 朝桐光亚洲专区在线中文字幕| 精品国产日韩亚洲一区在线| 国产精品亚洲二区在线| 亚洲国产激情一区二区三区| 亚洲欧洲中文日韩久久AV乱码| 亚洲成av人片天堂网老年人| 亚洲五月午夜免费在线视频| 中文字幕精品亚洲无线码二区| 亚洲精品蜜桃久久久久久| 亚洲国产精品无码AAA片| 无码专区—VA亚洲V天堂| 亚洲小视频在线观看| 亚洲美女aⅴ久久久91| 亚洲伊人久久大香线蕉啊| 香蕉大伊亚洲人在线观看| 亚洲成a人无码亚洲成www牛牛 | 最新亚洲人成无码网站| 亚洲精品线路一在线观看| 一本色道久久综合亚洲精品| 亚洲国产成人精品无码区在线观看 | 亚洲中文字幕无码久久| 亚洲AV第一成肉网| 亚洲色偷偷狠狠综合网| 国产精一品亚洲二区在线播放| 亚洲激情在线观看| 亚洲一级在线观看| 亚洲GV天堂无码男同在线观看| 亚洲精品成人网久久久久久| 亚洲AV无码日韩AV无码导航 |