學(xué)習(xí)筆記20170601">【PMP】學(xué)習(xí)筆記20170601
685
2022-05-29
1.2.2? 卷積與權(quán)值共享
卷積是CNN的核心,用卷積核作用于圖像就可以得到相應(yīng)的圖像特征。
在傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)中,前后層之間的神經(jīng)元是“全連接”的,即每個神經(jīng)元都與前一層的所有神經(jīng)元相連,而卷積中的神經(jīng)元只與上一層中部分神經(jīng)元相連。從仿生的角度來說,CNN在處理圖像矩陣問題時會更加高效。例如,人的單個視覺神經(jīng)元并不需要對全部圖像進(jìn)行感知,只需要對局部信息進(jìn)行感知即可,若距離較遠(yuǎn)、相關(guān)性比較弱的元素則不在計算范圍內(nèi)。從計算的角度來說,卷積使得參數(shù)量與計算量大幅度降低。
接下來將介紹卷積的具體操作。例如,原始圖像大小是7×7,卷積核大小是3×3。首先將卷積核與原始圖像左上角3×3對應(yīng)位置的元素相乘求和,得到的數(shù)值作為結(jié)果矩陣第1行第1列的元素值,然后卷積核向右移動一個單位(即步長stride為1),與原始圖像前3行第2、3、4列所對應(yīng)位置的元素分別相乘并求和,得到的數(shù)值作為結(jié)果矩陣第1行第2列的元素值,以此類推。
以上就是卷積核矩陣在一個原始矩陣上從上往下、從左往右掃描,每次掃描都得到一個結(jié)果,將所有結(jié)果組合到一起得到一個新的結(jié)果矩陣的過程。操作如圖1.7所示。
圖1.7? 二維卷積的實例
如果將大量圖片作為訓(xùn)練集,則最終卷積核會訓(xùn)練成待提取的特征,例如識別飛機(jī),那么卷積核可以是機(jī)身或者飛機(jī)機(jī)翼的形狀等。
卷積核與原始圖像做卷積操作,符合卷積核特征的部分得到的結(jié)果也比較大,經(jīng)過激活函數(shù)往下一層傳播;不符合卷積特征的區(qū)域,獲得的數(shù)值比較小,往下傳播的程度也會受到限制。卷積操作后的結(jié)果可以較好地表征該區(qū)域符合特征的程度,這也是卷積后得到的矩陣被稱為特征平面的原因。
從上面的表述中我們可以引出權(quán)值共享的概念,即將圖像從一個局部區(qū)域?qū)W習(xí)到的信息應(yīng)用到其他區(qū)域。
圖像的局部特征具有重復(fù)性(也稱為位置無關(guān)性),即圖像中存在某個基本特征圖形可能出現(xiàn)在圖片上的任意位置,于是為在數(shù)據(jù)的不同位置檢測是否存在相同的模式,可以通過在不同位置共享相同的權(quán)值來實現(xiàn)。
用一個相同的卷積核對整幅圖像進(jìn)行一個卷積操作,相當(dāng)于對圖像做一個全圖濾波,選出圖片上所有符合這個卷積核的特征。例如,如果一個卷積核對應(yīng)的特征比是邊緣,那么用該卷積核對圖像做全圖濾波,即將圖像各個位置的邊緣都選擇出來(幫助實現(xiàn)不變性)。不同的特征可以通過不同的卷積核來實現(xiàn)。
圖像識別 圖像識別服務(wù) Image 圖像識別服務(wù)
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。