計(jì)算機(jī)視覺的一些概念(五大基本任務(wù))
四大基本任務(wù)
圖像分類:給定一張輸入圖像,圖像分類任務(wù)旨在判斷該圖像所屬類別。
目標(biāo)定位:以包圍框的(bounding box)形式得到圖像類別位置,通常只有一類目標(biāo)或固定數(shù)目的目標(biāo)和背景類。
目標(biāo)檢測:相對于目標(biāo)定位,目標(biāo)種類和數(shù)目不定。
語義分割:語義分割需要判斷圖像中哪些像素屬于哪個目標(biāo)。
實(shí)例分割:語義分割不區(qū)分屬于相同類別的不同實(shí)例。例如,當(dāng)圖像中有多只貓時,語義分割會將兩只貓整體的所有像素預(yù)測為“貓”這個類別。與此不同的是,實(shí)例分割需要區(qū)分出哪些像素屬于第一只貓、哪些像素屬于第二只貓。
難點(diǎn)
語義鴻溝,拍攝視角變化,目標(biāo)占據(jù)圖像的比例變化,光照變化,背景相似,目標(biāo)形變,遮擋。
卷積層
標(biāo)準(zhǔn)卷積、深度方向的可分離卷積(SeparableConv2D)、深度可分離卷積(DepthwiseConv2D)、轉(zhuǎn)置卷積(反卷積)、空洞卷積。
為什么用卷積
圖像數(shù)據(jù)維度高,Dense參數(shù)多、計(jì)算量大、容易過擬合。
卷積:
局部連接:
圖像特征、邊緣、角點(diǎn)只占據(jù)圖像很小的部分,相隔較遠(yuǎn)的圖像塊關(guān)系不大。
通道上全連接、空間上局部連接。
參數(shù)共享:
提取圖像特征的模式可以復(fù)用。
空間上參數(shù)共享。
卷積輸入輸出關(guān)系
輸入H,濾波器F,零填充P,步長S:
感受野大小計(jì)算
感受野:卷積神經(jīng)網(wǎng)絡(luò)的每一層輸出的特征圖上的像素點(diǎn)在原圖像上映射的區(qū)域大小。
(尺寸F)小濾波器優(yōu)點(diǎn):更小參數(shù)量、更多分線性。
下一層每個像素點(diǎn)的感受野是上一次卷積層濾波器的大小。
多層:
當(dāng)有多層3×3標(biāo)準(zhǔn)卷積堆疊時,第l 層卷積(l 從1開始)的輸出神經(jīng)元的感受野為2l +1。
1x1卷積作用
常用來增加非線性、降維(通道上進(jìn)行壓縮,減少計(jì)算量和網(wǎng)絡(luò)參數(shù))、升維。
池化層
局部最大池化(常用)、局部平均池化、全局最大池化、全局平均池化(常用)
作用:
增加特征平移不變性;減小特征圖的大小,降低過擬合,
最大池化為什么最常用
根據(jù)相關(guān)理論,特征提取的誤差主要來自兩個方面:鄰域大小受限造成的估計(jì)值方差增大;卷積層參數(shù)誤差造成估計(jì)均值的偏移。一般來說,mean-pooling能減小第一種誤差,更多的保留圖像的背景信息,max-pooling能減小第二種誤差,更多的保留紋理信息。
參考
https://zhuanlan.zhihu.com/p/31727402
https://www.jianshu.com/p/5268b42daeda
https://keras.io
https://www.zhihu.com/question/23437871/answer/24696910
機(jī)器視覺 計(jì)算
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。