《深度學(xué)習(xí)之圖像識(shí)別:核心技術(shù)與案例實(shí)戰(zhàn)》 ——3.1.4 ImageNet數(shù)據(jù)集
3.1.4? ImageNet數(shù)據(jù)集
ImageNet數(shù)據(jù)集地址為:http://www.image-net.org/,2009年由李飛飛實(shí)驗(yàn)室發(fā)布。
ImageNet數(shù)據(jù)集是李飛飛實(shí)驗(yàn)室主導(dǎo)的一個(gè)項(xiàng)目,目標(biāo)是構(gòu)建一個(gè)計(jì)算機(jī)視覺(jué)研究的大型數(shù)據(jù)庫(kù),關(guān)鍵詞從WordNet中選取。完整的ImageNet數(shù)據(jù)集有1400多萬(wàn)幅圖片,涵蓋2萬(wàn)多個(gè)類(lèi)別的標(biāo)注與超過(guò)百萬(wàn)的邊界框標(biāo)注,每一個(gè)類(lèi)別大約有500~1000張圖片,標(biāo)注采用了亞馬遜的眾包平臺(tái),這個(gè)平臺(tái)之后被用于構(gòu)建各種數(shù)據(jù)集。
2009年CVPR會(huì)議室李飛飛實(shí)驗(yàn)室正式發(fā)布了ImageNet數(shù)據(jù)集,此后從2010年到2017年共舉辦了8屆Large Scale Visual Recognition Challenge,即業(yè)界熟知的ILSVRC比賽,包括圖像分類(lèi)、目標(biāo)檢測(cè)和目標(biāo)定位單元。
在最開(kāi)始的時(shí)候,ImageNet是一個(gè)連經(jīng)費(fèi)都申請(qǐng)不到的整理數(shù)據(jù)的項(xiàng)目,為很多專(zhuān)注于算法研究的學(xué)術(shù)人員“不恥”,但科技公司的競(jìng)賽熱情及數(shù)據(jù)集史無(wú)前例的多樣性,讓陷身于過(guò)擬合的算法從數(shù)據(jù)集本身看到了新的出路,之后極大地推進(jìn)了計(jì)算機(jī)視覺(jué)任務(wù)的發(fā)展。
由于類(lèi)別多,ImageNet不可能像MNIST數(shù)據(jù)集整理過(guò)程中那樣簡(jiǎn)單地將所有圖片分成互不相干的10類(lèi),而是采用了WordNet中樹(shù)形結(jié)構(gòu)的組織方式。比如從哺乳動(dòng)物關(guān)鍵詞開(kāi)始整理,然后不斷細(xì)分為有胎盤(pán)的哺乳動(dòng)物→肉食動(dòng)物→犬科動(dòng)物→狗→工作中的狗→哈士奇。
ImageNet競(jìng)賽使用的是ImageNet完整數(shù)據(jù)集的一個(gè)子類(lèi),包括1000類(lèi),其中大部分是動(dòng)物。在深度學(xué)習(xí)任務(wù)中,我們經(jīng)常會(huì)使用ImageNet預(yù)訓(xùn)練的模型,不過(guò)大部分人未必了解ImageNet數(shù)據(jù)集的構(gòu)建過(guò)程和歷史,有興趣的讀者可以去查閱詳細(xì)了解。
圖像識(shí)別 圖像識(shí)別服務(wù) Image 圖像識(shí)別服務(wù)
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。