《計算機視覺算法:基于OpenCV的計算機應用開發(fā)》 —1.2 理解計算機視覺
1.2 理解計算機視覺
給計算機視覺下定義不是件簡單的事情,而且計算機視覺專家在這件事情上也難以達成共識。因此,定義計算機視覺不在本書的范圍和興趣之內,我們只會給出一個簡單實用且恰當?shù)亩x。歷史上,計算機視覺是圖像處理的同義詞,特指一類以一張圖像作為輸入,在一系列操作之后,生成另一張圖像或者一組輸出值(或測量值)的方法和技術。而如今你會發(fā)現(xiàn),計算機視覺工程師在談論這個概念時,他們多半指的是能夠模擬人類視覺的算法,比如看到(檢測)圖像中的一個物體或者人。
那么,本書要使用哪一個概念呢?答案是兩者兼有。簡而言之,計算機視覺是處理數(shù)字可視數(shù)據(jù)(或任何可視化數(shù)據(jù))的算法、方法和技術。這里可視數(shù)據(jù)不一定是從傳統(tǒng)攝像頭獲取的圖像,它們可能是地圖的圖示或者海拔、熱強度圖,或者任何可視化的數(shù)據(jù),而不管它們在現(xiàn)實世界中具體是什么含義。
根據(jù)這個定義,如下問題(以及更多其他問題)都可以用計算機視覺來解決:
如何柔化或者銳化一幅圖像?
如何減小一幅圖像的大小?
如何增加或者降低一幅圖像的亮度?
如何檢測一幅圖像最亮的區(qū)域?
如何檢測并追蹤視頻(或者連續(xù)圖像)中的人臉?
如何識別監(jiān)控視頻中的人臉?
如何檢測視頻中的運動?
在現(xiàn)代計算機視覺領域,圖像處理通常是計算機視覺算法的一部分,用來進行圖像濾波、變換等。不過,很多人會互換使用“計算機視覺”和“圖像處理”這兩個詞。
現(xiàn)在,計算機視覺是計算機科學和軟件行業(yè)最火的主題之一。因為計算機視覺被應用在很多領域,在應用軟件、數(shù)字設備或者工業(yè)機器上,它用計算機算法實現(xiàn)了原來依賴人眼才能完成的工作。在很多行業(yè)都有實際的例子,比如汽車、電影、生物醫(yī)學儀器、安防、照片編輯、共享工具及視頻游戲。我們會討論其中的一部分例子,剩余的留給讀者自行研究。
在汽車行業(yè),計算機視覺被用來提高安全性和便捷性。計算機視覺使得汽車能夠檢測交通信號、提醒駕駛員不要超速甚至檢測道路上的車道和障礙物來對可能的危險進行預警。我們無法窮盡計算機視覺顛覆汽車行業(yè)的所有可能,更不要說無人駕駛了。主要的科技公司都對此投入了巨量的資源,甚至把它們取得的成果共享給開源社區(qū)。在本書的最后一章,我們會使用這些成果展示如何實時檢測多種類型的多個目標。
下圖描述了汽車行業(yè)關心的一些物體、交通標志和其他感興趣的區(qū)域,這些都是掛載在車上的攝像頭常拍到的圖像:
另一個面臨技術革命的例子是生物醫(yī)學行業(yè)。不只是器官和人體成像方法有了很大的提高,這些圖像的理解和可視化也因為計算機視覺算法的進步而顯著增強了。用極高精度的顯微鏡獲取器官的圖像,然后利用計算機可以檢測器官是否癌變。機器人行業(yè)也涌現(xiàn)出許多有前景的方向,例如用機器人做手術。
下圖中,計算機視覺算法可以在數(shù)字顯微鏡掃描出來的圖像中統(tǒng)計生物組織的不同區(qū)域分別有多少感興趣的特定生物目標(此例為細胞):
除了汽車和生物醫(yī)學之外,計算機視覺也被廣泛用在移動和桌面應用程序中來解決各種各樣的問題。瀏覽手機上的應用程序商店看一下與計算機視覺相關的應用,你會發(fā)現(xiàn),只有你想不到的,沒有未來計算機視覺做不到的。
OpenCV
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。