學習OpenCV 3(中文版)》 —什么是計算機視覺

      網友投稿 665 2025-03-31

      什么是計算機視覺


      計算機視覺注1這種技術可以將靜止圖像或視頻數據轉換為一種決策或新的表示。所有這樣的轉換都是為了完成某種特定的目的而進行的。輸入數據可能包含一些場景信息,例如“相機是搭載在一輛車上的”或者“雷達發現了一米之外有一個目標”。一個新的表示,意思是將彩***像轉換為黑白圖像,或者從一個圖像序列中消除相機運動所產生的影響。

      因為我們是被賦予了視覺的生物,所以很容易誤認為“計算機視覺也是一種很簡單的任務”。計算機視覺究竟有多困難呢?請說說你是如何從一張圖像中觀察到一輛車的。你最開始的直覺可能具有很強的誤導性。人類的大腦將視覺信號劃分為許多通道,好讓不同的信息流輸入大腦。大腦已經被證明有一套注意力系統,在基于任務的方式上,通過圖像的重要部分檢驗其他區域的估計。在視覺信息流中存在巨量的信息反饋,并且到現在我們對此過程也知之甚少。肌肉控制的感知器和其他所有感官都存在著廣泛的相互聯系,這讓大腦能夠利用人在世界上多年生活經驗所產生的交叉聯想,大腦中的反饋循環將反饋傳遞到每一個處理過程,包括人體的感知器官(眼睛),通過虹膜從物理上控制光線的量來調節視網膜對物體表面的感知。

      《學習OpenCV 3(中文版)》 —什么是計算機視覺

      然而在機器視覺系統中,計算機會從相機或者硬盤接收柵格狀排列的數字,也就是說,最關鍵的是,機器視覺系統不存在一個預先建立的模式識別機制。沒有自動控制焦距和光圈,也不能將多年的經驗聯系在一起。大部分的視覺系統都還處于一個非常樸素原始的階段。圖1-1展示了一輛汽車。在這張圖片中,我們看到后視鏡位于駕駛室旁邊。但是對于計算機而言,看到的只是按照柵格狀排列的數字。所有在柵格中給出的數字還有大量的噪聲,所以每個數字只能給我們提供少量的信息,但是這個數字柵格就是計算機所能夠“看見”的全部了。我們的任務變成將這個帶有噪聲的數字柵格轉換為感知結果“后視鏡”。圖1-2給出了為什么計算機視覺如此困難的另一些解釋。

      編注1: 2005年,這輛自動駕駛汽車成功越野行駛了212公里,在無人駕駛機器人挑戰賽中第一個到達終點。

      2005 DARPA挑戰賽斯坦福車隊成員:Stanley奪冠背后那些不為人知的細節”。

      注1: 計算機視覺是一個廣闊的領域。本書將幫助讀者對該領域建立一個最基礎的認識。同時我們也推薦Trucco[Trucco98]以獲得更全面的介紹、Faugeras[Faugeras93]作為綜合參考以及

      Hartley[Hartley06]和Faugeras[Faugeras93]關于三維視覺的專著。

      圖1-1. 對于計算機來說,汽車的后視鏡就是一組柵格狀排列的數字

      圖1-2. 視覺的不適定譯注1問題,物體的二維表示可能隨著視點的不同完全改變

      譯注1: 一個數學物理定解問題的解如果存在,唯一并且穩定的,則說明該問題是適定的(wellposed);如果不滿足,則說明該問題是不適定的(ill-posed)。

      4?? 實際上,這一問題,正如我們之前所提出的,用“困難”已經不足以形容它了,它在很多情況下根本不可能解決。給定一個對于3D世界的二維(2D)觀測,就不存在一個唯一的方式來重建三維信號。即使數據是完美的,相同的二維圖像也可能表示一個無限的 3D場景組合中的任一種情況。而且,前面也提到過,數據會被噪聲和畸變所污染。這樣的污染源于現實生活中的很多方面(天氣、光線、折射率和運動),還有傳感器中的電路噪聲以及其他的一些電路系統影響,還有在采集之后對于圖像壓縮產生的影響。在這一系列的影響之下,我們又該如何推動事情的進展呢?

      在經典的系統設計中,額外場景信息可以幫助我們從傳感器的層面改善獲取信息的質量。考慮這樣一個例子,一個移動機器人需要在一棟建筑中找到并且拿起一個訂書機。機器人就可能用到這樣的事實:桌子通常放在辦公室里,而訂書機通常收納在桌子里。這也同樣給出了一個關于尺寸的推斷:訂書機的大小一定可以被桌子所收納。更進一步,這還可以幫助減少在訂書機不可能出現的地方錯誤識別訂書機的概率(比如天花板或者窗口)。機器人可以安全忽略掉200英尺高的訂書機形狀的飛艇,因為飛艇沒有滿足被放置在木制桌面上的先驗信息。相對的,在諸如圖像檢索等任務中,數據集中所有的訂書機圖像都是來自真實的訂書機,這樣不合常理的尺寸以及一些奇形怪狀的造型都會在我們進行圖片采集的時候隱式消除——因為攝影師只會去拍攝普通的正常尺寸的訂書機。人們同樣傾向于在拍攝的時候將拍攝目標放在圖片的中間,并且傾向于在最能夠展現目標特征的角度拍攝。因此,通常也有很多無意的附加信息在人們拍攝照片的時候無意加進去。

      場景信息同樣可以(尤其是通過機器學習技術)進行建模。隱式的變量(比如尺寸、重力的方向等不容易被直接觀測到的)可以從帶標記的數據集中發現關系并推測出來。或者,可以嘗試使用附加的傳感器測量隱式變量的值,比如利用激光雷達來測量深度,從而準確得到目標的尺寸。

      計算機視覺所面臨的下一個問題是噪聲,我們一般使用統計的方法來對抗噪聲。比如,我們很難通過單獨的像素點和它的相鄰像素點判斷其是否是一個邊緣點,但如果觀察它在一個區域的統計規律,邊緣檢測就會變得更加簡單了。一個真正的邊緣應該表現為一個區域內一連串獨立的點,所有點的朝向都與其最接近的點保持一致。我們也可以通過時間上的累計統計對噪聲進行抑制,當然也有通過現有數據建立噪聲模型來消除噪聲的方法。例如,因為透鏡畸變很容易建模,我們只需要學習一個簡單的多項式模型來描述畸變就可以幾乎完美矯正失真圖像。

      基于攝像機的數據,計算機視覺準備做出的動作或決定是在特定的目的或者任務的場景環境中執行的。我們也許想要移除噪聲或者修復被損壞的照片,這樣安全系統就可以對試圖爬上欄桿等危險行為發出警報,或者對于穿過某個游樂場區域的人數進行統計。而

      5 在大樓中***的機器人的視覺軟件將會采取和安全系統完全不同的策略,因為兩種策略處于不同的語境中。一般來說,視覺系統所處的環境約束越嚴格,我們就越能夠依賴這些約束來簡化問題,我們最終的解決方案也越可靠。

      OpenCV的目標是為計算機視覺需要解決的問題提供工具。在某些情況下,函數庫中的高級功能可以有效解決計算機視覺中的問題。即使遇到不能夠一次性解決的問題,函數庫中的基礎組件也具有足夠的完備性來增強解決方案的性能,以應對任意的計算機視覺難題。在后一種情況下,也存在一些使用庫的可靠方法,所有的這些方法都是從盡量多使用不同的組件庫開始。通常,在開發了第一個粗糙的解決方案之后,就可以發現解決方案存在哪些缺陷并且使用自己的代碼與聰明才智修復那些缺陷(更為熟知的說法是 “解決真正存在的問題,而不是你想象中的那些問題”)。在此之后可以使用粗糙的解決方案作為一個評判標準,評價改善水平。從這一點出發,你可以解決任意問題。

      機器視覺 OpenCV

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:高級篩選(高級篩選怎么設置兩個條件)
      下一篇:txt數據怎么導入Excel表格進行數據分析?
      相關文章
      亚洲综合久久一本伊伊区| 中文亚洲成a人片在线观看| 国产福利电影一区二区三区,亚洲国模精品一区 | 亚洲一本一道一区二区三区| 亚洲大香伊人蕉在人依线| 亚洲精品熟女国产| 亚洲第一成年网站大全亚洲| 亚洲视频在线观看不卡| 亚洲美女精品视频| 亚洲天堂一区二区三区四区| 亚洲人成电影在线观看网| 亚洲一本之道高清乱码| 亚洲午夜精品一区二区公牛电影院| 亚洲精品国产专区91在线| 911精品国产亚洲日本美国韩国| 久久精品国产亚洲AV香蕉| 久久精品亚洲精品国产色婷| 亚洲性色高清完整版在线观看| 亚洲噜噜噜噜噜影院在线播放| 亚洲中文无码a∨在线观看| 国产成人精品亚洲日本在线| 亚洲精品综合在线影院| 亚洲另类无码一区二区三区| 噜噜综合亚洲AV中文无码| 亚洲国产精品日韩专区AV| 精品亚洲视频在线观看| 国产精品久久久亚洲| 亚洲精选在线观看| 亚洲国产精品午夜电影| 日本亚洲色大成网站www久久| 亚洲国产精品ⅴa在线观看| 国产大陆亚洲精品国产| 中文字幕亚洲一区二区va在线| 亚洲中文字幕在线观看| 亚洲av无码成h人动漫无遮挡| 久久精品国产亚洲av日韩| 亚洲av乱码一区二区三区| 亚洲av日韩av永久在线观看| 亚洲午夜无码AV毛片久久| 亚洲成av人在线视| 亚洲国产美女在线观看|