很多廠商都說要在 2020 年推出自動(dòng)駕駛汽車,,無論這些車的自動(dòng)駕駛程度如何,都要依靠“計(jì)算機(jī)視覺”技術(shù)來實(shí)現(xiàn),。 計(jì)算機(jī)視覺 (Computer Vision,,CV),這是一門研究如何使機(jī)器” 看” 的科學(xué),,更進(jìn)一步說就是用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別,、跟蹤和判別決策等機(jī)器視覺,并進(jìn)一步做圖形處理,,使電腦處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像,。 作為一個(gè)科學(xué)學(xué)科,,計(jì)算機(jī)視覺研究與其相關(guān)的理論和技術(shù),試圖建立能從圖像或者多維數(shù)據(jù)中獲取「信息」的人工智能系統(tǒng),。比爾·蓋茨說過:IT 界的下一次大事將是計(jì)算機(jī)視覺與深度學(xué)習(xí)的結(jié)合,。 怎么才能讓機(jī)器或智能汽車變得像人類一樣聰明? 首先要讓它感受到這個(gè)世界,,然后再對(duì)感受到的信息處理反饋,。從任天堂的 Wii 到微軟的 Kinect,再到谷歌的 Project Tango,,都是如此,。 2014 年 2 月,谷歌已經(jīng)成功為該項(xiàng)目研發(fā)出了一款 Android 手機(jī)原型機(jī),,配備了一系列攝像頭,、傳感器和芯片,能實(shí)時(shí)為用戶周圍的環(huán)境進(jìn)行 3D 建模,。另外還有微軟的 Hololens 全息眼鏡,,從這些設(shè)備上,我們看到了計(jì)算機(jī)視覺技術(shù)的飛速發(fā)展,。 視頻和圖像之中包含了大量的數(shù)據(jù),,過去我們不知道怎么讓機(jī)器來捕捉和利用這些數(shù)據(jù)。但隨著深度學(xué)習(xí)的發(fā)展,,卷積神經(jīng)網(wǎng)絡(luò)的提出和運(yùn)用,,這些數(shù)據(jù)慢慢的能被機(jī)器解讀到了。這些進(jìn)步為以后的汽車自動(dòng)駕駛,,打下了獲得信息和處理信息的基礎(chǔ),。 目前在研究計(jì)算機(jī)視覺技術(shù)的有很多公司,比如 SenseTime(商湯),、Cogtu(知圖科技),、Deepglint(格靈深瞳)等。 商湯是做計(jì)算機(jī)學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的典型公司,,核心技術(shù)有人臉識(shí)別,、圖像識(shí)別、圖像處理,、智能監(jiān)控,。
 此外就是格靈深瞳,這家公司的聯(lián)合創(chuàng)始人趙勇,,在剛剛閉幕的 2015 杭州云棲會(huì)議上提到:目前絕大多數(shù)自動(dòng)駕駛技術(shù)非常昂貴,,一輛自動(dòng)駕駛汽車感知成本可能要上百萬人民幣,比汽車本身還貴。在他展示的視頻里,,計(jì)算機(jī)視覺技術(shù)讓每輛車都有自己的眼睛,。這套系統(tǒng)在汽車行駛的時(shí)候像人的眼睛一樣能看懂交通標(biāo)識(shí),道路信息和各種不同的路況,。 計(jì)算機(jī)視覺技術(shù)除了在汽車上使用外,,還可以在智能交通領(lǐng)域幫上忙。在路口的紅綠燈可以通過使用該技術(shù),,來判斷所在道路交通流量,,然后自動(dòng)變燈,增加路口的通行能力,。
 從論文數(shù)量和創(chuàng)業(yè)公司數(shù)量就可以看出來,,近兩年計(jì)算機(jī)視覺發(fā)展速度很快。但對(duì)于自動(dòng)駕駛來說,,目前仍面臨諸多問題,,比如對(duì)芯片的計(jì)算速度要求很高、高昂的成本等等,。計(jì)算機(jī)視覺可以讓自動(dòng)駕駛成為現(xiàn)實(shí),,但離普及的程度還有一段距離。
|