隨著經(jīng)濟快速發(fā)展,城市化進程不斷推進,各種社會矛盾和暴力事件逐漸增多,面臨的突發(fā)事件和異常事件越來越復(fù)雜,監(jiān)控的難度和重要性也越來越突出。從監(jiān)控技術(shù)的發(fā)展來看,大致可分為三個階段:人力現(xiàn)場監(jiān)控、人力視頻監(jiān)控和智能視覺監(jiān)控。所謂人力現(xiàn)場監(jiān)控,即安排專人在現(xiàn)場對場景監(jiān)控,人力現(xiàn)場監(jiān)控的應(yīng)用可以追溯到原始社會,一直延續(xù)至今。所謂人力視頻監(jiān)控,即用攝像機對場景拍攝,視頻信號被采集到中央控制部門并被顯示到監(jiān)視器上,由人對視頻圖像進行分析,得出恰當(dāng)?shù)呐袛?。視頻監(jiān)控又分為兩種,一種是早期采用的模擬視頻監(jiān)控,一種是現(xiàn)在廣泛采用的數(shù)字視頻監(jiān)控,這種監(jiān)控技術(shù)引入了大量的計算機技術(shù),來協(xié)助人采集和管理所有視頻信息,監(jiān)控系統(tǒng)的性能得到了有效的提高。當(dāng)有事件發(fā)生后,采用調(diào)取查閱的方式,這種方式在一定程度上滿足了社會的需求,但是無法避免事態(tài)趨于惡化。
何種技術(shù)可以有效的解決傳統(tǒng)監(jiān)控行業(yè)帶來的困惑,是安防行業(yè)亟需考慮和深入研究的課題。
一、智能視覺分析技術(shù)
隨著科技的發(fā)展,計算機技術(shù)的不斷提升,智能視覺技術(shù)應(yīng)運而生,可以有效的解決傳統(tǒng)視頻監(jiān)控行業(yè)的問題,為安防行業(yè)提供了更為廣闊的應(yīng)用方向。它和以往的監(jiān)控技術(shù)有本質(zhì)的區(qū)別,其主要特征是采用計算機視覺的方法,在幾乎不需要人為干預(yù)的情況下,通過對攝像機拍錄的圖像序列進行自動分析,對動態(tài)場景中的目標(biāo)進行定位、識別和跟蹤,并在此基礎(chǔ)上分析和判斷目標(biāo)的行為,從而做到既能完成日常管理又能在異常情況發(fā)生的時候及時做出反應(yīng)。更形象地說,智能視覺監(jiān)控系統(tǒng)能夠看,看監(jiān)控場景中目標(biāo)物體的行為;能夠想,想目標(biāo)物體的行為意味著什么;能夠說,把想的結(jié)果用自然語言的形式表達出來。因此智能視覺監(jiān)控系統(tǒng)取代人完成了監(jiān)控任務(wù)中的大部分工作,是新一代的具有高度智能的監(jiān)控技術(shù)應(yīng)用。
智能視覺分析技術(shù)是指計算機圖像視覺分析技術(shù),計算機圖像視覺技術(shù)是人工智能(AI,Artificial Intelligent)研究的分支之一,它能夠在圖像及圖像描述之間建立映射關(guān)系,從而使計算機能夠通過數(shù)字圖像處理和分析來理解視頻畫面中的內(nèi)容。而視頻監(jiān)控中所提到的智能視頻技術(shù)主要指的是“自動分析和抽取視頻源中的關(guān)鍵信息”。 如果把攝像機看作人的眼睛,智能視頻系統(tǒng)或設(shè)備則可以看作人的大腦。智能視頻技術(shù)借助計算機強大的數(shù)據(jù)處理功能,通過將場景中背景和目標(biāo)分離,進而分析并追蹤在攝像機場景內(nèi)出現(xiàn)的目標(biāo),對視頻畫面中的海量數(shù)據(jù)進行高速分析,過濾用戶不關(guān)心的信息,僅僅為監(jiān)控者提供有用的關(guān)鍵信息。智能視頻解決方案以數(shù)字化、網(wǎng)絡(luò)化視頻監(jiān)控為基礎(chǔ),用戶可以根據(jù)視頻內(nèi)容分析功能,通過在不同攝像機的場景中預(yù)設(shè)不同的報警規(guī)則,系統(tǒng)識別不同的物體,同時識別目標(biāo)行為是否符合這些規(guī)則,一旦目標(biāo)在場景中出現(xiàn)了違反預(yù)定義規(guī)則的行為,系統(tǒng)能夠以快和佳的方式發(fā)出警報并提供有用信息,從而能夠更加有效的協(xié)助安全人員處理危機,大限度的降低誤報和漏報現(xiàn)象,切實提高監(jiān)控區(qū)域的安全防范能力。
二、智能視覺分析技術(shù)的應(yīng)用
智能視覺分析技術(shù)在安防領(lǐng)域的重要作用是毋庸置疑的,具有廣泛的應(yīng)用前景,可以應(yīng)用在公安、司法、交通、教育、金融等主流行業(yè)應(yīng)用,比如十字路口、高速公路、停車場、飛機場等交通場景;比如軍事基地、銀行等軍事場景監(jiān)控、國家重要部門以及人們?nèi)粘I畹膱鏊?比如天安門廣場、火車站等敏感的公共場合監(jiān)控,相關(guān)智能視覺分析產(chǎn)品也隨著技術(shù)的發(fā)展不斷地細化,比如人臉識別比對系統(tǒng),公安機關(guān)搭建人臉識別比對系統(tǒng),建立人臉捕捉數(shù)據(jù)庫,將人臉信息歸檔,并與個人身份建立關(guān)系,在實際運用過程中采用人臉?biāo)阉?、黑名單布防、陌生人識別等多項智能分析功能,大大提高視頻監(jiān)控的防范功效,可以讓犯罪分子無可遁形。由于和智能視覺分析相關(guān)的高清產(chǎn)品并未得到真正的普及,社會上的監(jiān)控布局點也并不完善,目前還只是針對某些行業(yè)進行使用,還遠遠未達到全面普及,只有大批量的使用高清攝像機,增大捕獲到清晰、正面人臉的可能性,才能有更好的實戰(zhàn)效果。此外,還需要公安和企業(yè)加強合作,加大監(jiān)控點的部署密度。由于大量監(jiān)控點的部署會帶來海量視頻,需要重視智能視頻分析技術(shù)的應(yīng)用,合理利用技術(shù),人機配合,發(fā)揮技術(shù)的長處,從而有效輔助偵辦人員。
從目前行業(yè)應(yīng)用和產(chǎn)品發(fā)展,我們已經(jīng)能夠看出智能視覺技術(shù)顯示出了巨大的市場價值。
三、智能視覺分析技術(shù)的發(fā)展
隨著高清探頭不斷投入,人們對于智能視覺分析技術(shù)產(chǎn)品化的需求越來越多,要求也越來越高,這給安防行業(yè)帶來了廣闊的思路,許多智能化新產(chǎn)品快速涌現(xiàn):
1、 雙目技術(shù)
雙目立體技術(shù)核心目的是提高識別的準(zhǔn)確率。由于立體視覺技術(shù)形成的視場中帶有物體的三維幾何信息,因此能夠有效的設(shè)定檢測規(guī)則,排除光線、影子等干擾因素,大幅提高智能分析的準(zhǔn)確度。如果說高清技術(shù)通過提升可用像素來提高分析的準(zhǔn)確率,是戰(zhàn)術(shù)性的舉措,那么雙目立體視覺技術(shù)對視頻分析準(zhǔn)確率的影響則是戰(zhàn)略性的。雙目立體視覺技術(shù)是基于視差原理,并利用成像設(shè)備從不同的位置獲取被測物體的兩幅圖像,通過計算圖像對應(yīng)點間的位置偏差,來獲取物體三維幾何信息的方法。 采用雙相機或多相機,對視場內(nèi)空間的自由運動體的三維位置坐標(biāo)及姿態(tài)進行高精度的測量,確定運動目標(biāo)的質(zhì)心位置,并根據(jù)標(biāo)定結(jié)果對運動目標(biāo)進行高精度跟蹤。
立體視覺技術(shù)的跟蹤,由于能夠辨識目標(biāo)的三維坐標(biāo)、姿態(tài)、相對距離、與背景環(huán)境的空間距離,因此能適應(yīng)復(fù)雜的跟蹤背景環(huán)境。雙目技術(shù)應(yīng)用于人體屬性識別是人臉識別技術(shù)一次技術(shù)應(yīng)用的跨步,這對更準(zhǔn)確的定位和分析人的特征有著支援重要的作用。
2、 多球機聯(lián)動跟蹤技術(shù)
多球機聯(lián)動跟蹤技術(shù)是以單球機智能跟蹤技術(shù)作為基礎(chǔ)的。從應(yīng)用的層面上看,能夠?qū)⑵胀ǖ母櫱驒C的單點式監(jiān)控,提升為系統(tǒng)內(nèi)對單個目標(biāo)的無縫式接力跟蹤,配合電子地圖的使用,能夠容易的實現(xiàn)對高安全等級區(qū)域的無縫式跟蹤,并實現(xiàn)目標(biāo)軌跡描繪、犯罪行為預(yù)警等高等級的安保需求。多球機聯(lián)動跟蹤技術(shù)的實現(xiàn),需要具備多目標(biāo)識別與跟蹤技術(shù)。在應(yīng)用中,通常設(shè)定一臺球機作為發(fā)起點,對廣域范圍內(nèi)目標(biāo)進行的智能行為分析,并將同時監(jiān)控的多個目標(biāo)按照既定的策略進行排序,并按照先后順序,指揮智能跟蹤球機逐個跟蹤監(jiān)控目標(biāo)。與單目標(biāo)跟蹤相比,多目標(biāo)跟蹤技術(shù)的關(guān)鍵點是數(shù)據(jù)關(guān)聯(lián)問題,即建立一個統(tǒng)一的坐標(biāo)系,使得發(fā)起球機可以將目標(biāo)的坐標(biāo)信息傳遞給跟蹤球機,實現(xiàn)聯(lián)動跟蹤。
3、 面向事后應(yīng)用的智能技術(shù)
隨著監(jiān)控探頭的普及,監(jiān)控系統(tǒng)中存有海量的錄像數(shù)據(jù),在目前人工查看的模式下,傳統(tǒng)的方法需要從頭到尾順序播放,往往需要數(shù)倍于原始視頻的時間才能審看完成,因此需要大量人員連續(xù)加班數(shù)周進行視頻的審看。為了規(guī)避遺漏和誤差,就要加大人力投入的方法。但是經(jīng)過實踐證明,這種方法吃力不討好,仍然解決不了根本的問題,如何有效、高效的應(yīng)用,減輕人工查看回放帶來的時效性差、成本高、疲勞問題,并在不同分辨率、不同清晰度的錄像中準(zhǔn)確的辨別出需要獲取的信息,基于以上需求,安防廠家研發(fā)了視頻摘要、視頻檢索等技術(shù)手段。
視頻摘要技術(shù)
將視頻摘要形成視頻片斷,不同時刻的目標(biāo)“穿越時空”同時展現(xiàn)播放,使24小時的視頻被制作成一個簡短到幾分鐘摘要視頻成為現(xiàn)實。視頻摘要不僅濃縮的是事件的精華,也是活動事件的全部,沒有價值的視頻將被剔除。通過多分格快照技術(shù),可以在幾秒中看完所有的活動目標(biāo)成為可能,回溯原始視頻功能,瞬間鎖定目標(biāo)在原始視頻中的位置。這些智能視頻分析功能的實現(xiàn)和應(yīng)用將大大提高海量視頻監(jiān)控錄像分析的效率。
視頻檢索技術(shù)
視頻檢索主要是依賴于視頻算法對視頻進行預(yù)處理,通過對視頻內(nèi)容進行結(jié)構(gòu)化處理,提取出視頻內(nèi)容中的有效信息,進行標(biāo)記或者相關(guān)處理后,人后可以通過各種屬性描述進行快速檢索。因此視頻檢索主要的是利用視頻檢測算法對視頻進行結(jié)構(gòu)化描述,目前已經(jīng)在相應(yīng)的產(chǎn)品中得到應(yīng)用的算法主要有以下幾種:行為分析算法、車牌識別算法、車輛顏色識別算法、車標(biāo)識別算法、車型識別算法、人臉檢測識別算法、人體特征識別算法等。其中人體特征識別又包括人的年齡、性別、身高、衣服顏色、是否戴眼鏡等特征信息的識別。在視頻檢索中已經(jīng)得到比較成熟應(yīng)用的算法技術(shù)是行為分析算法、車牌識別算法、車輛顏色識別算法、人臉檢測識別算法等。
由于監(jiān)控探頭的布置也會有盲點等原因,當(dāng)雙目技術(shù)和多球機跟蹤技術(shù)無法每時每刻準(zhǔn)確的撲捉到嫌疑人的軌跡信息的時候,可以通過校園內(nèi)遍布的探頭錄像進行事后檢索分析,找到相關(guān)線索,幫助刑偵人員及時快速的定位嫌疑人。
4、 視頻拼接技術(shù)
視頻拼接系統(tǒng)是基于圖像拼接技術(shù)得以實現(xiàn)的,而圖像拼接技術(shù)是根據(jù)實際的科研和工程的需要而發(fā)展來的。在很多領(lǐng)域經(jīng)常會用到超過人眼視角的高分辨率圖像,而普通相機或攝像機的視角往往不能滿足需要,例如由于距離的限制,某些超大尺寸的物體無法清晰的用視頻拍攝下來。目前來說,許多大型應(yīng)用場景都需要高清晰高覆蓋的拍攝,比如機場跑道、碼頭等,一個攝像機無法真正清晰的展示這些大型應(yīng)用場景的全貌,無法給出一種用戶滿意的高清視頻,更無法對視頻中的事物進行高清分析,由此而帶來的就是高投入和多畫面展示,不僅僅視覺效果不好,也不能滿足用戶的高清大畫面的需求?;谝陨闲枨螅瑘D像拼接技術(shù)解決了這一難題,該技術(shù)將來自不同視角的圖像拼接在一起得到高分辨率圖像,解決了用戶大場景高清晰監(jiān)控的迫切需求,用戶可以在一幅視頻圖像上瀏覽高清晰畫面。
目前智能視覺分析技術(shù)已經(jīng)趨于成熟,這和安防企業(yè)的努力是分不開的,他們是智能視覺分析技術(shù)的先行者,比如杭州??低晹?shù)字技術(shù)股份有限公司等,這些企業(yè)的智能視覺分析技術(shù)發(fā)展或許可以成為榜樣,帶動業(yè)內(nèi)企業(yè)的研發(fā)腳步,真正為智能視覺分析技術(shù)的應(yīng)用帶來革命性的變化。
四、結(jié)束語
雖然智能視覺分析技術(shù)其自身發(fā)展也存在諸多缺陷,但是智能視覺分析技術(shù)已經(jīng)逐漸成為安防行業(yè)發(fā)展的大方向,眾人拾柴火焰高,在國內(nèi)外眾多科研機構(gòu)、院校、大型安防企業(yè)對智能視覺分析技術(shù)不斷的研究和創(chuàng)新,智能視覺分析的運用會逐漸大眾化,將來會更廣泛的應(yīng)用于金融、交通等各個領(lǐng)域中,普及到人們的日常生活當(dāng)中,發(fā)揮安全防范的預(yù)見作用,將危險因素扼殺在搖籃里,給人們的工作和生活帶來安全保障。