據外媒報道,蘋果正在努力提高計算機視覺的技術能力,以便其能夠更加準確地檢測和識別對象,比如在相機和被拍攝對象都在運動的情況下。這種通過熱成像來輔助確定元素追蹤的方法,似乎很有科幻感。但近日曝光的一項新專利,暗示了我們有望在不遠的將來用上它。
周四的時候,美國專利商標局(USPTO)公布了一份題為《與一部分真實環境相關的、能夠至少確定一個屬性的方法和系統》。這類應用與計算機視覺有很大的關聯,即借助攝像頭來分析場景,并從其看到的景象中獲取有用的數據。
文檔中提到了當前計算機視覺分析技術、在應對動態環境時的一個問題,因為許多算法都是特別針對靜態環境而構建的。但實際上,在使用智能機進行拍攝的時候,器材和被拍攝者經常都處于運動狀態,想要明確追蹤其中一個對象,似乎有些強人所難。
若場景中有多個移動物體,則相機姿態追蹤的準確性會降低,甚至會故意忽略場景中在運動的物體。此外由于視線的遮擋,可能會遇到運動物體的識別問題。雖然 2D 相機視圖可以轉換為 3D 空間中的點位,但該空間中的運用對象,也可能導致相機的 3D 定位問題。
這份專利給出的答案之一,就是使用兩套不同類型的攝像頭系統,其中包括一個熱成像主攝、以及一個普通的攝像頭。兩者都可以有效地提供相同的視點,但熱成像相機可以像算法提供熱圖數據,輔以副攝像頭提供的成像數據。
該算法能夠分析熱圖像,并與成像數據相結合,以確定場景中的哪些項目與其它分離,增加熱量、以及通常用于分析的顏色 / 對比度等其它屬性。
例如,當有人穿著綠色的制服在場地中踢足球時,熱圖像會聚焦于球員身體產生的熱量。算法可借此確定熱圖中的對象,然后用普通的副攝像頭來挑選出正常圖像中的球員。
此外,該技術還可用于確定被遮擋的平面拍攝圖像。類似系統可借助熱成像來覆蓋 2D 圖像的其中一部分,并提供一些可用于改變呈現的數據,比如被手遮擋的元件。
以建筑物分析為例,這樣的系統可用于識別附近的行人。當來自相同視圖的其它圖像放在一起時,行人可以從最終構圖中被自動移除。(聽起來是不是有點耳熟?)
雖然該專利申請著重于描述消費級成像、視頻編輯、以及增強現實,但它也能在自動駕駛汽車領域發揮更大的作用,比如傳聞中的蘋果 Project Titan 自動駕駛研究項目。
9 月初的時候,蘋果描述了一款專利的前照燈,其能夠突出現實道路的某部分區域,以便向駕駛員發出警示。不過這樣的系統,也可戰略性地點亮部分道路,以幫助自動駕駛汽車的視覺系統更好地“看清”前方路面。
[編譯自:Apple Insider]