圖像語義分割

曠視科技提出ExFuse——優化解決語義分割特征融合問題

Submitted by huzhenda on Sat, 09/08/2018 - 11:38

導語

計算機視覺領域有著三項最為基本的任務——分類,檢測和分割,其中分割是指從像素層面識別出一張圖像上所有物體的位置和分類,使得機器之眼對一張圖像達到精確和充分的感知,這也是后續圖像認知技術的重要一環。分割分為語義分割、實例分割和全景分割,其中語義分割最為基礎,它為圖像之中的每個像素做分類,而不涉及實例或背景的區分。

本文發現,當前語義分割方法直接融合高、低特征并不奏效,繼而提出新架構 ExFuse,轉而在低級特征引入語義信息,在高級特征嵌入空間信息,其性能超越 DeepLabv3,在 PASCAL VOC 2012 分割任務中奪得當前最優。

色狠狠亚洲爱综合网站這一底層突破將在分割技術的適用領域帶來新進展,比如自動駕駛,無人機,倉儲機器人,醫療影像,無人超市、地理信息系統等。比如,曠視科技基于這一自身原創技術,進一步提升和完善了手機影像產品線,在人體扣像、手機打光、背景虛化等具體應用中不斷提升用戶體驗,這也恰恰是曠視科技一直踐行人工智能驅動的行業物聯網構建者(AI+IoT)戰略定位的證明。

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?44d5929b98ed1fd093ffc3d47ec712b9"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); document.writeln("");