空間關係分類以及相似性量測之範用結構

內容簡介

以往之影像資料庫檢索,多以文字進行搜尋,這種方式不但耗費大量人力對每張影像進行註解,更出現文不對圖之情況。近年來提出以影像內容進行搜尋,擷取出影像中之特徵,如物體大小、形狀、顏色、紋理以及物件間之空間關係等資訊作為搜尋依據。然而單一影像特徵並不明確,無法確實地表現出使用者最有興趣之特徵,而使得檢索結果不理想。

本論文以Multiple-Instance Learning為基礎,著重於影像資訊在空間關係之比對研究及分類之合理性,用以判別空間關係分類是否正確,於分類後更提出影像相似性量測之模組,以計算影像在空間關係上之相似性。關於空間關係分類方面,首先根據空間關係定義和已符合正定性、交換性及三角不等式之距離定義,決定各個空間關係彼此間之距離,進而得知空間關係相鄰圖;接著,合併意味著其他各點到該群組距離相同,在此合併定義及合併後仍符合三角不等式之前提下,推導出合併限制,如此就可依據合併限制將各個空間關係進行合理之合併,以達到正確分類效果。然而人類視覺對於空間關係之著眼點並非單純地只會在共有空間關係上,而是會根據所給之空間關係衍伸出特定範圍,且被定義為相鄰圖上空間關係間之最短路徑,依此做法,即使不存在共有空間關係,也能對空間關係分類,找出理想特徵範圍。如此則可根據正、負相關影像分別地找出空間關係路徑之聯集,而在正相關集合減去負相關集合後,所得結果為多張影像對於空間關係之分類,亦即為使用者有興趣之空間關係範圍。

而在正確分類和合併後,除了考量空間關係彼此間之相似性和物件差異之外,更加入正相關和負相關分類對影像相似性之影響,並使得在任何情況下,加入正相關元素對相似性提升之幅度會大於其他元素,在此考量下,計算出各個空間關係間之相似性值,並以此值作為檢索標準,以求影像搜尋之正確性及多樣性。

系統流程圖

 

更多資料

投影片 (3.26MB)