影像檢索加入空間限制判斷

內容簡介

資訊在資料庫中以往多僅限於文字,由於資訊多樣化,現今多轉變為多媒體資料,如何由數量龐大影像資料符合使用者條件,為使用者所殷切需求。在影像比對方面,多將影像特徵分成四大類:形狀、顏色、紋理,以及空間關係,本論文將著重於影像資訊在空間關係上比對研究。 利用影像為鍵值進行影像資料庫索引技術,如根據透過正交基底編碼,雖可適用特定CBIR 處理領域,但是並無法保證有效判斷相似特徵在空間上相關資訊(比例大小、位置、方向),比對結果可能會產生與使用者觀點不相符情形。為了能夠從影像資料庫中尋找出符合資訊,必須有能力推論組成影像中代表物件彼此間空間關係。必須將空間上限制被應用至影像資料庫擷取,以更明確界定搜尋、比對條件。

本論文將以碎形正交基底對影像編碼為基礎並利用Multiple-Instance Learning自動找出更為明確搜尋影像特徵條件,最後結合有效空間關係判斷,即針對原始影像中擷取相關物件(objects),利用二維字串(2d-String)空間索引方法,儲存物件投影在X軸與Y軸一維空間量值,以用來判斷影像物件所對應空間關係,利用此空間關係比對出相似影像。

由於目前搜尋影像系統中,多數均無法有效保證所擷取特徵能符合(a)高相關度影像資訊具高相關索引檔;(b)索引檔相關度高,其影像資訊相關度亦高;(c)索引檔相關度低,其影像資訊相關度亦低;(d)影像資訊相關度低,其索引檔相關度亦低,此四項基本特質。透過碎形正交基底編碼以及Multiple-Instance Learning 法則可自動地找出與正相關影像(positive images)相似且與負相關影像(negative images)不相似碎形正交基底投影向量特徵,不僅在壓縮領域中根據影像內容物進行搜尋快速有效,而且使搜尋條件更為明確。 本論文將使用以正交基底編碼以及Multiple-Instance資料擷取方法為基礎,結合影像特徵在空間關係,形成更為明確資料庫條件,以擷取出符合使用者直覺比對結果。影像資料在空間中,可以將某些特徵擷取出來,並將擷取出來特徵對應為一簡單物件,而所謂空間關係即是這些物件與物件彼此間關係。利用空間關係可以判斷物件相對於影像資訊以及兩兩物件間關係,而利用這些資訊加以結合,使影像搜尋鍵值可使用碎形正交基底投影係數、Multiple-Instance Learning及加入空間關係限制達到更好影像搜尋效果。

系統流程圖

 
更多資料 投影片 (9421KB)