影像註解之資訊探勘方法

內容簡介

  傳統的content-based image retrieval system,有些是利用顏色、形狀、紋理來做搜尋影像內容的依據,但對於一般的使用者來說,利用這些低階的特徵來做搜尋是有困難的,而且大部分的使用者比較偏好利用文字來做搜尋。例如,Google的image search 雖然它的名字叫做image search ,但事實上卻是一種標記的搜尋,是靠影像的註記來做搜尋,而不是以影像的內容做為搜尋的依據。隨著對影像註記的需求愈來愈殷切,MEPG 7訂定Multimedia Description Schemes (DSs)影音註解的標準,可是目前影像的註解,大部分還是要依靠人力,非常的耗時,如何對於影像下適當而且自動的註解是非常重要的。所以我們提出一個方法可以對影像做自動的註記,我們的方法是擷取出每一張影像的fractal features,再利用Diverse Denisty Algorithm做為訓練分類的方法,讓使用者和系統可以做即時性的互動式學習,最後可以利用已經訓練好的models對影像做自動註解

  本論文提出一方法,使用碎形正交基底技術擷取影像特徵,建立索引檔,其所紀錄之資訊遠比顏色、形狀、內容更多,期許使用此技術在影像註解之系統中,訓練(training)及比對相似性階段,可以提昇效果。利用DiverseDensity的技術找出可以代表Input Image的Concepts加入對應的註解形成一個Model,假如一張新輸入的影像和訓練好的Model的Concepts相似則加入對應的註解。假如我們認為電腦註解的有錯誤,可以選擇對Input Image重新訓練一個Model,或對於判斷錯誤的Model重新訓練。

系統流程圖

 
更多資料 投影片 (5493KB)