2011年6月1日 星期三

[aMMAI] Paper Summary: Fast concurrent object localization and recognition

Title: Fast concurrent object localization and recognition
Author: Tom Yeh, John J. Lee, Trevor Darrell
Publication: CVPR, 2009



這篇paper提出一個方法來對多個不同物件做 localizationrecognition

傳統ESS的方式,要找多個不同的物件,直接的想法就是每個物件都去找一次。
但是這樣很耗時,ESS的複雜度: O(N^4),用ESSM個物件: O(M*N^4)

作法:
  1. 基於ESS的方法,加上物件的維度。
  2. (xj,yj,vj(i)): feature j 在位置(x,y)且該feature對物件i的分數v(i)
  3. v(i)的計算方式: 就是將有屬於該物件i的總和,最後在乘上SVM的權重。
  4. 計算出分數後,再用branch-of-bound的方式去切割。
  5. 切割時是切在feature上面,不過最後面框出來的視覺上看起來差別不大。
  6. 切物件時,每次都會針對分數作排序,因為是堆疊的行式,所以會先放低方再放高分。


上面的做法是有幾項假設:
  1. 物件M是固定的,paper中用了120種物件。
  2. 每張圖中的物間只有一種。如果有多種物件在同一張圖裡面,作法上就要多加上,找到一種物件後,就將該範圍的feature拿掉。
  3. 如果不同物件間位置太相近,就很可能出錯。


最後面有與幾項baseline做實驗。




BOF最快,但是無法定位。

ISM最準,但是如果不做orientation位置的正確度就會下降,如果做了,時間複雜度就會上升。

然後有提到可以用非長方體的方式來做bounding box,像是利用多個長方體或是三角形來框想要的物件,算出來的分數會比較好。

沒有留言:

張貼留言