2011年4月21日 星期四

[aMMAI] Paper Summary: Support Vector Learning for Ordinal Regression

Title: Support Vector Learning for Ordinal Regression
Author: Ralf Herbrich, Thore Graepel, Klaus Obermayer
Publication: ICANN, 1999


這篇paper提出一個解決ordinal regression的方法。
Regression有兩種形式:

(i)一種是分兩類,通常是用”+””-“或是”0””1”來分類,如果套在retrieval上,可以表示文件是相關還是不相關。偏向classification

(ii)另一種除了分類外,還有看他的比重,分在”+”裡面後還要看正多少,分在負裡面後還要看負多少,依此作排序。這稱為ordinal regression


技術的部分主要兩部分:

1. A Risk Formulation for Ordinal Regression
這邊主要用到的方式有Empirical Risk Minimization(ERM)Pair-wise Training
給定一個set S = {(x,y)}x: feature vector, y: rank
S中要學出一個h,給定x可以預測出相對應的yh(x)->y
Pair-wise的方式來比(x1,y1)(x2,y2)這邊利用ERM來達到最佳化。
為了讓訓練更有效,他將原本的S轉成S’形式,S’ = {(x1,x2),diff(y1,y2)}
一樣利用ERM來找出Risk Formulation

2. SVM for Ordinal Regression

從圖來看,他會將步驟二rank出來的每個sample透過一個U做降維,並且在降維過程中還能保留原有的rank條件。
θ(r)就是高維中的平面,可以將不同rank間的點切開,類似在做分類的問題,利用SVM去做分類。為了讓切開的平面能達到margin最大,導入了一個非負的,利用Lagrange multiplierQP-problem來解。

最後這篇paper與一些方式(multi-class SVMSV regression)做比較,以及提出應用在IR上的效果。

結論:
這篇paper提出的方法結合了classificationregression的問題。
將高維降到剩純量還可以保有原本的rank,還蠻難想像的。
裡面有用到很多專有名詞,有machine learning的基礎知識可能會比較容易讀。

沒有留言:

張貼留言