2011年4月27日 星期三

[aMMAI] Paper Summary: Paper Summary: Learning to Rank: From Pairwise Approach to Listwise Approach

Title: Learning to Rank: From Pairwise Approach to Listwise Approach
Author: Zhe Cao, Tao Qin, Tie-Yan Liu, Ming-Feng Tsai, Hang Li
Publication:  ICML, 2007



Learning to rank: 利用machine learning的方法,來幫助排序。

常用的方法有PointwisePairwise、與這篇論文提出的Listwise,主要是跟Pairwise做比較。

Pointwise:
單看文件與query之間的關係,利用訓練的方式,找出可以算出query與文件之間分數(相關性)有多少的模型。

Pairwise:
除了看query與文件之間的關係外,現在還要兩兩pair去比較,根據其相關性的大小給與不同的類別(+1, -1)
Pairwise有一些缺點:
1. 兩兩去看文件相關性而不是去看一整串文件間的相關性
2. 一些評估的方法(MAPNDCG)都是著重在rank的前幾名上(實際上,使用者在使用時通常也只看前幾個搜尋結果)pair並沒有針對前面的部分做細分。

Listwiae:
對所有文件取出所有的排列可能,每個排列都有一個機率在。
作者定義了一個機率函式來計算每個排列的機率,如下。

但是因為排列的可能性太多了,複雜度會達到O(n!)
所以後面提出只對前k個文件做排列,複雜度降到O(Pnk)
cross-entropy做為loss functiony:正確排序、z:預測排序。

最後用gradient decent的方法來做learning,訓練出一個線性的模型。
作者稱這個方式為ListNet

沒有留言:

張貼留言