RecSys 2018のペーパーを読んでいく(17)...Matrix Factorization と グラフのいいとこ取りをした話

2019年春、RecSys 2018の論文をひたすら読みます。ルール。

  • 1日ひとつ
  • 読み終わらなくてもOK
  • 理解と疑問点を毎日まとめる

昨日から5月だった。1日ひとつ読めていませんが、全部読んでから考える。今日はHOP-Rec: High-Order Proximity for Implicit Recommendationのビデオをみました。

 

Abstract:

  • 協調フィルタリングアルゴリズムでは  Matrix Factorization と グラフベースのものと大きく二つある
  • それぞれにメリデメがあるので、いいとこどりして統合したら、良い感じになるのではないか?

ざっくり

  • 推薦システムでは協調フィルタリング=自分と似た嗜好の人が好きなものを推薦することは現在でもよく実行されている
  • 協調フィルタリングアルゴリズムでは Matrix Factorization とグラフベースのものがよく知られている
  • Matrix Factorization は ユーザ・アイテムの潜在的な特徴をモデル化するが、モデルに利用しているデータはとても狭い範囲(= 直接ユーザが評価したアイテムのみ)のもの
  • 対してグラフ系のアルゴリズムを利用すれば、「似た人が好きなもの」もわかる
  • 「似た人が好きなもの」を重みづけを軽くした上でその人の好みとして行列分解時の証拠としてつかったら、2つのアルゴリズムの欠点を補いあえるのではないか?
  • おもみづけは、逆数を利用 (自分 = 1、同じアイテムを同じRating = 2、2の人と同じアイテムを評価している人 = 3 ... )

感想

  • グラフ系のアルゴリズムに関する知識のなさよ
  • PageRank はグラフ構造からスコアをつけて推薦する手法。一回きちんと勉強しておきたい