RecSys 2018のペーパーを読んでいく(6) ... 推薦システムの評価が消費によってどう変わるか実験した話

2019/04 、RecSys 2018の論文をひたすら読みます。ルール。

  • 1日ひとつ
  • 読み終わらなくてもOK
  • 理解と疑問点を毎日まとめる

今日は、Impact of Item Consumption on Assessment of Recommendations in User Studies

 

Abstract:

  • 一般的には、推薦システムの評価をする場合は、推薦されたもの(曲や映画)を消費する前に実行する
  • 実際に聞いたり、見たりすると、推薦されたものの評価がかわることがあるため、適切に推薦システムの評価ができていないんじゃないか?
  • 2つの領域(音楽と映画)で消費前後の推薦システムの評価を比較、対象の消費前の推薦システム評価はどれくらい信じられるのか、検証してみた

ざっくり:

  • 推薦システム自体の評価方法って、だいたい「推薦されたものは気に入りそうか?」みたいなアンケートとってする
  • でも、それは実際に推薦されたものを体験(ホテルにとまったり、映画をみたり)する前にアンケートに回答することがほとんど
  • 「推薦システムは本当に好きなものを推薦してくれているのか?」音楽と映画でためしてみたよ
  • 方法:音楽を聞く前のアンケート、聞いたあとのアンケートを作成、前後にアンケートする群とあとのみにアンケートする群にわけ、推薦システムの評価が変わるのか調査した
  • 前後にアンケート回答した人の後の評価と、後のみに回答した人の評価の分布が結構かわった
  • 消費前の評価って眉唾かもしれない

 

感想:

  • Best ショートペーパー
  • 評価の方法ってどのかしこい人も悩んでいるんだなー
  • とはいうものの、アカデミアの関心がそこにあるのもわからないではないが、ビジネス的に「買う!」ってクリックさせられたらいったんは「良い推薦システム」ってくくっちゃってもいいんじゃないかな。LTVとか考えるとだめなのかな