RecSys 2018のペーパーを読んでいく(19)... 推薦リストを調整して多様性をもたせた話

2019年春、RecSys 2018の論文をひたすら読みます。ルール。

  • 1日ひとつ
  • 読み終わらなくてもOK
  • 理解と疑問点を毎日まとめる

1日ひとつ読めていませんが、全部読んでから考える。今回は、Calibrated Recommendations。これで Learning & Optimization のSession はおしまい。

Abstract:

  • 映画のジャンルで、70%は恋愛もの、30%はアクションをみる人だったら、推薦されるものも7:3の割合で恋愛、アクションを推薦してほしい
  • だが、精度を指標として学習した推薦システムでは、このような人に恋愛もの「しか」推薦しないようになりがち。
  • この論文では推薦リストを調整する仕組みを提案する

ざっくり

  • NETFLIX の人の発表
  • 精度を指標に推薦システムを学習すると、自分の好みの中で少数派のジャンル、たまにしかみない(でも好き)なジャンルがどんどん推薦されなくなる
  • これを防ぎ「たまにしかみないものをたまに推薦してくれる」ようなモデルにする方法を提案する
  • まずは、推薦されたリストのジャンルの分布がどれくらい実際の閲覧ジャンルの分布と似ているか、という指標を提示
  • その後、上の指標が高くなるように、推薦システムが出力したアイテムのリストを後処理で並びかえる
  • 精度はそれほどおとさずに、少数派のものも無視せず推薦するシステムができあがった
  • 質問の回答で「顧客を維持するためには、精度以外の指標もおうべきで、そのアイディアのひとつがこれ」と言っていたような気がする

感想

  • どんな指標を追うか、どこに向かうかは、どういうシステム・サービスなのかによる
  • 目指すところを言語化した上で、それを定量的な指標(今回は分布のDivergence)にしないといけない難しい