RecSys 2020 (1) Day1 , Keynote / Novel Machine Learning Approaches I

去年に引き続き、RecSys に参加しています。 最近はいろんなことでサボっていたので、今日初日はリハビリにみたいになっていますが、夜のKeynote 前に聞いたことをまとめます。

RecSys 2020 開催フォーマット

去年はデンマークに行ってそれはそれは楽しかったですが、今年はオンライン開催です。ブラジル開催と聞いて参加を諦めていたので、今年も参加できてうれしい。 ツールはWhova を使っています。アジェンダなどがすべてまとめられて、とてもよくできています。

また、プログラムも工夫されており、ほぼすべてのセッションが12時間おきに2回開催されます。これにより、世界のどのタイムゾーンにいても起きている時間にセッションをみれるし質疑応答もできる、という。つまり、発表者は二回発表してくださるわけで、本当に運営の皆さん含め、感謝しかありません。

Keynote : 4 Reasons Why Social Media Make Us Vulnerable to Manipulation

我々がソーシャルメディアによる操作に流されやすい4つの理由。 SNSを情報源として利用する人が増えているが、意図せずに偏った情報にしか触れられずフェイクニュースなどにだまされやすくなることがシミュレーションなどでもあきらかになった。情報を取捨選択し、適切な判断をするためには、SNS のこのような特徴を理解した上で、「常に一次情報を確認する」など情報との付き合い方を変更する必要がある。

半分寝ながら聞いていましたすみません。ただ情報提供者が強者となる昨今、一貫してRecSys は科学の倫理について説いているように感じます。

P3A: Novel Machine Learning Approaches I

PURS: Personalized Unexpected Recommender System for Improving User Satisfaction

Abstract

古典的な推薦システムの手法ではしばしフィルターバブル問題に直面する。ユーザは似たようなアイテムしか推薦されなくなり、退屈を感じ不満を抱くようになる。フィルターバブル問題を解決するために、思いもよらない推薦、ユーザの期待から逸脱したアイテムを推薦し、まだみぬアイテムとの出会いで新鮮な驚きを与えることが重要。この論文では、新しい 「パーソナライズされた裏切り推薦システムモデル」を提案する。これは、ユーザの関心と思いもよらない度の潜在空間マルチクラスタモデルを提供することにより(良い意味での)期待外れさを推薦システムのプロセスにおりこむ手法である。これは Self-Attention のメカニズムと適切な「期待外れ」アクティベート関数の選択により実現する。オフラインテストでは STOA より良い結果がでた。あわせて、オンラインのA/B テストでも良い結果がでたので、今実サービスに適用しようとしている。

感想

完全に聴き間違えていました。Abstract 読んでから臨まないとだめだ。 Unexpectiness を クラスタで表現したのが肝。

Progressive Layered Extraction (PLE): A Novel Multi-Task Learning (MTL) Model for Personalized Recommendations

Abstract

MTL では、「一方のタスクを改善すると、もう一方のタスクが悪化する」といった「シーソー現象」が起きることがある。このシーソー現象を解消するために以下の2つのことを実施。 - 共有コンポーネント( Experts ) と タスク固有のコンポーネント(Experts) を明示的に分離 - progressive routing mechanism を適用 効率的なMTL Model を提案する。

感想

去年もTower が二つの図はみた。Tencent Video の推薦、タスクとして「みてみる」「最後までみる」の二つを設定したところが興味深い。

KRED: Knowledge-aware Document Representation for News Recommendations

Abstract

ニュースに関するさまざまなタスク(推薦、分類... ) で固有名詞の理解が重要であるが、BERT やDKN はさまざまなニュースのタスクに適用するには汎化と精度に課題がある。 そこで Knowledge Graph を活用したKRED を提案する。

感想

固有名詞がニュースのテーマによって重要度や意味あいがことなるから、って話だったとおもったが。 Multi Task や 蒸留などのキーワードがでてきたのはわかったが、モデルの構造は理解できず。

FISSA: Fusing Item Similarity Models with Self-Attention Networks for Sequential Recommendation

Abstract

DL ベースのSequential Recommendation のissue は2つ。ユーザのsequence 全体での嗜好をうまくモデリングできていない点と候補のアイテムがもたらすユーザのインテンションが不確かな点。これを local representation と global representation 、この2つの表現をgating module でバランスとる。

f:id:ayakobaba:20200923182319p:plain

感想

順番に推薦していくタイプのRecSys において、Self-Attention を活用したモデルの提案。 local representation は SASRec を用いていた。 Attention つかうんだなあ、とおもいました。

[Industrial Talks] Investigating Multimodal Features for Video Recommendations at Globoplay

Abstract

Brazil のVideo 会社、Globoplay のセッション。種類が多いため、推薦のための類似コンテンツを見つけ出すのが大変なところを工夫している。(伝統の)Content Based の推薦システムを動画のいろいろな特徴量で作成している。

f:id:ayakobaba:20200923195913p:plain f:id:ayakobaba:20200923200020p:plain

感想

奇をてらわない、コンテンツベースの推薦システムに好感。モデルがわかりやすかったからかもしれない。 カラーパレットや音楽などを特徴量につかっているのが面白かった。おもしろかったとおもったらIndustrial Talks だった。企業の発表が好き。

[Industrial Talks] The Embeddings that Came in From the Cold: Improving Vectors for New and Rare Products with Content-Based Inference

Abstract

coveo のセッション。シンプルにCold Start 問題への対応。いろいろなモデルのために、Word2Vecのような商品の埋め込み表現Product2Vec を使うが、新商品・めずらしい商品は購買の記録がないため埋め込み表現を得ることができない。そこで、人気のある商品の埋め込み表現を用いて、genre などの商品属性・特徴から埋め込み表現を得る関数を学習し、新商品に適用することによりその埋め込み表現を得る。

f:id:ayakobaba:20200923201107p:plain f:id:ayakobaba:20200923201119p:plain

感想

発想は自然。どうやって学習したんだろうか。

初日、まだまだつづく。