RecSys 2022 Day3

Session 9 Large-Scale Recommendation

Optimizing product recommendations for millions of merchants

  • Shopify の Industrial Session
  • A/A tests をする 。A/B テストではなく
  • テストの仕方
    • 別のモデルのリストを同じ画面に表示する
  • Differnet models perform better for different shopping
    • よい推薦モデルがショップによって異なるため、それぞれにベストなものを提供する
    • いくつかのモデルを使い分けている
  • Collaborative Filtering , Contents based Filtering
  • Long-tail の場合
    • コンテンツベース、はひとつの解

A GPU-specialized Inference Parameter Server for Large-Scale Deep Recommendation Models

  • DeepLab (Taboola engineering) : 広告とか
  • Challenge
    • Contents changing / User intent changing / model must change
  • ETL / Data validation / Train / Model validation / Deployment
  • Solution → transfer learning
  • システム構成:airflow spark tensorflow k8s
  • metrics
    • offline : いっぱい AUC とか
    • online : 現実のやつ

Hirechal prameter NVIDIA

  • NVIDIA の Industrial Session
  • Transformer などの学習や推論に最適化したサーバをつくったよ(という話だとおもう)
    • メモリの持ち方?
  • 前提知識が足りないものはわからない量が多いが、たのしい

Evaluation Framework for Cold-Start Techniques in Large-Scale Production Settings

  • Outbrain : オンライン recommendation : news とか
  • cold start evalution framework
    • ニュースはほぼほぼコールドスタートなので
  • continious flow of cold-start items
  • fast cold-start research
    • 新しく投入されたニュースをどのシーンで推薦したらよいか、早く学習する
  • Framework
    • offline simulation
    • how to choose?
  • AB テストできない / skew だから
  • 全リクエストをわける
    • このへんはもうちょっとみたい
  • exploration にはいろいろなテクニックをつかってる

Timely Personalization at Peloton: A System and Algorithm for Boosting Time-Relevant Content

  • PELOTON
  • Fitness content platform
    • personalizing content discovery experience
  • タイムセール、顧客体験を減らせずにどれくらい露出を増やすか
  • 二つの方法
  • ビヨンセ

EANA: Reducing Privacy Risk on Large-scale Recommendation Models

  • Google さん
  • 機械学習などにデータを活用する場合、プライバシーがわからない、かつ、データの分布やパターンが変わらない程度にデータをマスク(加工)する
  • SGD / DP-SGD とかある
  • DP-SGD : めちゃくちゃcompute heavy
  • EANA = embedding-aware noise addition
  • ノイズの加え方を工夫して、より簡単にデータの活用ができるようにした
  • Privacy Tech だなあ

https://www.youtube.com/watch?v=6U2DQ8gkv4c