1.2 推荐系统的作用和意义
站在互联网企业的角度,在互联网应用及用户规模“爆炸式”增长的时代,如何做到千人千面,为每个用户提供个性化的服务,从而提升产品的使用率和用户黏性呢?这是推荐系统需要解决的问题。站在用户的角度,面对海量的信息,如何高效检索自己感兴趣的内容呢?这也是推荐系统需要解决的问题。
和搜索引擎不同,个性化推荐系统需要依赖用户的行为数据。对于不同的应用场景,推荐系统的优化目标是不一样的,比如淘宝这样的电商平台关注的主要是用户点击后的转化率(conversion rate,CVR);而YouTube这样的视频分享平台关注的主要是用户的观看时长,这是因为YouTube的主要收入源于广告,增加用户的观看时长可以提高广告的曝光度。
为了更直观地区分推荐系统在不同应用场景下发挥的作用,本章尝试用两个应用场景来描述。
第一个应用场景是今日头条App新闻推荐频道(见图1-2)。2018年1月,今日头条的算法架构师发文公布了今日头条的算法原理,文中提到今日头条关注的目标包含点击率(click-through rate,CTR)、阅读时间、点赞、评论、转发等,而其中最主要的目标就是CTR。这主要是因为点击量和公司的商业目标直接相关,而通过优化点击率来提升点击量是最直接的方法。
图1-2 今日头条App新闻推荐频道
第二个应用场景是YouTube视频推荐。YouTube是一个视频网站,成立于2005年,每天要为全球成千上万的用户提供高水平的视频上传、分发、展示、浏览服务。图1-3所示为YouTube网站首页,里面包含各种形式的视频。前面提到过YouTube主要优化的是用户观看时长,算法工程师需要根据业务指标调整模型结构和优化目标。早在2016年,YouTube的算法工程师在RecSys会议上发表了论文“Deep Neural Networks for YouTube Recommendations”非常明确地指出了将优化用户观看时长设为最终优化目标的建模方法。在随后2019年的WSDM会议上,另一篇有关强化学习的论文“Top- KOff-Policy Correction for a REINFORCE Recommender System”提出的最终优化目标也是优化用户观看时长,模型上线后总的用户观看时长提升0.86%。后面的章节将会详细介绍这两篇论文的技术细节。
图1-3 YouTube网站首页