一、用户冷启动

用户冷启动,指的是新用户或者行为已失效的用户登录平台,此时用户是没有任何行为数据的。用户冷启动,我们需要探究的问题是:应该把什么内容推荐给他呢?

一个新用户转化为老用户的路径是:新用户兴趣获取(构建冷启动用户初始画像)—内容消费和兴趣聚焦—沉淀兴趣成为老用户。概括地说,第一步就是“千方百计”获取用户的行为数据或让用户主动暴露兴趣。有几种方法可以考虑:

静态信息匹配:如性别、年龄、地区、爱好等。在用户第一次打开APP的时候,很多APP会提示或留有入口供用户填写相关信息。即使用户不主动输入,也可以尝试从外部渠道引入行为数据(但需要注意用户重合度和相关度)。有了这些信息,就可以基于社会属性进行粗颗粒度的个性化推荐。

举个笔者服务过的客户的例子:客户所在公司是家大型机械制造业集团,要给员工提供一个内部的情报和学习分发APP。APP里包含了最新的科研论文、行业资讯、竞对信息、内部课题分享等内容。该集团的业务范围比较广,集团内部就有上百个不同的岗位,如整车组装岗、零件制造岗和行政财务岗等,不同岗位需要的信息差别很大。因此,客户通过注册APP时填入的姓名、岗位、职位等信息生成了基础的用户画像,通过用户画像与信息的直接关联,实现了基于工作岗位属性的冷启动推荐。

1.实时最受欢迎推荐

我们知道推荐结果是按照权重值进行排序的,而权重值来源于用户们发生行为权重的累加。全平台最受欢迎指的是平台内的所有用户发生行为权重最高的内容榜单,这个权重最高不是单一某个指标如点击最高、分享最高等,而是基于综合的权重,比单纯的热度(点击)最高能更全面的反映平台内用户的共同兴趣和调性。一般推荐模型每生成一次,这个榜单的内容也会更新一次。它是比较常用的冷启动推荐方式,但它在一些情况下也会产生内容的马太效应,这个我们在下面再详述。

2.跨平台数据推荐

有两种形式,一种是从外部引入(第三方登录或开放API)的行为数据和用户关系链;一种是自身平台内的不同端的数据,如用户在小程序端发生的行为当用户登录APP端时,APP端也会基于小程序端的数据进行推荐。此种方法需要确保的是,用户的ID和物料的ID在各个端是一致的。

3.专家预定义数据

也可以理解为平台运营人员的人工推荐,多为基于业务规则下的编辑精选推荐。此种推荐效果比较平庸,但不至于出错,在一些央媒或者有政治属性的平台内有很大的应用空间。

4.全网热门推荐

平台内的内容与互联网上最新、热门内容进行语义计算的匹配,例如与微博、百度热点、知乎等的热门内容进行匹配。通过遍历已入库的内容,并与热点做实时的语义相似度计算,就可以计算出数据库中哪些内容是热点内容或最接近热点内容的。此种推荐方式适合每天新增物料量比较大的资讯和短视频平台。

5.各分类热门推荐

各分类热门推荐的结果取的是各分类里“实时最受欢迎”的内容。当平台内用户量较少,正处于推广期时,新增用户量比较大,正在浏览的用户里绝大部分都是新用户,这种情况下,新用户发生行为的都是平台内的最受欢迎的内容,导致这些冷启动的内容权重越来越高,从而产生了内容的头部效应。而分类受欢迎推荐会在一定程度上将内容进行人为地区隔,不至于出现最受欢迎的内容都来自单一几个类别的情况。

6.多样性和探索推荐

此种推荐是较为成熟和保险的推荐方式,其实质是融合了实时最受欢迎推荐、最新推荐、专家预定义推荐等多种推荐方式,各种推荐方式所提供的推荐列表先融合后打散,尝试着用多样化和优中选优的方式尽可能地提升新用户的冷启动体验。

总结一下,以上为用户冷启动中常用的几种方式,其中静态信息匹配适合内容专业性、职业性比较强的平台,如医师资讯平台,不同专业的医生所需要的专业信息区别非常大。跨平台数据推荐适合已建立了比较完善的平台矩阵和数据来源的平台。多样性和探索推荐是比较成熟的推荐方式,其融合了多种推荐方式,取各种方式所提供列表权重最高的内容进行打散推荐,属于优中选优。