三、系统冷启动

所谓系统冷启动指的是系统刚部署至应用时,系统应该给用户推荐什么内容。其面临的问题实质上是用户冷启动与物料冷启动的总和。因为系统刚部署至应用,系统内是没有任何用户的行为,自然也就没有基于用户行为计算出来的最受欢迎、热门等物料。所以在此种情况下,我们一般建议有两种处理方式:

1.系统先收集用户行为数据一段时间,暂不调用推荐结果

也就是系统先默默地积累一部分的用户行为数据,当用户行为数据量足够时自然最受欢迎、热门等榜单都被计算了出来,这时再进行结果的调用。那么,发生过行为的用户自然可以根据其行为推荐,新登录用户则根据用户冷启动的方式进行推荐。

2.历史数据的迁移

在系统部署之前,很多应用其实早已收集了用户的行为数据,这时只需将历史的行为数据导入至系统即可,但值得注意的是,导入的历史数据不宜时间过长,用户的兴趣是处于动态变化中的,过长的历史数据不仅增加了系统的负担,还对推荐结果的计算产生了负面的干扰。

我们总结一下,推荐系统会面临用户冷启动、物料冷启动和系统冷启动三种情况,用户冷启动往往采用多样性和探索推荐的方式,其融合了实时受欢迎、全网热门、跨数据平台等多种方式。物料冷启动以语义相似推荐为主,通过时间权重干预的方式帮助新物料获得更多的曝光机会。系统冷启动面临的是用户冷启动和物料冷启动两种问题的总和,因此可以采用系统先行积累数据和历史数据导入的方式将系统冷启动问题转变为用户冷启动和物料冷启动问题,从而实现系统的冷启动。