物料冷启动指的是新入库的物料,应该把它推荐给谁的问题。一般有以下几个推荐方式:
1.语义相似推荐
用户在浏览过程中看到了某一内容,那么与这个内容最相似的新入库内容就有可能被推荐出来。
2.专家预定义数据
新物料上报后会发布到指定位置进行固定推荐。
3.兴趣试投
假设我们定义曝光1000次以下的物料是新物料(资讯类产品一般还有时间限制,如6小时内),将新物料和用户表征为多维向量,计算向量的距离,对用户行为较多的用户进行分发,物料在冷启动阶段会有一个趋于稳定的点击率(或其他综合指标),该点击率是它后续流量分配的依据——根据小流量的点击率表现,表现好的物料进入下一个更大的流量池,表现差的物料被淘汰或降权,以此种方式小规模试验兴趣后大规模投放。但此种方法在实际商业场景应用空间并不大,因为在物料的相似推荐中,是可以干预新物料的时间权重,通过干预时间权重来控制和分配,这比兴趣试投的方式要简单,也要更科学,毕竟此种方法过于依赖初期的抽样样本,太容易放弃物料了,反倒会让物料更容易沉默。
总结来说,物料冷启动比较成熟的方式是通过语义相似方式将新物料推荐出来,并适当地干预和调整新物料的时间权重,确保新物料有足够多的机会推荐给用户,且符合用户的行为习惯和逻辑。