四、基于关联规则的推荐

在电商领域应用较为广泛的另一种推荐算法是基于关联规则的推荐,从本质上讲它类似协同过滤算法,只是它协同的是用户自己的购买记录。典型的故事是啤酒与尿不湿的故事,虽然该故事的来源已无从考究,但却是目前大众认知度最高的一个数据带来的收益的案例。

故事的内容是:北美的超市经营者经过数据分析发现,啤酒和尿不湿在同一张订单中出现的概率较高。于是深入下去研究,发现在家庭中买尿不湿的事情大都由家里的男人去做,而男人在买尿不湿的时候总会随手带几罐啤酒。于是通过调整货架摆放,把尿不湿和啤酒放在一起,让更多男人在买尿不湿的时候随手带几罐啤酒,结果销售量大增。

故事本身相当经不起推敲,例如尿不湿和啤酒总是要一起买,那么就不应该把他们放在一起,而是保持一些距离。在动线设计上让用户行走在两种商品的过程中摆放一些男人会随手带的其他商品,收益率也许会更高。我们暂不去讨论这个故事的可信度,这个故事反映了关联规则推荐背后最朴素的逻辑:其他用户经常把哪些商品放在一起购买,我也应该有这方面的需要。

它的实现逻辑也相当朴素,以用户已购买过的历史商品作为输入,以其之后购买的商品作为输出,建立模型。之后将任意用户之前的购物记录作为输入,预测其之后买哪些商品的概率更高。至于算法本身,无论是采用回归算法,还是其他算法模型,在本质上都没有很大的变化,事实上传统的回归模型即可实现较好的拟合和鲁棒性。

但该算法的应用场景较为狭窄,且指向性很强。该算法的设计思路基于提升提篮购物率(用户在一个购买订单中的商品数量越多越好)的理念。它能够去发现那些不易被运营人员捕捉到,但又较为常见的固定购物场景,如不同用户每周逛一次的超市,采购的生活用品总是类似的:常买牛肉的人会时不时买一盒牙签。

但事实上在电商领域里,一方面,不存在线下实体商超中两个商品相距较远的情况,用户很容易在不同商品之间跳转;另一方面,随着平台的成熟度越来越高,这种场景捕捉能够覆盖的人群越来越少,运营人员面临的问题是,如何更好地引导无明确目的用户的闲逛式消费。

该算法在电商平台尚未成熟的时候效果较为明显,随着平台的逐步成熟,收益将会越来越小。这是多数推荐系统和推荐算法都面临的问题,也是成熟的推荐系统应当是随着业务不断演进的,成熟的商用推荐系统应当是能够提供多种算法用于支持客户在不同业务阶段的实际需要的。