第三节推荐已换代

推荐系统其实并不是一个新鲜的概念。其初端是信息检索技术、计算机统计学等学科的实践延伸。

一般认为,推荐系统诞生于1994年的明尼苏达大学双城分校计算机系。GroupLens研究组设计了名为GroupLens的新闻推荐系统,且首次提出了协同过滤的思想,并且为推荐问题建立了一个形式化的模型。在之后的十几年中,其他一些著名的协同过滤算法相继被提出,主要有基于物品的协同过滤算法(Item-based Collaborative Filtering,Item-basedCF)(Sarwar,2001)、基于矩阵分解的协同过滤算法(Matrix Factorization-based Collaborative Filtering,MF-basedCF),等等。

推荐系统真正地进入人们的视野要归功于亚马逊和Netflix。亚马逊早在1998年,便上线了基于物品的协同过滤算法,将推荐系统的处理规模扩大至服务千万级的用户和处理百万级的商品,可谓是推荐系统商业化的鼻祖。而2006年Netflix举办的奖金为100万美元的推荐算法比赛将推荐系统的研究推向了高潮。此后十几年间学术界不断有新的推荐理论及算法诞生,对于商业场景来说,技术的新旧并不重要,重要的是如何互补、融合、应用多种算法,使推荐技术真正能为公司带来最大的经济效益。

产业界对推荐的利用更加朴素,最早的推荐就是商店的橱窗,将不同的品类放在不同的区域,再把不同的系列放在不同的货架,将新款放在更明显的位置上,分门别类地让客户更方便地找到他想找到的东西。它非常重要,以至于商品陈列师都可以成为一种职业。而显然,这种分门别类的推荐方式不够有想象力。于是人们开始追求更智能的推荐方式,可以根据每个人实现针对性的推荐。

对应到互联网平台上,因为用户在互联网上产生的数据足够保证对每个人进行单独分发,于是运营者开始对用户分区,不同区域的人看到同一个版面,内容也是不同的,例如新闻版面的地方频道。再往后大家就意识到,每个人的需求是不同的,不仅同一区域的人看到的不一样,每个人看到的也都不一样,想要更符合信息分发高效性的原则,于是有了智能推荐的尝试。而这期间则经历过,关联规则推荐,标签推荐、RFM推荐、机器学习与深度学习模型推荐等并最终发展成了基于用户行为且融合多模型多线路召回(多算法模型提供推荐结果)的算法推荐。

商业化场景讲究的是落地,是实实在在看到推荐的效果,而显然,不同的业务场景是需要不同的推荐算法来实现数据目标的,比较成熟的推荐系统一般以NLP为底层技术,包含了语义分析算法、近邻算法、协同过滤算法、行为反馈算法、热度扩散算法、机器学习和深度学习等。具体的业务场景也会在一定程度上结合规则做融合推荐。

而对于智能推荐的未来,很多人会提出未来的发展是模型精度的提升,是更多维度数据的获取,是新的推荐算法理论的应用,是计算成本的进一步降低……凡此种种的进步,在我看来都是技术的视角,着力点都是提升推荐精准的概率(这个概率是有天花板的)。

从智能推荐的本质上来看,人的需求是在变化的,关注点也在变化。每个人的信息获取来源是多元的,智能推荐会逐步与更多的信息源产生有机融合。可能我今天想买某种东西是因为在电梯里看了个广告、在车上听了个广播,也可能是音响智能助手的推荐。所以,信息来源的多样性决定了目前的信息分发平台不可能覆盖人的所有生活场景。

智能推荐承担的内容智能分发,逐步从APP的新闻、商品的分发到物联网及企业生产的分发,例如车载娱乐推荐、家庭智能音响信息推荐,这是在物联网环境的分发。例如典型的译员分派,客服坐席分派,这是在生产环节上的分发。信息流的分发从对用户的迎合变成对用户的引导,像译员分派,忙时就把最擅长的内容分给他,闲时就把更多样的内容分给他,培养他的学习能力。

从产业界现状看,推荐系统的应用场景还非常狭窄,大多集中在互联网行业,所以智能推荐的未来必定是更深层次地融入人们的线下家庭生活和企业生产运营场景,更多的作用于信息的引导,帮助用户更智能地做决策,而不是在于让信息分发更加精准,再精准都只是概率而已。这里才是智能推荐真正可以大展身手的地方。