第一节浪潮中的推荐

在电视剧《长安十二时辰》中的大Boss徐宾以一人之力巧妙利用各方势力的诉求和弱点,完整策划和实施了针对圣人的袭击与拯救,以达到向圣人展示自己才能的目的。虽然,最终未能官拜宰辅,但其引以为豪的技能——大案牍术,却被观众津津乐道。

徐宾以档案数据为基础,佐以出色的计算和记忆能力,在剧中推理调查、判案决断,并精确地掌控每件事情的进展,甚至预言未来,让剧中所有人都陷入他精心策划的剧本中,不得不让众多观众调侃为:唐朝的大数据!

笔者作为数据领域从业者,当看到“大案牍术”时,仿佛看到了在大数据的前提下智能推荐的工作过程。徐宾阅读大量的档案数据(文本训练数据集),自创数据计算方法(算法),并形成大案牍术技能(算法模型),在遇到每一个需要决策的事件时,将解决此事件可能用到的信息传送至算法模型后,便会得到最优的处理方法,而这就是智能推荐的过程。

智能推荐具有无限的想象力,笔者姑且认为“大案牍术”是智能推荐的高级阶段或是未来才可能实现的应用场景。而现阶段,具备初级智能推荐能力的应用其实早已融入人们的日常生活中。

我们在抖音上刷到的视频,淘宝上看到的商品,网易云音乐上听到的歌曲甚至在今日头条上看到的广告,之所以每个用户看到的都是不同的,是因为背后的智能推荐无时不在计算中。毫不夸张地说,智能推荐已经深度影响了人们在互联网上信息获取的方式与内容。为什么智能推荐会突然爆发,席卷了各大过亿用户注册量的应用呢?智能推荐的被追捧、被广泛应用,是互联网发展到现阶段的必然选择。

互联网上第一代信息获取的地点为资讯类的门户网站,那时候信息量相对来说没有那么大,单纯地依靠编辑手动的整合内容,人们像在图书馆里一样,分门别类地去找自己需要的内容。

随着互联网的普及与信息量的暴增,人们获取信息的广度、深度和频度的需求不断增长,于是催生了第二代信息获取方式:搜索引擎。这时看新闻,逛论坛甚至听音乐都是通过搜索站点的形式去完成,人们基本可以实现明确的信息的获取。而在此时,智能推荐已经悄然诞生了(亚马逊出现了购物推荐,国内的某几个PC网站在2006年已经出现了机器推荐),只不过市场和人们还没有注意到他们。

当移动互联网时代来临时,受制手机屏幕的大小,人们开始不满足使用门户和搜索去获取信息了。在海量的信息、碎片化阅读的背景下,人们产生了更高效、更智能、更友善、更方便地获取信息的需求。于是,智能推荐开始从原来的各大平台用户辅助操作路径转变为主要操作路径,智能推荐也逐渐被更多的人注意和体验。像淘宝原来只在部分页面使用商品推荐,提高购物的提篮率,而在移动互联网时代,从淘宝的首页直到购物的全流程,智能推荐全部参与其中,承担了平台内商品分发的职责。而今日头条,其平台的主流量位置也全部智能推荐化,主打个性化的阅读方式与老牌的媒体应用火花不断。智能推荐之所以被突然“扶正”,是因为移动互联网时代的到来。

移动互联网时代,人们获取信息的载体已与PC互联网时代不同。在PC互联网时代,人们从门户网站密密麻麻的分类里找信息,这种从阅读纸质报纸延伸出来的习惯,人们尚且能够接受。而在移动互联网时代,小小的手机屏幕无法承载纸媒似的排版。像微博、Facebook等社交媒体的诞生,培养了人们通过屏幕的上拉下滑获取信息流的方式,而这种阅读习惯导致流量在某一个界面的高度集中,在人工编排版面的情况下必然导致内容阅读的“马太效应”,对于内容生产方来说,大量的内容曝光不出来,也就有很大概率无法满足某类用户的信息获取,造成用户流失和运营资源的浪费。所以,智能推荐成了各大平台信息分发的必选项。

由于移动互联网的兴起,大量数据得以积累,使机器学习算法得以打破以往数据的限制,从2012年AlexNet在图像识别领域成功以后,各类机器学习、深度学习的算法、理论、应用呈井喷式发展,深度学习算法逐渐与传统推荐系统进一步地融合,不断创造出新的模型,使得推荐系统技术不断精进,提供更大的商业价值。同时,由于GPU等高性能计算的兴起,又使得我们在可以控制的时间内实现训练复杂的神经网络,这使得作为人工智能领域消耗机器学习算力资源的大户、依赖高性能计算的推荐系统具备了应用多模型进行推荐的可能性。当然,高性能的计算并不仅限于GPU,在CPU上的大量向量化计算、分布式计算,这些都和20世纪60年代起就开始研究的HPC领域的进步密不可分。

值得一提的是,智能推荐没有局限在内容平台的应用,而是在互联网企业和传统企业都有广泛的应用场景。如打车软件的线路规划,外卖软件的骑手派单,客服团队的坐席分配,新产品上市的用户推广甚至公司曾经服务过的国家知产局的译员分配、电信运营商的客服工单分配,都在使用智能推荐提高工作效率。

资讯、电商、教育、社交、物联网及部分传统行业的业务都在不同程度上与智能推荐发生着化学反应。从企业发展的趋势来看,数十万计的传统企业在逐步将经营过程数字化形成数据资产后,智能推荐将会通过对数据资产的挖掘和利用,产生更多具备想象力和实际价值的应用场景,从而提升企业的生产效率。