学生教材网 >程序设计 > 程序资讯 > 软件研发 > 浏览文章

推荐系统的应用案例剖析[页4]

来源:网络编辑:佚名时间:2016-01-04人气:

三岔路口红绿灯,网络营销学习,吴振鹏

我们先从做一个首页显示热门榜单开始,这是一个非常容易实现的功能,计数、排序、简单分类:中国、欧美、日本和韩国,按流派也行:流行、摇滚、古典,甚至按年龄段或者群体,不外乎是几个数据库搜索的事情。但是这些热门排行榜却作用非凡,用户可以从中发现当前的大趋势(Trending),比如说,现在张杰比周杰伦风头要盛,听听张杰的看看怎样。由此榜单也能帮助用户发现他本来兴趣圈以外的东西。这么容易实现的功能,却也可以带来不少的好处。

然后我们来聘请一批专业的媒体编辑员,让他们根据我们歌曲库里的内容,生成比较专业的榜单,比如:“高逼格小清新”,“喧嚣中,不妨试的调调” 还有 “被遗忘的经典华语女声”。用过其它的歌曲软件的人估计对这个也不陌生,比如说虾米。这个也能很大程度上帮助用户发现兴趣圈以外的东西,而且由专业人员生成的歌单,更有目的性,比如说你喜欢苏打绿是因为“小清新”,那么在“小清新”的歌单里的,就是一大批高质量的,对你而言非常优秀的推荐了。这样的功能也能很快组织和实现起来,好处也是大大的。

这其实就是人工推荐和程序推荐的结合。

最后,看到了知乎的威力以后,我们考虑做UGC。从做一个简单的UGC功能开始,我们现在另开一个数据库,允许用户保存自己的歌单,并在个人主页推荐这些歌单。同时我们在主页中定期置顶一些访问量较大的歌单。功能上非常容易实现。UGC所激发的用户潜能可以使得用户产生与专业编辑员质量相当的、甚至更高的歌单。功能上的实现实在是再简单不过,效果更是不言而喻。

这就是不同歌单之间的交互。

这时,我们的很大一部分问题得到解决,就算是我们的基于相似度的算法所产生的推荐并不是那么好的时候,我们的用户并不会由此而失去发现音乐的途径。听歌的人多了,老用户们持续产生高质量的数据,之前的个性化推荐算法也能有更好数据来调整参数,从而产生更好的音乐推荐,更好好的用户群体也能推动热门榜单与UGC的发展,进入良性循环。

大型推荐系统的技术方案

我们知道,电子商务的公司需要定制化界面。否则手机那么小的界面,根本没有办法呈现用户所需的信息,用户很容易流失。所以,因人而异,制定不同的定制化页面是移动互联网时代的制胜关键。那么如何制作一个大型的商品推荐系统呢?比如制作一个类似淘宝口碑那样的兴趣点商品推荐系统。

在制作技术方案时,要考虑用户需求的种类,无非是分:

  • 你可能需要买的东西(普遍性需求);
  • 你现在想要买的东西(即时刚需);
  • 你潜在想要买的东西(潜在普遍性需求和潜在即时刚需)。
这跟淘宝一直标榜的个性化搜索差不多,首页中有很多广告位,其中以首页的焦点图第2,3,4页最为明显,这里的图片都是商家拍下广告位然后投放的,拍广告位的时候可以选择通投、地域、兴趣点等等。

通投就是所有的人都可以看到的

地域是按不同的地方投放,

 兴趣点就是淘宝对你以往的购买记录进行分析,以及你的搜索情况等,计算出你可能感兴趣的。

在具体的商品推荐技术实现上,淘宝/天猫的商品推荐采用了逻辑回归算法,用了上百亿的特征,并基于库存等约束来进行商品推荐。由于逻辑回归的算法本质上属于一种单层神经网络系统,所以大致的结构如下所示:


其中layer1代表输入的商品特征,比如可以是目前的所有商品,以及其他所能想到的各种特征,layer2可以是目前的所有商品。目的是:当用户购买了一些商品之后,向用户推荐别的**商品。所以训练数据是:输入用户购买的数据的各种特征(没购买或浏览的商品的特征可以为零),输出是用户随后购买的商品(没购买的商品可以设置输出为零)。所以通过大量数据训练后,可以得到一个神经网络,这个神经网络就是所求的推荐系统。这样,每一个用户所看到的商品都是不同的,而且都是她/他很有可能要购买的。

值得一提的是,谷歌或者facebook的推荐系统也采用了逻辑回归算法。

综上所述,我们已经把推荐系统的应用案例剖析讲完了。我们将从下一期开始讲述LBS应用中的数据挖掘方法。

作者简介:

贾双成,阿里巴巴资深工程师,擅长于数据编译、数据挖掘的系统分析和架构设计,主持研发过多个高端车载导航及adas数据编译器。曾发表发明专利、论文四十余篇,著有《LBS核心技术揭秘》、《数据挖掘核心技术揭秘》。

感谢您的阅读,您可以将本文推荐系统的应用案例剖析分享给您的朋友.

LBS推荐系统的设计方法

在中,我们介绍了POI(兴趣点)的设计及其搜索。由于推荐系统是兴趣点系统的核心,所以接下来,我们将介绍推荐系统。推荐系统是一个很庞大的课题,将分成两期予以介绍:本期讲述推荐系统的设计方法,包含推荐系统的数学基础和设计原理。

热门推荐