您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息

基于电商数据挖掘的推荐引擎

2022/6/15 18:40:07发布73次查看
数据挖掘(data mining)简称 dm,它是利用数据仓库中的海量数据以挖掘数据间内在、固有的规律,通过有关客户、市场、产品、销售等数据建立起它们之间的关系,从中发现市场运行规律,为企业决策提供可靠的依据。如通过老客户保持分析,建立老客户流失预测模型,分析客户流失原因,为企业保持老客户采取有效措施提供决策支持;通过客户价值分析,将客户分为各种不同价值等级,对不同客户采用不同的优惠政策,达到留住优质客户的目的。
数据挖掘作为大数据的应用方向之一,终极目的是挖掘潜在用户需求,服务于用户。如今已经进入了数据爆炸的年代,web2.0的发展,web已经成为数据共享平台,在海量数据中,如何让人们寻找自己想要的信息变得越来越困难。这种情况下,搜索引擎(baidu 、google等)解决了用户的直接需求,通过搜索关键词可以找到自己想要的信息,但搜索引擎并不能够完全满足用户发现信息的需求,因为在某些情况下,用户并不明确自己的需求,或者他们很难用简单的关键词搜索来表达,又或者他们更需要符合自己口味或偏好的结果,因此,出现了推荐系统,与搜索引擎相对应,我们称之为推荐引擎。
(一)关联推荐
关联规则的挖掘主要是挖掘一些数据的依赖关系,通过关联规则的挖掘,我们可以找到哪些物品经常被同时购买,或者用户购买了一些物品后通常会购买哪些其他的物品,当我们挖掘出这些关联规则之后,我们可以基于这些规则给用户进行推荐。
关联推荐可以帮助用户在满足某一类需求之后发现其他的潜在需求,从而带动网站其他产品的销售,关联推荐在营销上分为两种:向上营销和交叉营销。
向上营销是同类产品线或升级产品的推荐,交叉营销是基于相似但不同类产品的推荐。
现在我们要知道购买ipod的用户还购买最多的是哪个产品,以便我们更好的满足用户潜在需求以及促进网站更多销售,这需要从用户购物数据中寻找购买ipod产品基础上,又购买了其他某个产品的人数所占的比例,当这个比例达到了预设的目标水平时,就可以认为这两个产品是存在关联的,我们就可以向购买了ipod的用户但还没有购买商品b的用户推荐商品b。
关联规则中有两个关键指标:支持度(support)和信任度(confidence)以衡量商品之间是否值得关联。
支持度=购买a和b商品(集合g)的人数/所有购买过商品(集合u)的人数
置信度=购买a和b商品(集合g)的人数/购买a商品(集合a)的人数
商品a、b是否值得关联销售,网站需要设置一个最小支持度和最小信任度,当支持度、信任度达到一定值时就可以判定商品a、b可以关联销售。在用户的购买行为中,用户a不仅购买了商品b,还有可能购买商品c、d、e等一些列产品。因此,只有置信度大于最小置信度的这些商品组合才是有关联的,是值得推荐的,也可以认为关联购买率最高的宝贝是值得关联推荐的。
(二)基于内容的推荐
基于内容的推荐核心思想是根据推荐物品或内容的元数据,发现物品或者内容的相关性,然后基于用户以往的历史偏好,推荐给用户相似的物品。
图给出了基于内容推荐的一个例子,书籍推荐系统。首先我们需要对书籍的元数据有一个建模,然后通过书籍的元数据发现书籍之间的相似度,因为类型都是“武侠、爱情”,书籍a和c被认为是相关书籍。除了书籍的类型,为实现更精准的推荐,我们还需考虑书籍的作者等信息最后实现推荐,对于用户a,他喜欢看书籍 a,那么系统就可以给他推荐类似的书籍c。
基于内容的推荐机制的好处在于它能很好的建模用户的口味,能提供更加精确的推荐。但它也存在问题:仅仅依物品本身的元素特征,没有考虑到人对物品的态度,并且需要基于用户以往的历史偏好做出推荐,这对于新用户有“冷启动”的问题。
(三)协同过滤推荐系统
根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性,或者是发现用户的相关性,然后再基于这些关联性进行推荐。
1、基于用户的协同过滤推荐系统
根据所有用户对物品或者信息的偏好,发现与当前用户口味和偏好相似的“邻居”用户群,然后,基于这 k 个邻居的历史偏好信息,为当前用户进行推荐。
基本原理:
假设四名用户a、b、c、d对c、d、e、f四本书的评分如下:
a=(3,4,4,4,5)
b=(4,4,2,5,3)
c=(4,5,3,3,3)
d=(3,4,5,2,2)
用户b、c对四本书的评分很接近,我们可以推断,用户b、c具有相同或相似的口味和便好,当用户b购买了书籍g时,我们可以向用户c推荐书籍g。
这种推荐的前提是基于大量的用户参与,一旦缺乏用户对物品的评价,那么这种推荐就失效,并且如果数据较少,推荐本身是不准确的。
2、基于项目的协同过滤推荐系统
根据所有用户对物品或者信息的偏好,发现商品和商品之间的相似度,然后根据用户的
历史偏好信息,将类似的商品推荐给用户。
假设用户a喜欢商品a、商品c,用户b喜欢商品a、商品b和商品c,用户c喜欢商品a,从这些用户的历史偏好可以分析出商品a和商品c比较类似,喜欢商品a的人都喜欢商品c,基于这个数据可以推断用户c很有可能也喜欢商品c,所以系统会将商品c推荐给用户c。
要实现企业这种数据的挖掘,前提是要获得大量的数据, 数据要足够的大才能够找出其中的规律,才具有说服力,而数据的获取成为最基本的一个保证。因此,无论是传统企业还是新兴电商企业,it技术是企业必须重视的一个环节,忽视it技术而实施大数据运营是舍本逐末之举。
该用户其它信息

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录 Product