基于Clementine关联规则的捆绑销售研究(一)
来源:互联网  日期:2015-10-14
    • 分享到QQ空间

基于Clementine关联规则的捆绑销售研究”全部内容将分为四节进行讲解,第一节:阐述本文背景及关联规则捆绑销售的相关理论;第二节:对原数据进行预处理,主要包括数据清理、数据选择、数据变换;第三节:对变量进行了基本描述性分析(篇幅较长,这一节内容将分成两部分);第四节:利用Apriori算法的关联规则挖掘方法来找到具体的关联规则,并提出有理论支持的捆绑销售策略和商品推荐方案


一、引言

作为亚太最大的网络零售商圈的淘宝网,目前已经成为世界范围的电子商务交易平台之一。而随着淘宝网规模的扩大和用户数量的增加,网站每天都会产生大量数据,主要是网页访问浏览和商品销售记录数据,以及其他方面的数据。面对日益增长的数据量和越来越复杂的数据记录内容,很多卖家已经不能单凭自身经验来进行各种决策和制定销售方案等。另一方面,越来越多的卖家意识到全球传统商务正向电子商务全速挺进,各行各业都在抓住这个潮流为企业创造更多的商机。


越来越激烈的竞争当然是不可避免的,而在严酷的竞争压力下,卖家希望更客观地了解自身经营情况,以便制定更合理销售计划,所以面对海量的销售记录数据,他们的数据分析需求越来越强烈。而在自身能力有限的情况下,他们更希望借助于一些有效的数据分析工具,更多地挖掘出隐藏在销售数据中的、有价值的有利于决策的信息。


数据挖掘作为商业数据处理和分析的重要技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。利用强大的数据挖掘技术,可以帮助淘宝网卖家将历史销售数据转化为有用的信息来支持决策,从而在市场竞争中获得优势地位。


二、商品间关联规则挖掘与捆绑销售

(一)关联规则及Apriori算法

关联分析的目的就是寻找给定数据记录集中数据项之间隐藏的关联关系,为人熟知的啤酒尿布就是通过关联分析找到的商品间的关联规则。




最早的Apriori算法是AgrawalSrikant1994提出的,后经过不断完善,现已成为关联规则挖掘技术的核心算法之一。Clementine采用的是Christian BorgeltApriori算法的改进算法。Apriori找寻频繁项集的过程是一个不断迭代的过程,每次迭代都包含两个步骤:第一,产生候选集Ck,所谓候选集就是有可能成为频繁项集的项目集合;第二,基于候选集Ck,计算支持度并确定频繁项集Lk。然后再基于频繁项集的产生发现有用的关联规则。


(二)捆绑销售

捆绑销售这种销售形式在当前商业环境中越来越流行。广义上的捆绑销售指的是,两个或两个以上的品牌或公司在促销过程中进行合作,从而扩大它们的影响力的一种跨行业和跨品牌的新型营销方式。本文给出的捆绑销售定义为:将两种或两种以上有关联的商品“捆一起”进行销售。在电子商务环境下,捆绑销售具有其在竞争中的必要性和诱惑性,对商家来说是必要的销售手段,对买家则是一种支付意愿程度提升的诱惑。因为一般捆绑后的两商品价格肯定是低于两商品单价总和。捆绑销售所采取的是增加销售量,降低获利的模式,最终实现更大盈利。


    • 分享到QQ空间