“Clementine的神经网络在电信行业应用实例”全部内容将分为四个部分进行讲解,第一节:阐述数据挖掘技术应用的大背景及神经网络的理论知识;第二节:对原数据进行预处理,主要是离群点及极端值的修正;第三节:对变量进行了特征描述,探索变量间的相关性;第四节:利用BP神经网络技术建立客户流失预测模型,并利用径向基函数网络(RBF网络)进行服务套餐和基本费用的预测。除了第一节是纯理论内容,后三节内容都会给出Clementine软件的详细操作图及结果解释。
一、背景
随着信息技术的进步和数据库的广泛使用使得数据存储技术不断完善,各个领域的数据规模和范围都在不断扩大。虽然如今“大数据”没有一个统一明确的含义,但是可以肯定的是,如今很多行业的数据库中所储存的数据都属于“大数据”,比如电子商务(淘宝网、亚马逊、京东等)的数据,电信行业(中国移动、中国联通、中国电信)的数据,金融行业(银行业、保险业等)的数据等等。面对着日益复杂和庞大的数据,决策者们已经不能单凭自身经验来进行各种决策和制定各种营销或推广等方案。另一方面,各行各业内部的竞争也是越来越激烈,比如淘宝网商家间的竞争,移动、电信和联通三大电信运营商间竞争等。
所以,竞争如此激烈的情形下,挖掘出这些数据中潜在的有价值信息显得尤其重要。本文将借助逐渐兴起的数据挖掘技术来研究电信行业中的相关问题,包括客户流失和服务套餐制定等。主要利用神经网络方法来分析一小部分电信客户数据,利用神经网络方法来进行建模预测,最后由软件结果来提出相关的政策及更好的营销模式。
二、人工神经网络
与人脑类似,人工神经网络由相互连接的神经元(处理单元)组成。如果将人工神经网络看成一张图,则这些处理单元也称为节点。处理单元之间的连接称为边,反映了各处理单元之间的关联性,关联性的强弱体现在边的权值上。
神经网络种类繁多,可根据多角度进行分类。本文将采用BP神经网络来建立客户流失预测模型,BP神经网络是一种前馈式神经网络。前馈式与反馈式相对,区别在于,前者的网络各层间的连接是单向的,上层节点的输出是下层节点的输入,而后者连接也为单向,但输出节点的输出又作为输入节点的输入。另外,还将使用径向基函数网络(RBF网络)来进行服务套餐和基本费用的预测。RBF网络也是一种前馈式网络,与BP神经网络相比,其特点为:①BP神经网络可以有多层网络结构,而径向基函数网络是三层网络结构,除输入层和输出层,仅一个隐层,结构简单。②BP神经网络隐节点和输出节点有相同的激发函数,而径向基函数网络则不一样,它的隐节点采用径向基函数,输出节点采用线性加法器和Sigmoid激活函数,说明两者的分类预测机理有差异。③BP神经网络输入层和隐层、隐层和输出层之间权值都需调整,而径向基函数网络的输入层和隐层之间的网络权值为固定值1,也就是说,径向基网络的学习过程中,只有隐层和输出层之间的网络权值需要调整,所以,相对学习效率较高。
本文对神经网络处理问题的简单理解就是:将原始数据分为学习和训练样本数据输入,通过神经网络可以模拟得到一个分类预测模型,再输入新样本数据就可以得到想要的预测结果。本文中的预测其实就是基于规则的分类,借助神经网络方法对已有样本数据进行训练,可以得到很多规则,这些规则往往也是一个分类结果,通过这些规则来对新样本进行预测。
(关于软件操作或者文章若有疑问,可以随时在中国指数网的指数论坛给我们留言,谢谢!)