大数据时代数据分析范例6篇

前言:中文期刊网精心挑选了大数据时代数据分析范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

大数据时代数据分析

大数据时代数据分析范文1

【关键词】大数据 数据分析 数据分析师

近年来,业界、学术界兴起了大数据讨论,一夜间大数据时代到来了。大数据给学术界带来了新的思潮,大数据正在颠覆着很多传统行业的模式,带来变革。有人预测,大数据必将成为商业、政府、科研、教育、医疗等各行业面临的一个挑战。在大数据时代,数据分析、数据挖掘工作面临着机遇与挑战,本文从数据分析的角度,结合国内外相关研究,试图回答大数据是什么,如何应对大数据的问题。

一、认识大数据

(一)大数据的宗旨:经过分析的数据才有价值

大数据要发挥作用必须经过分析,这是由大数据的4V特性(数据量大、数据类型多、要求处理速度快、低密度)决定的。也就是说,数据都是高维、低密度的,从单个数据中难以看出规律。因此,必须经过分析,针对高维进行降维,提炼大量低密度信息中的价值,才能发挥作用。否则,大数据背景下,反而更容易使得“活”信息混迹在大量“死”数据中被淹没。面向大数据的分析要“简单、迅速、规模化”。

(二)大数据的目标:实现基于数据的决策与资源配置

大数据最终要实现科学决策,基于信息对称的有效资源配置。随着大数据分析技术的发展,可利用数据来源从线下封闭的数据库、数据仓库扩展到开放性的O2O(Online To Offline)融合数据,可分析数据结构从原来以数值为主的结构化数据发展到涵盖文本、视频、音频等多媒体数据。从而,大数据将逐步改变我们的决策目标和社会资源配置方式。基于数据的科学决策是一贯追求的目标。然而,信息不对称是常态,因此传统决策目标是建立相对满意而非最优(决策科学家Simon提出),资源配置效率基于市场优于基于计划。大数据背景下,迅速获取分析更多辅助决策信息成为可能,因此决策目标可实现向最优的无限逼近,实现基于数据的“计划”资源配置将更有效率。

(三)大数据的角度:个性化服务+中观指数+宏观连结

目前发展大数据,主要有基于数据为客户提供个性化营销服务、预测中观行业或区域趋势指数、基于连结的宏观资源配置方案等角度。这不仅仅体现在阿里小微融资的个性化风控决策、高端品牌在线特卖品牌和定价动态决策(基于阿里巴巴网商活跃度指数和零售商品价格指数)、Discern group企业发展战略咨询报告上,还体现在阿里巴巴商务智能指数(预测经济发展态势)和基于公共气象数据的各行业资源配置优化服务上。

互联网金融是大数据发展各角度的前沿阵地。在金融领域,要实现从金融互联网向互联网金融的快速转型。传统模式下的金融企业开展网上业务,如:网上银行、网上理财,并不是真正的互联网金融。互联网金融是指通过互联网新技术为客户实现搜索或风控等服务增值,比较有代表性的是,消除供求双方结构不对称的P2P贷款,提高存取效率的保值理财产品余额宝。

(四)大数据的关键点:保证数据质量

要发展大数据分析,首先要保证数据质量。错误的输入必然导致错误的输出。没有数据质量,一切都是浮云。数据质量没有保证,是不敢用的。数据质量是一项耗时、费力的基础工作。

保证数据质量要求数据采集与清洗过程中秉持两大原则:相关性和低噪声。第一,大数据,数据并非越“大”越好,而是相关数据越“大”越好。特别是,在数据采集中,要以采集尽可能多的“相关”数据为目标,而非不加筛选越多越好。第二,大数据,首先数据获取时要保证不存在诱导倾向的干扰因素,同时进行去噪处理。

保证数据质量要建立数据的数据。针对数据质量建立数据标签,才有进步。有了对数据质量的数据,数据才能被决策者更为安全科学有效地使用。

(五)大数据竞争的核心:分析人才的竞争

大数据时代,作为一种资源,数据不再是稀缺资源。互联网、门户网站、社交网站、微博、微信等新媒体积累了大量数据,缺乏的是对这些数据的分析人员。缺乏专业的分析人才,即使守着数据的“金山”,也只能望“山”兴叹。因此,美国Turbo Financial Group采用最新的大数据分析技术聚焦被FICO遗忘的15%人群建模,阿里提出建立大数据分析的开放式平台,希望能够集结更多专家智慧,同时培养阿里分析人才,挖掘阿里数据“金矿”。

二、把握大数据

大数据对社会生活带来方方面面的影响,我们如何把握大数据时代的机遇,需要慎重对待大数据带来的挑战。总结起来,主要有三个方面:

(一)大数据时代,数据整理和清洗工作

(1)数据整理和清洗工作是数据分析的基础。大数据专家根据经验,普遍认为该工作是一项基础性工作,耗时多且简单,占到数据分析工作量的60%以上,是数据分析前提和基础。在此基上,数据分析工作需要对数据进行标识,进行深度分析,撰写专题报告,确保结果可以执行,最终落实到决策和实施。

(2)大数据时代,需要充分借助IT技术管理数据质量工作。在大数据时代,人工逐笔发现、解决数据质量问题的方式成本高、效率低,不可持续。要尽量规范化、系统化、自动化管理数据质量工作,将节省下的人力资源投入到新问题的研究中。

(二)大数据时代,数据分析的特点

(1)采用倒金字塔模式分配“思考、工作、分享”的时间比重。数据分析工作包括三部分:“思考”,分析实际问题,将实际问题转化成数学模型,提出解决方案的过程;“工作”,将解决方案程序化,得出结果的过程;“分享”,将分析的结果,转化为决策,付诸实施的过程。在时间分配上,金字塔结构或柱形结构的分布形式不是最佳结构,倒金字塔结构比较合理。即,思考的过程花得时间长些,可以减少后期工作量,少走弯路。

(2)通过数据分析进行科学决策。很多人存在误区,认为数据分析就是做报表、写报告。在大数据时代,数据分析不仅仅停留在此,需要进行深度分析,建立数据化决策的流程。要尊重数据、认识数据,但不迷信数据。在尊重数据、尊重事实的前提下,减少主观因素的干扰,快速做出数据化决策,这是一种能力。

(3)大数据时代,数据分析的要义是――简单、迅速、规模化。数据分析的结果要简洁、易懂;数据分析的时间要短,尽可能的自动化地出结果,要快速的满足客户的需求;数据分析的方法能够实现大批量规模化。优秀的数据分析师应具有全局的预见性,一有问题可以马上把该问题打成很碎、很多的问题,甚至把一个问题克隆出很多问题,从而与业务人员建立信任,降低工作量。

(4)从“死”信息中,分离出“活”的信息。大数据有数据量大的问题――产生大量的“死”数据。错误数据是指数据与实际情况不一致,异常数据是指数据正确但数据远离群体的大多数,这类数据情况的处理手段比较成熟。而大数据时代,大量数据是不活跃主体,即“死”数据。因此,需要从高维低密度数据中,提取“活”的信息,发现规律。防止由于“死”信息的存在,导致分析结果不能正确反映“活”的群体特征。

(三)大数据时代,数据分析师的培养

(1)培养核心技术人才,确保长期竞争力。美国在建立全国医疗系统时,将系统外包给了加拿大的一家公司,系统运行的第一天就出现了崩溃。美国政府为此对该模式进行了反思,概括起来有三点:①外包公司设计时只顾满足甲方的眼前利益,不会为甲方的长远利益考虑;②项目外包造成美国技术骨干人员断层,导致出现问题后自身无法解决;③采用该模式导致美国没有了核心技术。

因此,在采用项目外包模式的同时,需要掌握其核心技术。在大数据时代,从数据分析、信息管理、IT技术三个方面保持核心竞争力。需要培养和保持业务、产品设计、数据分析、数据架构等方面的骨干队伍。

(2)建立专业化的大数据分析团队。大数据分析的核心是数学建模,基础是实际业务,结果是自动化程序。在实际工作中需要正确、合理的使用数学建模的思维,构建以数学模型做为基础的数据分析,建立量化管理风险的理念。深刻认识并正确驾驭大数据分析,大数据分析的方法是处于不断发展过程中的,需要根据实际问题,结合实际数据,灵活构建模型。

参考文献:

[1]朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014,(2).

大数据时代数据分析范文2

关键词:大数据时代;大数据;统计学;数据分析

引言:

目前阶段,在计算机处理技术不断发展的背景下,在对规模较大并且较为复杂的数据进行处理过程中,人们已经逐渐掌握了方法与技能,并且能够在大规模的数据中找出具有一定价值的信息,所以,大数据时代已经来临。在数据时代中,在人文社科与人类自然科学技术等方面都会有较大的发展,同时也会一定程度上改变人们的生活与工作方式。除此之外,大数据时代也同样为统计学提供了良好的发展机会,但也存在一定的挑战。

一、大数据时代的概念

大数据时代的提出者是麦肯锡,他认为数据已经逐渐进入到各个行业与各业务职能的领域中,并且逐渐成为了主要的生产因素[1]。因此,人们在对大规模数据进行挖掘与应用的过程,也就意味着新的生产率增长的来临。虽然“大数据”在众多行业被广泛应用,但是,特别是在信息与互联网的领域中应用突出。

二、怎样理解大数据

(一)大数据概念界定与构成

大数据,即由于日常产生的数据量快速增长,使得数据库无法利用相应的管理工具对其进行管理与收集,最终导致在进行搜索、分析、存取、共享数据时具有较大的困难。

大数据的构成包括四部分,并将其总结为4V,即Volume,Variety,Value,Velocity[2]。第一部分是价值密度低,将视频作为具体实例来说,实现连续并且不间断的监控,其中有价值的数据信息只有一两秒。第二部分是数据体量极大,已经从TB实现了PB的跃升。第三部分是数据类型众多,主要包括视频、图片、网络日志以及地理信息等。第四部分是处理的速度超快,可以用一秒定律来解释。

(二)海量数据带来哪些挑战

第一,数据存储。由于大数据的数据规模是PB级别,所以,存储的系统也需要进行等级的拓展,并且可以通过磁盘柜或者是增加模块实现容量的增加。然而,目前阶段,数据的增长速度惊人,所以系统资源的消耗也不断增加,导致系统的运行效率有所下降[3]。因为对海量数据始终停留在分布式的存储阶段,所以,对于爆炸式的数据增长,原有的存储方案已经无法满足现有的数据变化需求。

第二,处理技术。由于海量数据的分布性与数据量与以往存在较大的差异,所以,原有的数据管理技术已经处于落后状态。

第三,数据安全。在互联网规模逐渐扩大的情况下,数据的应用已经出现指数级别的增长,所以,对于数据安全的保护与监控来说具有一定的难度。

(三)大数据相关应用与实践

第一,体育赛事应用。以2014年的世界杯为例,在充分发挥记者与编辑敏锐度的基础上,腾讯也利用对大数据的分析以及云计算等方式来为为其提供移动与社交的数据。与此同时,腾讯与IBM进行合作,并通过文化、赛事与球迷三方面来对世界杯球迷的关注重点进行信息的挖掘,进而实现新栏目的创作,并且在短时间内赢得了广大球迷的认可与关注。

第二,产品推荐应用。产品推荐的应用比较广泛,可以对客户信息、交易历史、购买过程等数据进行全面的分析,并进行有价值信息的挖掘。同时,针对同一产品的不同客户访问信息也可以进行挖掘。最终,通过对客户行为的分析,来确定消费者的共,这样就可以更好的为客户推荐产品。

除此之外,在产品推荐中,可以在对客户社交行为进行信息挖掘与分析的基础上来进行社区的营销。对客户微信微博以及社区活动中的偏好数据进行分析,并为其提供符合客户兴趣爱好的产品。

图一

三、如何分析大数据

(一)如何挖掘数据中价值

以匹配广告为具体事例进行分析,主要有两种数据。第一种是广告库,其中包括广告库以及广告的客户信息[4]。但是这种数据信息比较适合在传统数据库中应用。第二种是用户在观看广告后的行为。可以把以上两种数据进行有效的结合,并通过相应的算法来体现价值。在实践应用过程中,可以充分体会到第二种信息的重要作用。可以为用户提供其所需的信息,并通过群体智能以及群体行为对之前用户使用的效果进行分析,最终通过具体的反馈机制,将最优质的信息提供给用户,还可以进行搜索或者是查询信息。

(二)如何做处理与分析

第一,更新抽样调查的工作理念。由于大数据时代的数据样本是以往资料综合,所以,可以对相关事务的数据信息进行分析,进一步对总体进行了解,还可以更好的了解局部。同时需要解决以下问题:抽样框架不稳定,调查目的设定不合理、样本量受限[5]。第二,积极改变对于数据精确度的标准。在大数据时代的背景下,数据的来源比较广泛,并且对数据进行处理的技术也有所提高,所以,可以允许数据存在不准确的情况。大数据时代需要吸收多种数据,但并需要一味的要求数据精准。第三,合理转变数据关系的分析重点。由于大数据时代的数据规模比较大,而且结构也十分复杂,变量的关系也比较繁杂。所以,在对数据进行分析的过程中,不应该对因果关系进行仔细的分析,而重要的是对事物相关的关系进行分析。需要转换思路,对事物关系的形式与目的进行详细的分析。

四、 大数据对统计学科和统计研究工作的影响

(一) 拓展统计学研究领域

因为大数据时代的到来,所以会对各个领域产生一定的影响,同样给统计学带来影响。在统计学中,其主要的研究对象就是其所要认识的客体,是客观存在事物自身的数量特征与关系。其中,统计学研究对象最主要的特点就是数量性。然而,在传统的统计学当中,数据主要是试验与调查的数值。在大数据时代中,统计研究的对象不仅包括以结构数据度量的数量,此外,还可以包括一些无法用数量关系进行衡量的半结构与非结构数据,其中可以包括动画、图片、声音、文本等等[6]。所以,可以说,在大数据时代背景下,统计学的研究对象领域有所扩大。

(二) 对统计计算规范产生影响

在传统的统计学当中,一般是使用方差、平均数以及相对数等数据计算规范来真实反映事物量特征的,同时还可以反映事物量的关系与界限,能够通过数据计算规范来计算出具体的数值。但是,半结构与非结构的数据是无法通过传统数据计算规范进行计算的[7]。所以,在大数据时代的背景下,传统的数据计算规范也同样遇到了难题。

(三) 对统计研究工作的过程产生影响

1. 数据整理和分析

第一,数据审核。原有的数据审核主要的目的就是对数据准确性和完整性进行严格的检查。但是,在大数据的时代中,对数据的审核就必须要确保数据处理的速度以及预测的准确程度,同时还需要对数处理的规模进行准确的确定,也就是数据量级别的确定。除此之外,因为大数据自身具有不稳定性,并且十分混乱。但是,即使是这样,大数据也能够挖掘出信息内部存在的隐蔽关系以及有价值的知识。所以,大数据所反映的研究对象存在准确与不准确两种,但是,任何一种的数据都具有一定的价值,通常情况下是不需要进行替换或者是删除的[8]。

第二,数据存储。在以往的数据存储中,审核、汇总以及编制的图表等资料是重点资料,并且需要进行保存起来的。然而,大数据保存最主要的目的就是对存储的成本进行有效的控制,同时需要根据相应的法规计划来确定数据存储的规模。

2. 数据积累、开发与应用

第一,数据积累。传统统计工作主要是根据所制定的研究目的来对数据进行汇总与分类,并进行保存,这样可以更好的为后期数据的分析与查询提供有利的条件。但是,在大数据的积累中,具有价值的信息需要对大数据进行处理后才可以发现。不容置疑,大数据具有一定的复杂性,所以,在积累的过程中,不可以进行简单的处理。因为大数据的规模大,结构也比较复杂,无法实现简单的分类,而且,在对大数据进行简单整理时非常容易使其混乱,对其真实性产生影响,可能会丢失具有价值的信息。

第二,数据开发。大数据时代下的数据流动性极强,所以,其自身的价值有再生性。因此,大数据时代的数据不会贬值,反而会增值。为了能够对所研究的对象进行更深入的了解,就需要对其整合。

第三,数据应用。对数据的传统应用主要是为了对现象进行解释与预测。但是,在大数据时代,数据应用的核心就是在相关关系前提下的预测。

结语

综上所述,现阶段我国社会正处于大数据时代,并且对于社会未来的发展具有重要的意义。文章对大数据时代的概念与定义以及构成进行了阐述与分析,同时,对大数据的实际应用与实践进行了探讨。针对大数据价值的挖掘与分析处理进行了研究,最后列举了大数据对统计学科以及统计研究工作的影响,进而对今后大数据的数据分析工作提供了有价值的理论依据,并积极的推动了大数据时代的发展,进一步促进了社会的进步。(作者单位:中国人民大学)

参考文献:

[1]朱建平,章贵军,刘晓葳等.大数据时代下数据分析理念的辨析[J].统计研究,2014,31(2):10-19.

[2]张学敏.大数据时代的数据分析[J].电子世界,2014(16):5-5,6.

[3]李祥歌,王奇奇,郭轶博等.基于大数据时代的数据挖掘及分析[J].电子制作,2015(3):81-81.

[4]刘江娜.大数据时代:为什么数据分析能让你的企业脱颖而出[J].环球市场信息导报,2014(36):92-93.

[5]郭华庚,向礼花.大数据时代网络信息归档的元数据分析[J].贵州师范学院学报,2015,31(3):24-28.

[6]高书国.大数据时代的数据困惑――教育研究的数据困境[J].教育科学研究,2015(1):24-30.

大数据时代数据分析范文3

在采访中,首席信息官们总结出了5大影响他们进行分析的IT趋势。它们分别为:大数据的增长、快速处理技术、IT商品的成本下降、移动设备的普及和社交媒体的增长。

1.大数据

大数据指非常庞大的数据集,尤其是那些没有被整齐的组织起来无法适应传统数据仓库的数据集。网络蜘蛛数据、社交媒体反馈和服务器日志,以及来自供应链、行业、周边环境与监视传感器的数据都使得公司的数据变得比以往越来越复杂。

尽管并不是每个公司都需要处理大型、非结构型数据集的技术。VeriskAnalytics公司首席信息官PerryRotella认为所有的首席信息官都应当关注大数据分析工具。Verisk帮助金融公司评估风险,与保险公司共同防范保险诈骗,其在2010年的营收超过了10亿美元。Rotella认为,技术领导者对此应当采取的态度是,数据越多越好,欢迎数据的大幅增长。Rotella的工作是预先寻找事物间的联系与模型。

HMS公司首席信息官CynthiaNustad认为,大数据呈现为一种“爆炸性”增长趋势。HMS公司的业务包括帮助控制联邦医疗保险(Medicare)和医疗补助(Medicaid)项目成本和私有云服务。其客户包括40多个州的健康与人类服务项目和130多个医疗补助管理计划。HMS通过阻止错误支付在2010年帮助其客户挽回了18亿美元的损失,节约了数十亿美元。Nustad称:“我们正在收集并追踪大量素材,包括结构性与非结构性数据,因为你并不是总是知道你将在其中寻找什么东西。”

大数据技术中谈论最多的一项技术是Hadoop。该技术为开源分布式数据处理平台,最初是为编辑网络搜索索引等任务开发的。Hadoop为多个“非关系型(NoSQL)”技术(其包括CouchDB和MongoDB)中的一种,其通过特殊的方式组织网络级数据。

Hadoop可将数据的子集合分配给成百上千台服务器的处理,每台服务器汇报的结果都将被一个主作业调度程序整理,因此其具有处理拍字节级数据的能力。Hadoop既能够用于分析前的数据准备,也能够作为一种分析工具。没有数千台空闲服务器的公司可以从亚马逊等云厂商那里购买Hadoop实例的按需访问。

Nustad称,尽管并不是为了其大型的联邦医疗保险和医疗补助索赔数据库,但是HMS正在探索NoSQL技术的使用。其包括了结构性数据,并且能够被传统的数据仓库技术所处理。她称,在回答什么样的关系型技术是经实践证明最好用的解决方案时,从传统关系型数据库管理出发是并不明智。不过,Nustad认为Hadoop正在防止欺诈与浪费分析上发挥着重要作用,并且具备分析以各种格式上报的病人看病记录的潜力。

在采访中,那些体验过Hadoop的受访首席信息官们,包括Rotella和Shopzilla公司首席信息官JodyMulkey在内都在将数据服务作为公司一项业务的公司中任职。

Mulkey称:“我们正在使用Hadoop做那些以往使用数据仓库做的事情。更重要的是,我们获得了以前从未用过的切实有用的分析技术。”例如,作为一家比较购买网站,Shopzilla每天会积累数太字节的数据。他称:“以前,我们必须要对数据进行采样并对数据进行归类。在处理海量数据时,这一工作量非常繁重。”自从采用了Hadoop,Shopzilla能够分析原始数据,跳过许多中间环节。

GoodSamaritan医院是一家位于印第安纳州西南的社区医院,其处于另一种类型。该医院的首席信息官ChuckChristian称:“我们并没有我认为是大数据的东西。”尽管如此,管理规定要求促使其存储整如庞大的电子医疗记录等全新的数据类型。他称,这无疑要求他们要能够从数据中收集医疗保健品质信息。不过,这可能将在地区或国家医疗保健协会中实现,而不是在他们这种单个医院中实现。因此,Christian未必会对这种新技术进行投资。

IslandOneResorts公司首席信息官JohnTernent称,其所面临的分析挑战取决于大数据中的“大”还是“数据”。不过,目前他正在谨慎地考虑在云上使用Hadoop实例,以作为一种经济的方式分析复杂的抵押贷款组合。目前公司正在管理着佛罗里达州内的8处分时度假村。他称:“这种解决方案有可能解决我们目前正遇到的实际问题。”

2.商业分析速度加快

肯塔基大学首席信息官VinceKellen认为,大数据技术只是快速分析这一大趋势中的一个元素。他称:“我们期待的是一种更为先进的海量数据分析方法。”与更为快速地分析数据相比,数据的大小并不重要,“因为你想让这一过程快速完成”。

由于目前的计算能够在内存中处理更多的数据,因此与在硬盘中搜索数据相比,其计算出结果的速度要更快。即使你仅处理数G数据,但情况依然与此。

尽管经过数十年的发展,通过缓存频繁访问的数据,数据库性能提升了许多。在加载整个大型数据集至服务器或服务器集群的内存时,这一技术变得更加实用,此时硬盘只是作为备份。由于从旋转的磁盘中检索数据是一个机械过程,因此与在内存中处理数据相比,其速度要慢许多。

Rotella称,他现在几秒中进行的分析在五年前需要花上一个晚上。Rotella的公司主要是对大型数据集进行前瞻性分析,这经常涉及查询、寻找模型、下次查询前的调整。在分析速度方面,查询完成时间非常重要。他称:“以前,运行时间比建模时间要长,但是现在建模时间要比运行时间长。”

列式数据库服务器改变了关系型数据库的传统行与列结构,解决了另一些性能需求。查询仅访问有用的列,而不是读取整个记录和选取可选列,这极大地提高了组织或测量关键列的应用的性能。

Ternent警告称,列式数据库的性能优势需要配合正确的应用和查询设计。他称:“为了进行区别,你必须以适当的方式问它适当的问题。”此此同时,他还指出,列式数据库实际上仅对处理超过500G字节数据的应用有意义。他称:“在让列式数据库发挥作用之前,你必须收集一规模的数据,因为它依赖一定水平的重复提升效率。”

保险与金融服务巨头JohnHancock公司的首席信息官AllanHackney称,为了提高分析性能,硬件也需要进行提升,如增加GPU芯片,其与游戏系统中用到的图形处理器相同。他称:“可视化需用到的计算方法与统计分析中用到的计算方法非常相似。与普通的PC和服务器处理器相比,图形处理器的计算速度要快数百倍。我们的分析人员非常喜欢这一设备。”

3.技术成本下降

随着计算能力的增长,分析技术开始从内存与存储价格的下降中获益。同时,随着开源软件逐渐成为商业产品的备选产品,竞争压力也导致商业产品价格进一步下降。

Ternent为开源软件的支持者。在加入IslandOne公司之前,Ternent为开源商业智能公司Pentaho的工程副总裁。他称:“对于我来说,开源决定着涉足领域。因为像IslandOne这样的中等规模公司能够用开源应用R替代SAS进行统计分析。”

以前开源工具仅拥有基本的报告功能,但是现在它们能够提供最为先进的预测分析。他称:“目前开源参与者能够横跨整个连续统一体,这意味着任何人都能够使用它们。”HMS公司的Nustad认为,计算成本的变化正在改变着一些基础性架构的选择。例如,创建数据仓库的一个传统因素是让数据一起进入拥有强大计算能力的服务器中以处理它们。当计算能力不足时,从操作系统中分离分析工作负载可以避免日常工作负载的性能出现下降。Nustad称,目前这已经不再是一个合适的选择了。

她称:“随着硬件与存储越来越便宜,你能够让这些操作系统处理一个商业智能层。”通过重定数据格式和将数据装载至仓库中,直接建立在操作应用上的分析能够更为迅速地提供答案。

Hackney观察认为,尽管性价比趋势有利于管理成本,但是这些潜在的节约优势将被日益增长的能力需求所抵消。尽管JohnHancock每台设备的存储成本在今年下降了2至3%,但是消耗却增长了20%。

4.移动设备的普及

与所有的应用一样,商业智能正日益移动化。对于Nustad来说,移动商业智能具有优先权,因为每个人都希望Nustad能够随时随地亲自访问关于她的公司是否达到了服务级协议的报告。她还希望为公司的客户提供数据的移动访问,帮助客户监控和管理医疗保健开销。她称:“这是一个客户非常喜欢的功能。在五年前,客户不需要这一功能,但是现在他们需要这一功能了。”

对于首席信息官来说,要迎合这一趋势更多的是为智能手机、平板电脑和触摸屏设备创建适用的用户界面,而不是更为复杂的分析能力。或许是出于这方面的原因,Kellen认为这相对容易。他称:“对于我来说,这只是小事情。”

Rotella并不认为这很简单。他称:“移动计算影响着每一个人。许多人开始使用iPad工作,同时其它的移动设备正在呈现爆炸式增长。这一趋势正在加速并改变我们与公司内部计算资源交互的方式。”例如,Verisk已经开发了能够让理赔人在现场快速进行分析的产品,因此他们能够进行重置成本评估。他称:“这种方式对我们的分析产生了影响,同时也让每一个需要它的人随手就能使用。”

Rotella称:“引发这种挑战的因素在于技术的更新速度。两年前,我们没有iPad,而现在许多人都在使用iPad。随着多种操作系统的出现,我们正力争搞清楚其是如何影响我们的研发的,这样一来我们就不必一而再、再而三的编写这些应用。”IslandOne的Ternent指出,另一方面,为每一种移动平台创建原生应用的需求可能正在消退,因为目前手机和平板电脑上的浏览器拥有了更为强大的功能。Ternent称:“如果我能够使用一款专门针对移动设备的基于web的应用,那么我并不能肯定我将会对定制的移动设备应用进行投资。”

5.社交媒体的加入

随着脸谱、推特等社交媒体的兴起,越来越多的公司希望分析这些由网站产生的数据。新推出的分析应用支持人类语言处理、情感分析和网络分析等统计技术,这些并不是典型商业智能工具套件的组成部分。

由于它们都是新的,许多社交媒体分析工具可以作用服务获得。其中一个典型范例是Radian6。Radian6为软件即服务(SaaS)产品,近期已经被Salesforce.com所收购。Radian6是一种社交媒体仪表盘,为TwITter的留言、脸谱上的帖子、博客与讨论版上的帖子与评论中提及的特定术语以正负数显示,尤其是为商标名提供生动的直观推断。当营销与客户服务部门购买后,这类工具不再对IT部门有很严重的依赖性。目前,肯塔基大学的Kellen仍然相信他需要对它们高度关注。他称:“我的工作是识别这些技术,根据竞争力评估哪些算法适合公司,然后开始培训合适的人员。”

与其他公司一样,大学也对监督他们大学的声誉十分感兴趣。与此同时,Kellen表示,他可能还将寻找机会以开发专门用于解决学校所关注问题的应用,如监督学生入学率等问题。例如,监控学生在社交媒体上的帖子能够有帮于学校与管理人员尽早了解学生在大学里遇到的麻烦。Kellen称,目前戴尔已经做了这些工作,其产品支持公司探测人们关于故障笔记本电脑的推文。他称,IT开发人员还应当寻找一些办法将社交媒体分析得出的报警信息推送至应用中,以便于公司对相关事件快速做出反应。

大数据时代数据分析范文4

数字广告的大数据时代是什么样的?

谁都知道互联网是如何改变媒体的,而媒体内容的移动化也并不是那么难以理解。但对于媒体的商业模式演变,却鲜为人知。在大部分人的观念中,从互联网广告到移动互联网广告,和最原始的报纸开天窗登广告,也没有太大区别。

但事实并非如此。

在最初所有媒体内容被数字化,通过网页呈现给读者时,广告内容、方式和监控方式也都数字化了,这带来了广告业对于投放效果考核的革命——这是大家所熟知的。

但随后这种数字化的变革给了IT行业巨大的机会,而他们也就此介入并改造了广告业——这与消费者就比较远了,甚至于有许多广告主也未必弄清楚了这是什么回事。

最初,互联网媒体在自己的网页上设置广告位,并自行售卖。而广告主通过在广告链接上附加监控代码来统计广告效果——这一阶段还没有IT服务企业和大数据什么事。

之后大中型互联网媒体会把一些不太好卖的广告位,交给广告公司经营。而这样的广告公司,同时还为千千万万长尾的小型网站广告。这些广告位置实际上就是零散的网络内容资源。于是,为了管理这些广告资源,并能够优化这些资源的买卖,IT企业搞出了管理互联网内容刚和交易的程序系统。这类系统有许多不同的内在逻辑与算法,也应运而生了许多拗口的英文缩写。泛泛而言,Google AdSense也可以作为这种广告内容系统的一种。

基于这种通过IT系统来投放广告和监控数据的业务模式,2007年前后国内突然兴盛起“精准营销”热。看似高深莫测,事实上主要业务就是自己的软件开发团队做一个基于WEB页面的通用内容系统和基于cookie的数据收集系统,然后从事两项业务:一是把这种软件卖给广告公司或者重度依赖广告的企业;二是直接从广告主或广告公司那里拉投放,通过自己的系统来广告。严格意义上来说,多家从事精准营销的开发者,各自手中的数据是割裂零碎的,要说有多精准,其实也谈不上。但是必须承认当年这些萌芽阶段的广告数据服务为当下乃至未来的互联网广告业打下了基础。

这些以内容为主的IT产品,在之后的几年演变成为了互联网广告业所常用的SSP——中文名为“供应方平台”。可以把SSP理解为具有服务器端和多种客户端的软件,广告投放部门可以使用其客户端快速自由地购买媒体资源,并实时进行广告执行;而互联网媒体和站点也可以使用其客户端快速售卖自己闲置的广告位。当然还有很多不同的广告数据系统会接入SSP,就不必一一列出。

在2010年到2012年这个时期,国内的互联网广告基本形成了三个层次的业务:指定的广告位明码标价直接售卖;闲置的广告位进入SSP然后再分发到各个售卖终端;网站联盟式的广告分发。

而到2013年,似乎一切都改变了。

从选择受众到选择数据

无论是十年前互联网的兴起还是三年前移动互联网的崛起,从来不缺少航空母舰式的超级应用。但这些流量和用户量位于前列的大户,在操作起广告来,反而愈发地传统。以新浪为例,十年前卖网站首页广告和十年后卖微博App启动页广告的方式并没有太多改变。但广告主的预算比例越来越倾向于数字营销时,这种和广播电视报纸一样的售卖方式已经远远不能满足广告行业的需求了。

2013年,去中心化是所有新老媒体面临的问题,内容、流量和用户时间都在分散,而无数的数字媒体产品却努力在做聚合。广告行业等不了这种拉锯战,而广告主在经历过SNS、微博、微信的洗礼之后,似乎突然集体开窍了:

“我要买的不是广告位,而是看广告的人!”

于是,流行了五十年的广告业圣经“我知道有一半的广告费被浪费了,但我不知道是哪一半”很可能在2013年要被终结掉。

终结者是一种名为“需求方平台”的广告系统,英文缩写DSP。

DSP说新不新,其本质逻辑没有超出2007年精准营销热潮时的基本概念,无非是通过数据找到精准的受众,而数据来源也还是浏览器的cookie;但说老也绝对不老,事实上即便是对DSP应用较为深入的广告投放机构,其通过DSP释放的广告订单额也不到10%。而未来一两年DSP业务也不过占整个数字广告市场的12%到15%。

对于广告主而言,DSP实现的是这样一种功能:符合自己目标人群描述的用户,会在浏览网页或使用App时,看到自己的广告。这意味着在DSP系统内的广告位,可能在同一时间向不同的用户展示不同的广告——这听上去并不稀奇,剩下的只是这种对用户的匹配能精准到什么地步,以及最终转化效果如何。

这个问题并不是某一家企业能够解决的,甚至不完全是DSP的工作。谁都知道美国最优秀的计算机毕业生都被吸引去搞算法搞数据来试图更加精确地找到用户来做广告——这被诟病为导致当下创新力不足的同时,也意味着广告行业另一项颠覆即将到来。

DSP平台本身也在不断进行技术演进,这与广告主的需求演进相辅相成。在广告主从需求指定广告位到需求指定人群的过程中,广告诉求其实没有本质的变化。即便在最原始的报纸广告时代,“二次销售”的逻辑也是卖人群和流量。

但是随着通过DSP进行广告售卖的比例上升,广告主的需求具有这样的可能性:既不选择媒体资源,也不选择指定人群,而是选择指定数据。

这个阶段当然还没有到来,但是这个阶段才是真正意义上的数字广告大数据时代。具体而言,目前的精准广告无非是由广告主来限定受众条件,如年龄、收入、行业等来推送广告——这依然是选择媒介和受众的逻辑。但DSP的能量完全发挥出来,应该是这样一种场景:广告主的具体广告项目,被分解为一个连续的数据流,通过DSP匹配相应的数据使得广告持续发生并形成转化——这个过程已经和传统的广告形态完全不同了。

有这样一个案例:某奢侈轿车品牌以指定销售额为广告投放目标,通过DSP系统来寻找匹配的数据流,最终主要的流量载体确定在以平板电脑为主的移动端网页以及App上,在引起用户关注和兴趣后,数据告诉广告机构:需要一个活动页面和一个定制App。于是《NFS15:变速2》的iOS版在中国区成为了一个免费App。这个广告投放和互动创意的效果出乎意料,在执行中并不是想象的要利用数据来匹配广告内容,而是广告内容吸引了用户聚合成了一个社区——这个社区并没有一个具体网站、论坛或者群的载体,但在DSP后台可以看到这些数据的高度相似性和聚合——之后有针对性地推出试驾等活动,结果只消耗了40%的广告预算就达到了销售目标。

同样的案例还发生在化妆品品类中。DSP不仅仅让广告主找到自己想要的人,更重要的是提供了下一步广告和营销活动的目标和策略。“找人”这件事,从广告主以前的首要目标退居二线。现在的局面是,只要找到合适的数据并遵循其逻辑,就能完成广告主更终极的目标——销售额、品牌影响力甚至是危机公关。

总而言之,五年前也许数字广告和精准营销都是利用分解目标的方法论来消化广告预算达到广告目的,而DSP将开创的时代是整合过程直达目标。

数据产品的缺位与媒体大数据革命

但是,DSP业务在可预见的未来,占整个数字广告的份额不会超过15%。有资深人士认为直接的媒体自己直销广告位在今年仍会是互联网广告的主流,占比超过65%。

这个问题的关键在于,中国压根没有“数据产品”的概念。

无论是新浪微博还是阿里淘宝,其海量的数据仍是以原始数据的形态存在的。这个问题在广告服务机构那里也不会好到哪里去。在没有优秀的数据工具的情况下,自然也不会有特别有价值的数据产品。这就意味着,所有的广告服务机构只能自行收集一手数据自行分析处理。

这听上去很落后,但国内在广告数据业务上领先的公司,也有赖于此自行运营SSP以及用户行为的搜集与分析。于是一手数据上成为广告服务机构之间比拼的重要筹码。但客观而言,如果整个行业没有成型的第三方数据产品生态,这些优势劣势也只是小打小闹——毕竟,作为广告服务机构与同行的一得一失并不重要,关键是大广告主把更多的预算放进大数据的场子里来玩。

无疑,无论是亚马逊还是ebay,都已经在提供第三方数据产品服务。这些数据产品使得美国的数字广告业务更加发达,因为广告主可以通过这些数据优化自己的市场和广告策略,也更加信赖数字广告所带来的效果。换而言之,美国已经一只脚跨进了“从选择受众到选择数据”的转型中。

而另一方面,许多媒体机构对于“数据产品”的贡献更具有借鉴性。当媒体本身已经能初步处理自己的用户数据——包括用户描述、行为偏好、层次细分以及需求分析等。再将这些结果接入DSP时,广告主也更有动力利用这种新的数字广告体系与媒体合作。

大数据时代数据分析范文5

一、大数据在企业管理中的应用分析

(一)对产品进行创新,迎合并满足消费者的需求

在这种大数据时代的发展形势下,企业可实现对客户在产品需求上的信息内容的确切把握。其主要方式是通过当前发达的社交媒体平台来知悉了解客户在对产品使用之后所反馈到平台上的评价和感受,这种方式在真实性和便捷性方面更优越于传统问卷调查的形式。当企业通过平台获得这些消息反馈之后可立即对存在的问题进行改善和解决。另外,随着大数据时代在企业中的应用,企业中领导决策的作用和强度开始受到这种信息化时代的弱化,逐渐让传统的企业管理中决策者的绝对权利开始出现分化,而转变为公众作为决策主体,通过社会媒体平台获取公众意见,并形成大数据分析,从而使得企业的管理决策权更加公平和科学准确。而且在大数据时代下,企业能够第一时间对客户群体的数据和信息进行知悉,对客户的基因信息等进行快捷的接收了解,为企业提供针对客户的个性化建议,从而形成企业与客户之间密切的关联性,让客户买到满意产品的同时,也促进了企业经济效益的不断创收。

(二)对企业内部数据的挖掘并把握行业数据信息

企业信息化的发展应用实现了对扩大数据的有效利用。通过企业信息化系统的建立,让各类数据准确而可靠,同时能在最短时间内获得有效的信息数据资料。所以在大数据时代的应用下,企业可通过这种信息化的建立来对企业中的各类数据进行分析和共享,不断对企业的产品和服务进行跟踪关注,从而提升企业在产品和服务上的竞争水平,提高企业的整体发展水平。另外,企业可以通过大数据对客户的需求进行及时的知悉,而且即使在客户使用产品中还没有切实体现到产品价值的同时就能通过大数据来对其潜在的应用进行预测,从而实现对企业产品销售的市场动态的跟踪和应用,让企业产品能够更加具有市场竞争优势地在市场中立足。企业还能利用大数据来对同行业的产品价格进行曲线变化的分析和监测,从而优化自己产品的价格优势。

二、大数据时代给企业带来的风险和挑战

(一)对数据的实时分析

在经济全球化的发展趋势下,企业都在市场经济的发展中取得快速发展的机会,但在这个过程中,同时由于大数据时代的印象,要求以快速高效的方式来对数据进行实时有效的分析,从而实现对企业整体运营效益的把握,并随时根据市场的变化发展来调整企业运营管理的模式。企业的数据无限量在快速增长,这些数据的不断变化有待企业进行更加深入、全面地分析与挖掘。

(二)海量数据的安全保障

企业利用大数据的支持,实现了对企业大量运营发展的公司内部信息以及客户信息的信息化管理,这就需要在大数据的不断发展中,确保企业这些信息能够保证个人隐私、恢复、商业秘密和数据备份等的安全问题,这是当前大数据时代对企业的一种挑战和风险问题。

(三)数据驱动的决策制定

在大数据时代的影响下,其在很大程度上决定着企业决策的把握,通过对数据进行分析、决策,减少了过去通过传统的经验和领导主观上的直觉的决策风险,使得企业决策更加科学合理。很多企业在自身的运营发展过程中,对内部运营的结构和形势主要停留在大框架的信息汇总的掌握,并没有从整体上纵观整个行业与自身企业之间的深层次分析。如果有心的企业领导能够利用大数据来更加科学、全面、客观地对企业的整体运营进行分析和决策,那么就能从很大程度上来对企业运营风险进行有效的把控和降低。但当前通过大数据来对企业进行相关决策还存在一定的难度,因此,如何利用大数据来进行决策是企业面临的重大难题。

(四)整合多种类型的数据

在大数据时代,企业所收集的数据一方面包括了传统渠道所具有的基本结构框架信息;另一方面还包括信息化的社交媒体、电商业务以及互联网应用下的各种非固定结构的数据内容。在当前大部分企业的大数据应用下,企业的数据处理办法还仅仅用于结构化的数据处理,但随着数据化的时代来临,却不能对一些非结构化的数据进行处理。大量的半结构化数据、非结构化数据的处理对企业来说仍是巨大的挑战。

三、大数据时代的企业管理模式的创新策略

(一)企业首席数据官的培养

在大数据时代,信息时代最具核心利用价值的是数据技术人员。而且这个时代要求技术人员具备多种综合信息化数据处理的能力,包括具有市场营销知识、信息技术知识、运营管理知识等综合素质。在这种技术需求下,就产生了首席数据官,并将其岗位定在IT部门,并随着大数据时代的不断发展,这个技术岗位也开始被社会和企业接受。通过发挥这个部门职位的作用,来推进企业与社会的对话,实现对信息系统化的建立和挖掘。首席数据官主要是把企业的运营数据作为核心资产进行负责管理,根据来自网络流量、传感器、社会网络评论等多方面的数据来为公司的产品发展和企业决策做出分析和参考,并从数据的角度分析企业所面临的挑战从而帮助管理者。另外,随着未来信息化建设的不断构建和推广应用,企业要重视丢首席数据官的培养,并从多方渠道吸纳技术人才,为企业未来的发展奠定坚实的数据管理者。

(二)加强基于大数据时代的企业运营与决策管理工作

大数据时代,企业除了具备传统的数据平台之外,还需要建立信息化的非结构数据平台,包括社交媒体、文本、微博、影像等所建立起来的数据平台,从而更加全面地对企业运营和发展决策做出更加客观而科学的探索和挖掘,尤其是在企业产品营销、产品价值应用评价、声誉度分析等方面的数据化构建。企业应通过监控、数据监测来对产品与服务做好跟踪和分析,以此来引导企业不断创新改革和适应市场的发展需求。企业可融合不同类型数据,互相配合进行分析,改变传统企业管理模式的不足,将企业业务拓展出更加创新新颖的阶段。企业应善于通过大数据时代的应用便捷来做好对公司非结构化的数据分析以及关系实体的识别,通过这些内容不断提高企业在产品服务上的质量反馈和评价、品牌打造以及行业市场发展趋势等。另外,可把在社交网络、交互数据以及互联网媒体上的客户数据集中汇总起来,并结合传统数据,给客户提供更加全面的观点和评价,对客户的需求有着更加立体的了解,从而实现企业更加现代化的数据管理。

(三)建立生态化的企业网络系统

企业可以把生态产业链进行资源化、产业化、创新化的转变,并对企业生产运营中的供应商、客户和合作商进行重新整合,同时对企业内部的员工与领导层的关系也在管理模式上进行重新构建,然后协同创新价值链,将产品通过创新革新,提供更加新型的产品和服务,用大数据的功能革新企业管理模式,对整个企业运营管理模式进行了更加深度和现代化的改革创新。这种改革创新是在大数据时代不断在市场经济中的活跃应用所推动形成的一种必然发展趋势,要求企业必须为了适应社会发展所呈现出的信息化格局,来将目光从产品本身开始过渡转变到产品服务上,并上升到产品所创造的价值和企业发展在整个行业中的竞争力水平的层面,不断发展与产业链合作和其他元素。构建这种新型的管理模式必须善于对社交媒体和互联网进行综合有效的利用,才能适应大数据时代所发挥的作用,并对竞争协同进化的企业集团进行有限公司生产的研究,不断形成一种企业网络生态系统的可持续发展状态。

(四)树立以社会公众为决策主体的发展观

传统管理模式中,企业的整体运营把控主要是在中高层管理者的手中,他们决定着公司运营发展的一切事物的方向和发展目标。但大数据时代的来临,让社交网络和社会化媒体逐渐取代了这种传统管理者决策权的绝对性,让决策更加科学而正确。因此企业应逐步建立通过社会公众作为企业决策主体的观念,并不断将企业领导高层的视野拓展到广泛的社会公众,通过社交网络、移动互联网等平台的收集社会公众的建议和意见。

大数据时代数据分析范文6

关键词:供电企业;客户细分;大数据

中图分类号:F270 文献识别码:A 文章编号:1001-828X(2016)025-0000-02

一、引言

随着电网建设的不断扩大,信息采集技术的提高,数据精细化程度越来越高,电网数据呈现出指数级增长的趋势,如何对这些大数据进行快速准确的分析,挖掘有价值的信息,是当前学术界和产业界共同关注的主题。东莞供电局作为具备良好客户与数据资源的代表之一,将大数据与传统营销策略结合,以客户分群为载体开展全方位客户服务体系应用建设研究,利于提高整体客户服务能力和水平,提高企业经营效益。

二、客户细分的内涵及意义

客户细分是指通过有效收集、归类和分析各方面的需求,定义不同属性与行为特征的客户群,对客户价值、客户风险进行评估。依据评估结果将客户划分为不同的类别,并对其进行管理,同时,针对不同的客户群体为客户提供个性化服务[1]。通过客户细分,企业可以更好的识别不同的客户群体,区别对待不同的客户。客户细分作为一项先进的客户关系管理手段,在以客户为中心的商业经济的今天有着非凡的意义。

而客户细分所用到的技术就是数据挖掘(Data Mining),所谓的数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程[2]。运用数据挖掘技术可以分析客户的更多信息,捕捉更多有价值的信息,有效研究客户行为特征,实现对客户群体的精细化分解,利于为客户提供差异化服务,合理优化资源配置,实现良好的客户关系管理。

三、供电企业客户细分现状

1.现有电力客户划分方法[3]

(1)定性划分,主要包括以下几类:

根据用电部门属性分为工业、农业、交通运输和市政生活用电,每一大类又可划分为若干小类;

根据用电目的分为动力用电、照明用电、电热用电、各种电器仪器设备的操作控制用电、通讯用电;

根据客户重要性分为一类负荷、二类负荷、三类负荷。一类负荷是关系国民经济命脉及人民生命财产安全或停电会对其造成重大损失;二类负荷指其在国民经济中的地位不如一类负荷,但停电对其造成的经济损失也不小;三类负荷指其在国民经济中的地位不高,与人民的生命财产安全关系不大,中断其供电造成的损失较小。

根据负荷大小分为最大负荷,平均负荷和最小负荷。

(2)定量划分,主要包括以下几类

根据用电属性或用电行业分类,对用电量的大小和增长率进行高低排序,从而进行客户分类。

根据客户每月用电量、用电量同比增幅大小进行分类。

根据客户缴纳电费多少进行统计分析,从而找出重要客户。

根据电价高低进行排序,找出高于平均电价的客户群。

根据客户装接容量进行分类。

2.现有电力客户划分方法存在的问题

(1)分类指标简单

一方面,电力客户细分主要以定性分类方法为主,定性分类以便于市场管理为目的,没有综合考虑客户的经济价值;另一方面,使用定性分类对客户细分的主观性较强,不能对客户进行全面了解,划分客户的标准比较模糊,很难找出客户之间的差别,不能对客户进行精确划分。

(2)可操作性较差

一方面,现行定量分类和定性分类方法都主要考虑客户的社会属性,未充分评价客户的经济行为,其操作欠缺实际意义;另一方面,传统的分类方法都是非智能计算方法,随着大数据的发展,客户数据越来越复杂,传统方法很难科学规范的分析客户数据,适应现代电力营销需要解决的诸多问题。

结合以上分析,可以看出我国电力客户细分有了一定的基础,但也存在一些问题,不能适应快速发展的客户需求,这些也是本文所要解决的关键问题。

四、电力行业的大数据趋势

1.电力行业大数据分析的必要性

在电力行业,随着智能电网建设的不断深入和推进,电网运行产生的海量信息呈指数级增长,采集点越来越多,常规的调度自动化系统数十万点,而配用电、数据中心将达到百万甚至千万级。如果能充分利用这些实际数据,对其进行深入分析,便可以提供大量的高附加值服务,这些增值服务将有利于客户用电行为分析与客户细分、企业精细化运营管理等。

2.电力行业大数据分析的重要性

近年来,国家电网和南方电网用于电网的线路和变电站等方面的建设及管理投入逐渐增大,催生了庞大的电力信息化市场。随着电力智能化的发展,与IT行业嫁接,运用大数据等手段对电网进行实时监控和调节,已经成为时下发展的趋势。智能化电力系统应用范围拓宽,将产生大量的数据,目前电力行业面临的问题已经不是简单的数据量的题,而是如何从海量的数据中识别可用的数据,评估潜在的价值,以及电力信息化过程中的安全问题。

五、大数据下供电企业的客户细分

1.客户细分体系架构

规划好客户细分体系能帮助我们理清客户细分的目的与思路以及为什么要进行客户细分,应该如何进行客户细分等问题。本文将整个客户细分体系分为五个层次:

基础数据平台层:弄清楚哪些平台可以对客户细分提供数据支持与功能支持。如营销系统、决策支持平台等。

客户细分管理层:根据业务需求,确定分析的业务场景,如电费回收场景、停电风险场景等。

细分结果分析层:对得出的细分结果进行充分分析,进而得出群中的客户是否符合业务逻辑,分出的群体特征是否符合该群体的所有特征,以及产生的该群体对群内客户会产生什么影响等。

细分结果查询层:让业务人员与业务专家可以查询到细分结果,在实际应用过程中验证分析结果的有效性,通过反馈意见对模型进行调优,使模型更加完善。

细分结果应用层:主要体现客户细分模型的价值与应用,通过细分结果对业务进行指导,从而满足差异化服务的需求。

2.客户细分

基于客户细分架构体系,根据客户的属性特征进行有效性识别与差异化区分,对电力客户进行分群,分为重要客户、重点关注客户、大客户、居民客户、其它客户五群。在客户分群的基础上,按照客户价值、客户行为及客户需求等维度进一步细分,形成若干服务主题。在每个一级分群的基础上,从客户价值、客户需求和客户行为等维度出发,建立模型进行计算分析并分群,优先选择高价值客户、停电敏感客户、欠费风险客户、服务渠道敏感客户和用检风险客户五个二级分群,在二级分群的基础上再进行细分。

(1)高价值客户

高价值客户细分是提取营销系统里与大客户的基本情况、业务需求等相关的字段,运用聚类算法模型,综合考虑各方面因素,对高价值客户进一步细分。分为以下几类:第一群:客户比较沉默,生产情况存在波动,对暂停及暂停恢复业务需求相对较多的大客户群体。在缴费方式上倾向于去营业厅通过现金、支票等方式。第二群:特别活跃的大客户群体,从95598拨打次数、网上营业厅登陆次数反映出沟通活跃。第三群:经营势头良好,对高压增容业务需求量较大,功率因数不达标次数较多的大客户群体。第四群:相对沉默的大客户群,在缴费方式上倾向于通过网银缴费、银行代扣、自助终端等方式。第五群:发生过多次用检不合格的大客户群体。

(2)停电敏感客户

停电敏感客户细分是从部分已经表现出的敏感客户出发,研究各方面属性信息中的规律,并以此规律建立模型,用来判断全体客户的停电敏感程度。再将停电敏感度分数从高到低进行排列,划分不同等级的客户敏感度。根据各个分数段的模型预测提升度,将客户分为四个群体:潜在高敏感客户群、潜在次高敏感客户群、潜在普通客户群、潜在低敏感客户群。

(3)欠费风险客户

欠费风险客户细分是从部分已经发生违章用电的客户出发,根据其违章用电次数研究各方面属性信息中的规律,并以此规律建立模型,用来判断全体客户的电费回收风险程度。根据风险分数从高到低进行排列,划分不同等级的电费回收风险。根据各分数段的模型预测提升度,将客户划分为四个群体:电费回收高风险用户、电费回收中风险用户、电费回收普通风险用户、电费回收低风险用户。

(4)服务渠道敏感客户

服务渠道敏感客户细分是根据系统记录的95598咨询查询记录、营业厅业务办理类型、网上营业厅登陆时间、95598投诉记录、营业厅业务办理工单、网上营业厅办理的业务、短信渠道记录等分析出每个客户的沟通活跃度指数,得出服务渠道敏感客户细分为以下几类:95598偏好群、短信渠道偏好群、网上营业厅偏好群、未接触、营业厅偏好群、掌上营业厅偏好群。

(5)用检风险客户

用电检查主要针对非居民用户,采用决策树和平衡积分卡预测模型,得出用检不合格的风险分数。针对违约风险和窃电风险,分析客户各方面属性数据,挖掘典型的属性字段并结合业务经验建立风险评分卡。通过风险系数评分,将用检风险客户分为以下几类:用检不合格高风险群、用检不合格次高风险群、用检不合格普通风险群、用检不合格偏低风险群、用检不合格低风险群。

六、结束语

随着电力市场改革的不断深化,客观上要求电力企业更关注市场效益,关注重点客户资源。本文从东莞供电局的客户出发,在基础客户分群的基础上,挖掘不同分组客户的不同特征,对每一客户分群实现了进一步细分。客户细分为后续制定针对性、精细化的营销服务方案奠定了基础,有利于在标准化服务的基础上开展高价值客户群服务,提高客户满意度。同时,本文的客户细分也为各供电企业提供了一定的经验借鉴。

参考文献:

[1]汤兵勇.客户关系管理[M].北京:高等教育出版社,2007,36-39.