数据分析方法范例6篇

前言:中文期刊网精心挑选了数据分析方法范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

数据分析方法

数据分析方法范文1

[关键词]新媒体营销;企业转型升级;市场营销模式

1引言

新媒体营销是随着互联网技术不断发展而衍生的重要产物,它是以移动平台为载体,以信息技术为桥梁而实现的企业网络市场竞争的过程。这种模式的出现意味着企业与现代科学技术的接轨,是企业智能化数据化发展的鲜明体现。企业在新媒体平台和技术的指导下,能够依靠各类先进技术,转变自身的发展方式。其中最为突出的应用便在于企业对数据分析的引进。

2分析数据,确立市场受众群体

企业要想在众多新媒体平台营销中脱颖而出,就必须掌握符合自身市场定位的消费群体,要让自身生产的产品能够有广泛的接受度,要取得属于自身独有的市场信任感和公信力。这也就意味着企业要主动出击,积极地吸引消费者群体的关注和重视。如果一个企业发展自身新媒体营销的方法,仅仅是通过水军或者是买来的粉丝,或者是通过转发抽奖等,那么这个企业只会在短时间内取得一定的爆发式关注,无法取得长远的市场利益,也没有办法真正的给消费者留下深刻的印象,自然也不能根据消费者的喜好和兴趣制订出针对性的市场营销方案。这就需要企业通过数据分析的方法来明确自身的受众群体。[1]首先,企业要用数据分析的方法,对自身已有的市场发展基础进行系统的分析和总结,整理出自身的市场定位和发展特点,包括品牌形象、竞争优势、产品性质等。在此基础上,大致地规划消费者的群体范围,制订相应的宣传方案和宣传规划,同时也要注意把握时间的限制,要尽可能地寻求时间和效益之间的平衡。在这一过程中,企业要按照消费者的点击喜好和频率,来制定有针对性的宣传模式,这样可以更为有效地吸引消费者的关注。其次,企业要重视用户之间的传播和转发,企业要在吸引一批粉丝的基础上适当地进行转发和抽奖活动,扩大自身的市场影响力。最后,企业也要在这一过程中精确自身的市场定位,要动态地观察宣传的成果和绩效,要寻找大众的认同感。这便要求企业要借助数据分析和检索的平台,搜索与自身宣传相关的信息确立关键词和重点语句,并分析大众对于自身的评价和看法,更好地改进营销中存在的缺陷和不足。同时要在此基础上,让自身的宣传内容更加量化和准确,更好地提升在用户之间的口碑。

3分析数据,确立市场营销载体

根据上文所述,企业在新媒体营销中所进行的宣传是离不开固定的平台和载体的,移动平台是企业信息和展现自身形象的基础与保障。因此,企业要十分重视自身新媒体营销工具的选择,要运用数据分析的方法精准地统筹和管理市场营销的信息,推动网络营销能够适应自身发展的特点和规律。同时,数据分析方法还可以把企业自身经营的特点与不同的新媒体平台进行融合,对比其结合后的实际效益和成果,同时也可以与事先的市场规划设计相比较,在此基础上选择最为合适的企业新媒体营销载体。[2]之所以运用数据分析的方法来选择企业新媒体营销载体,是因为现阶段网络企业的发展形式多种多样,不同的企业也有自身不同的市场定位和产品特点,彼此之间相互独立,但是也紧密联系。这也就意味着,各类企业在共同运用新媒体网络平台这一方法进行市场营销的同时,也要根据自身的发展特点来选择适合自己的宣传载体和工具,只有这样才可以促进宣传内容的有效传播。当下企业利用新媒体进行宣传的主要形式包括纪录片、文字和图像等,也可以是多种表现形式的结合。尽管在宣传方式上具有多样性,但是否能真正的起到吸引用户的作用还需要依靠用户的主观能动性。这就要求企业在选择好自身营销载体的基础上,利用后台运行接收数据信息的方法,分析用户点击频率最多的板块和内容,总结出现阶段自身市场发展应当跟随的主流趋势,以及分析当下营销平台运行的成果。例如当下的微博小程序,就是企业依靠文字推送或者视频的方式,与用户建立线上的交流和沟通,在此基础上根据用户的点击频率来制订出更有针对性的市场营销方案。

4分析数据,确立信息展示模式

现阶段,有许多企业建立了自身运营的自媒体平台,有相当一部分是需要用户下载相应的软件,并注册账号才可以获得相关的信息。用户在注册之后,便可以通过在移动端登录的方法来完成后续操作。[3]但也正是因为这种登录方法的存在,用户会获得比其他平台更多的市场信息。这就在一定程度上激发了用户的厌烦心理,有相当一部分用户会由于时间的限制,直接略过企业所的信息。同时,也有一部分企业将自身的信息运用网页链接或者是二维码的方式展现出来,用户必须要在登录网站的基础上再一次点开网页链接,这就会让用户觉得浏览信息是一件非常烦琐的事情。因此,企业要重视自身信息展现形式的转变,企业要尽可能地选择简洁明了的形式突出自身信息的重点,要让用户可以看到自身营销的优势和特点。企业可以用数据分析的方法,统计出用户容易接受的信息展现形式,并按照类别进行划分。当下,用户容易接纳的是企业图文并茂的信息展现形式,可以是图片和文字链接的结合,也可以是视频和文字链接的结合,或者是将链接安置在图片上。企业就可以根据用户的喜好,将自身内容展现的形式进行改革和优化,例如企业可以将市场经营的方向和产品的性能,利用形象化的图片展示出来。让用户可以一眼就看到自身的品牌特色,提高自身的吸引力。在这一过程中企业要意识到信息真实准确表达的重要性,企业可以在原有的基础上进行适当地渲染和润色,但是不能虚假信息,不能夸大其词,不能让用户接受错误且夸张的市场营销数据。

5分析数据,确定市场发展价值

企业运用数据分析的重点不仅是要打造更为针对性的市场营销方案,更是要在数据信息的分析过程中审视自身的市场经营价值,分析自身的发展建设前景,评估现阶段自身方案的质量和效益,并以此来为未来的长远发展打下坚定的基础。因此企业要用数据分析的方法,对自身新媒体运营平台进行阶段性和周期性的监督,分析现阶段自身在市场竞争中的地位。[4]监督的内容主要包括平台粉丝的浏览量和点击率、粉丝的转发量、粉丝总量的增减、除粉丝之外的市场其他用户点击率,以及现阶段市场营销的经济利润和收益等。这样就可以在很大程度上帮助企业确定自身营销平台选择的正确性,分析自身市场发展定位的准确性。

数据分析方法范文2

关键词:供电企业;信息安全;大数据;分析方法;思路;探讨

前言

智能化的电网正在全面地实施建设。随着以大数据为中心的IT技术的不断融入,当前我国的供电企业展开了大数据分析的研究,以便更好地使得大数据应用到整个配网的规划当中。此外,还要根据电网的实际数据情况,把数据应用到智能变电站的建立、智能电网的调度及供电信息的采集等各个方面。进而有效地提高我国供电企业的管理水平及处理业务的能力。然而,信息化新技术在应用的过程中也具有一定的风险因素,所以需要建立大数据的安全分析结构,进而对数据进行相应的处理并把安全分析方法应用到整个供电企业的信息系统中去,进而更好地为供电企业的数据安全提供保障。

1供电企业的信息完全风险分析

大数据作为供电企业的管理工具是一把双刃剑,给供电企业管理提供了便利,提高供电企业的管理水平和管理能力的同时,也给供电企业带来了一定的挑战和风险因素。使得企业数据处理、收集及传输的风险等级提高。若企业内部的数据出现问题,则会使得数据在进行传输的过程中被盗取和窃听,这给企业的管理带来了很大的风险。除此之外,企业在进行数据中进行一定的储存和利用的过程中,也会由于大数据系统的内部维护不到位而带了很大的风险。若企业的数据被长时间地窃听,就会使得不法分子有机可乘,采用各种方法来对数据后台进行攻击和试探,并寻找系统的薄弱之处。最后实行致命的攻击,并造成系统的瘫痪。所以,大数据给在方便企业的信息管理的同时,也带来了一定的信息安全挑战。

2供电企业信息安全大数据所面临的数据安全的需要

传统的电力信息系统逐渐地走向了信息化处理的进程,智能化的电网模式带给了供电企业信息系统数据安全更大的要求。每次进行数据的访问时,都需要确定数据的访问权限,并核实访问者的身份,并查看是否被授权。供电企业的数据信息需要被完整地保护,并保障其不被删除或者恶意的篡改。一旦供电企业发生一定的突发事件,需要大数据平台对数据进行自动的备份,并使数据得到安全的保护。④要采取一定的措施来保证供电企业的数据在运行过程中的安全性不被破坏。⑤要切实保证整个供电企业的信息系统的网络安全,控制供电企业信息系统的基础安全信息网络和供电企业内部比较重要的业务系统的安全。

3供电企业的信息安全大数据分析思路

当前供电企业内容的安全信息系统逐渐地向着对抗型的信息安全系统方式转变,并使得电力系统的大数据网络可以积极地应对外界的攻击。并对潜在的敌人进行分析和识别,并归纳总结当前的供电企业的信息安全大数据的风险类型,从而采取相应的对策,并先发制人,提高安全大数据系统的防御能力。这就是当前供电企业的信息安全大数据的分析思路。大数据的分析和挖掘技术需要不断地融入到大数据的安全分析中去,下图是大数据的安全结构分析思路。供电企业的信息安全大数据分析思路是基于技术的安全分析和理念,是至今为止比较完善的大数据安全分析办法,是供电企业大数据的核心环节,是对相对分散的信息进行采集并实现存储,并对其进行一定的分析,最后把其分析结果进行分发,把所有的安全分析体系结合在一起,并实现安全技术的互动。

4供电企业信息安全大数据安全分析结构的数据处理

供电企业的信息安全大数据的结构具体根据业务的不同分为不同的数据库进行处理。关系数据库是当前最丰富的数据库,是进行供电企业信息安全处理的主要形式。而数据仓库属于一种多维的数据结构,可以允许用户进行汇总级别的计算,并对数据进行观察。事务数据库中记录了每一个事务,并同时附带了一些相互关联的附加表。文本数据库是对图象进行描述的数据库,文本数据库与图书馆数据库类似。而多媒体数据库则是对图像以及音频和视频的存储,并用于存放内容的检索。供电企业的信息安全大数据的存储往往需要先确定好处理的目标,并对数据进行量化的处理,最后对数据进行一定的评估,最后进行结果的展示。将大量的数据进行集中化的处理可以切实地反映出安全数据的指标,并根据指标对安全数据进行相应的评估。

5供电企业信息安全大数据安全分析方法

当前,进行供电企业信息安全大数据安全分析的方法有很多,随着大数据的技术体系逐渐成熟,目前对安全数据的分析算法也变得多样化,很多分析方法比如分类技术方法、序列分析方法等等对大量的数据的分析具有很好的效果。而对于不同的数据库可以采用不同的分析算法进行分析。比如,当利用关系数据库和事务数据库时,就可以利用序列分析的办法进行数据的挖掘和统计;而数据仓库除了需要进行联机处理以外,还需要进行数据的挖掘;文本数据库则是利用模式匹配以及关联分析等方法相互结合来进行数据的挖掘分析。

6结论

针对供电企业的信息安全的大数据分析有很多的途径,在进行供电企业信息安全的大数据分析时,需要对供电企业的安全数据信息进行全面预测,并利用多种分析办法综合处理。随着当前大数据网络技术的不断发展,根据大数据的分析特点进行安全分析的办法也在不断地完善。基于信息安全的大数据分析方法和思路具有很大的发展前景,安全大数据技术的不断革新,使得供电企业的防护网络更加地发达,并逐渐实现了供电企业的大数据信息安全的评估系统的完善,使得供电企业的信息安全大数据发展更为迅速。

参考文献

[1]钟志琛.电力大数据信息安全分析技术研究[J].电力信息与通信技术,2015(9):45-46.

数据分析方法范文3

【关键词】大型装备制造 项目型制造企业 数据分析 决策支持

在我国制造行业的快速发展下,提升制造企业的管理水平已经成为当前需要重点解决的问题。随着信息技术的快速发展,促进了制造企业数据分析和决策支持的发展。通过创建企业信息管理系统,可以有效提升企业的生产效率,使各个部门之间的工作更加协调。对分散、零碎的信息进行充分挖掘和利用。利用决策模型,对企业生产管理中遇到的问题提供决策支持。

一、基于数据仓库的企业对集成的应用

(一)面向主题性

完成事务型处理的任务是传统操作型数据库进行的数据组织工作,各业务系统间存在相对独立性,按照一定的主题组织数据仓库中的数据。对主题而言,其概念比较抽象,通常情况下,一个主题同时与多个操作型数据库有关系。例如,在确定企业的采购订单时,需要分析供需情况、库存信息、供应商信息等多方面的数据的综合关系,然后做出最终的决策。

(二)集成性

一般情况下,操作型数据库进行事务处理工作与某些特定的应用关系密切,数据库间具有相对独立性,通常具有异构性。抽取、清理原有分散的数据库数据,然后对其进行系统加工、汇总和整理最终获得了数据仓库中的数据,并保证存储在数据仓库内的信息与规范的信息相一致。例如,在查询销售数据时,系统会根据输入的条件要求,进行筛选、整理后提供出最终的决策参考数据。

(三)历史变化的反映

当前的数据是操作型数据库主要关注的,但是数据仓库中还包括很多丰富的历史性信息,系统将企业从过去某一时点(如开始应用数据仓库的时点)到现在各阶段的信息完整的记录下来,企业可以以这些信息为依据,定量分析企业产品未来的发展情况。例如,企业可以通过分析产品上季度的综合销售情况以及市场反映来决策下一季度的生产量。

二、决策支持系统的概况

(一)决策系统的含义

Decision Support System 即决策支持系统,简称DSS,是指对大量数据和数学模型与数据处理模型等有机组合众多模型进行综合利用,通过人机交互功能,帮助企业各级决策者完成科学的决策的新型系统。机器学习(ML)兴起于80年代后期,自动获取知识有了新方法。数据仓库(DW)和数据挖掘(DM)两项新的决策支持技术兴起于90年代中期。数据仓库的发展是以数据库为基础发展的,支持决策是其发展目标。知识发现(KDD)是面向数据库的机器学习方法发展的结果;“数据挖掘”是发现知识的关键步骤。决策的支持也是数据库知识的功能。随着决策支持技术的不断发展,决策系统逐渐完善。

(二)决策支持系统组成部分

R.H.Sprague 提出DSS的构成部分为人机对话系统、数据库与模型库的两库结构。随着决策支持系统功能的增强与扩大,对模型与方法进行分离存储,因此,数据库、模型库与方法库构成了 DSS。近年来,DSS 将人工智能技术、专家系统、知识工程的相关思想方法引进后,以原来的结构为基础,新增知识库,将推理机制引入,最终DSS的四库结构框架形成。

随着决策支持技术的发展提高,决策支持系统的体系结构不断发展健全,传统决策支持系统中的数据库、模型库与方法库、知识库与推理机、数据仓库、OLAP、数据挖掘技术等都是其组成部分,将引进显性知识与隐性知识同时引进到决策支持过程中是这种体系结构最关键的特点,保证推理的结果更科学合理,为决策层做出决策提供更高价值的参考依据。

三、实现数据分析与决策支持方法

(一)建立制造业决策模型库

当前比较常用的决策模型系统如GIS、PDM、ERP、CRM、SCM 等。在选择决策系统时,需要根据企业的发展战略来进行选择。通过决策模型,可以为企业的生产经营提供指导,使企业可以更好的把握市场、顺应市场。企业用户决策分析的存放模型是决策模型库。进行决策的模型的建立是以大型制造企业生产过程中的材料采购、库存管理、产品生产、市场营销、财务管理、人力资源管理、研发设计、质量管理、售后服务等方面的数据为依据。决策模型被授予一定程度的权限,对数据进行访问。然后以数据仓库中获取的数据为依据,对用户指定的目标进行决策支持。系统描述现有模型的组成元素与其组成结构的知识,模型构造过程中的各类推理算法被获取。以模型构建推理算法为基础,使匹配模型的框架由新问题的属性值填充,最终决策问题模型得以建立。

(二)实施制造业决策分析

对决策模型进行求解的过程就是决策分析的实施。通过理解决策问题获得用户需要决策的目标、意图等方面信息,然后利用合适的决策模型分析获得的数据,再根据规则与模型的求解算法获得有价值的决策意见,将其提供给用户。本系统规范描述每个模型包含的求解算法利用含有通用求解算法的模型很容易求解问题。但是如果没有求解算法或者不确定利用哪种算法进行求解,平台依据以前比较成功的相似的案例,将范例的求解方法求解问题。平台会详细记录取得较好决策效果的案例,并用数据层的公用数据库进行存放,这样能够及时调用成功的相似案例进行决策分析问题的求解。

(三)协作决策支持的多环节性

通常企业决策不会通过利用单一的决策模型得到。企业管理的决策方案案是利用了多模型的协作来实现决策的。协作决策的实施系统从两个方面着手。

(1)为实现有效的智能理解需要利用人机智能交互接口实现,分解复杂的问题,最终可以得到结构有序的子问题、与决策问题有联系的事实与数据、求解方案等;

(2)参与决策的模型可以利用平台进行调用,与决策相关的模型的选择可以通过分解的子问题实现,为了保证多个模型为特定的决策目标服务需要采用协调的合作机制。

数据分析方法范文4

关键词 自组织映射 组织特异性基因 管家基因 基因表达谱

一、SOM算法介绍

由Kohonen提出的自组织映射(SOM)的神经网络是神经网络中适合用于对数据进行分类的有效方法。SOM神经网络包含一个输入层和一个输出层,组织成一个二维的网格结构(图1.1)。该网络能够从任意一个随机选择输入的结点开始最终形成一个拓扑结构的映射,这个映射反映了输入模式的内在的关系。但是运用SOM有一些参数的限制,首先需要指定类别数目,对映射空间结点进行权值的初始化等。如(图1.1)所示,SOM网络是一个的映射,如果这个神经元被安排在一个平面网格上面的话,这个神经网络就称为二维神经网络,因为这个网络将一个高维的输入向量映射到一个二维的平面上面。给定一个网络,输入向量是一个维的向量,相应的第个突触向量的第个元素与输入向量的第个元素相连,这样,一个维的突触向量就和第个神经元实行连接。

图1.1 SOM网络的基本结构

SOM算法描述如下:

(1)令网络学习次数,赋予初始化权值向量一个小的随机向量值,对拓扑邻域()、学习率()进行初始化,设置网络总的学习次数()。

(2)当学习次数()小于总的学习次数()时,重复步骤3至步骤6。

(3)随机选一个输入向量进入网络进行训练。

(4)确定获胜神经元,相应的权值向量为与输入向量距离最短的向量,成为获胜神经元,输入向量与获胜神经元的最短距离为,定义如下:

(1.1)

(5)按照下式更新获胜神经元及其邻域内神经元权值向量:

(1.2)

与函数定义如下:(1.3)

(6)令,如果,回到第(3)步继续训练,否则结束训练。

二、数值模拟计算

本文以HUGEindex数据库中人7000多条基因在19个正常组织中的表达情况这19个组织中表达的基因为样本对其进行分析。不同组织下的全基因表达数据构成了一个7070x59的数据矩阵,其中每一个元素表示第个基因在第个组织中的表达水平值,行向量代表基因在19个人组织中的表达水平,成为基因的表达谱,列向量代表某一组织的各基因的表达水平。

(1.4)

本文运用SOM方法对人基因19个组织的59个样本进行聚类,SOM网络的拓扑结构见(图1.2)及参数选择见表(表1.1)。

图1.2 样本聚类SOM网络结构图

上图中,根据Genechip得到的人体19个组织的59个微阵列数据所得到的信息,我们采用4x5的二维拓扑结构的SOM网络对人体组织样本进行分类(其中第(4,5)个结点为空),图中每个结点的位置(结点位置用与输入模式维数相同的向权值向量表示,初始权值由系统自动产生)为各个结点权值尺度化之后所得到的位置。

三、结论

通过分类可以将芯片实验的59个样本按照人体组织类别分为19个类别,并且与采用层次聚类法所得结果进行比较,可以看出自组织映射的聚类方法与层次聚类方法比较,可以看出采用SOM网络聚类方法比层次聚类得到的结果更为明确,其分类正确率达到了92.2%,证明了SOM方法是有效的。

参考文献:

[1]孙啸,陆祖宏,谢建明.生物信息学基础[M].北京:清华大学出版社,2005:282-285.

[2]许东,吴铮.基于matlab6.x的神经网络系统分析与设计[M].西安电了科技大学出版社,2002.

[3]阎凡平,张长水.人工神经网络与模拟进化计算[M].北京:清华大学出版社,2005.:11-34,360-395.

作者简介:

数据分析方法范文5

【关键词】大数据 网络规划 用户价值 用户感知

doi:10.3969/j.issn.1006-1010.2015.10.004 中图分类号:TN929.53 文献标识码:A 文章编号:1006-1010(2015)10-0022-06

引用格式:李梅,杜翠凤,沈文明. 基于大数据分析的移动通信网络规划方法[J]. 移动通信, 2015,39(10): 22-27.

1 引言

随着移动通信网络的发展和移动互联网业务的增长,移动通信网络的各类相关数据呈爆炸式增长。借助大数据强大的数据处理能力和数据挖掘技术,通过分析用户行为、基于用户价值和用户感知规划设计网络,成为运营商提升网络竞争力的关键环节。

传统的移动通信网络规划需要借助海量的测试,分析总结网络存在的问题,再基于对市场和业务的经验预测,制定规划方案。该过程中,测试结果的普遍性和业务预测的准确性制约了规划方案的合理性,高昂的测试成本和冗长的测试工期影响了规划效率。

基于此,提出了基于大数据分析的移动通信网络规划方法,通过大数据工具分析海量数据,实现用户业务趋势预测、用户价值挖掘、用户感知评估分析,进而能够以用户为中心、面向具体业务场景展开通信网络规划。同时,该方法能够综合分析CQT(Call Quality Test,呼叫质量拨打测试)、DT(Drive Test,路测)等多种前端测试数据和信令数据、位置数据、用户业务信息等大量后台数据,克服单一数据分析的局限,不仅能够大规模降低测试成本、缩短方案制定时间,而且还提高了方案的科学合理性。

2 基于大数据分析的移动通信网络规划

体系

如图1所示,本文提出的移动通信网络规划体系可分为数据层、管理层、业务层和展示层,各层均与大数据密切相关。

2.1 大数据数据层

该层采用HDFS数据库和Hbase数据库管理通信网络相关的结构化、非结构化数据。数据主要来自于网管侧和计费侧,包括:核心网管数据、详单数据、网优平台数据、投诉数据、用户信息表等,这些数据经过预处理、算法处理后,按照标准数据格式存放在Hbase里面。

2.2 大数据管理层

该层基于Hadoop管理平台建立特定的数据预处理脚本和算法模型,实现对用户价值和用户感知数据的分析管理。

数据的预处理主要包括确实数据处理以及噪音数据处理。为分析用户价值和用户感知,本系统用到的大数据分析算法模型主要有层次分析法和聚类阈值法。

2.3 大数据业务层

该层是对用户价值和用户感知业务实施梳理与管理,对影响用户价值和感知业务的各维度进行分析并找出其关联关系。例如:用户价值与收入、终端、业务、套餐的各维度关联关系的梳理;用户感知与回落之间的关系梳理等。

2.4 大数据展示层

该层是以图表进行展示数据分析结果,辅助开展通信规划,重点是对用户价值与感知进行地理化展现、相关图表的输出。

3 用户价值与感知评价分析方法构建

3.1 用户价值评价体系构建

通信领域中的用户价值评估是一个多层次、多因素的问题,需要针对相关的业务构建评价指标体系,能够全面考虑用户的收入特征、层次结构、业务特征相互联系。

(1)建立用户价值评价体系结构模型――AHP分析法

采用AHP法评价用户价值时,首先是把用户价值进行梳理,建立出以业务为基础的层次结构模型,然后将用户价值分解成收入、套餐、业务和终端4部分。具体如图2所示:

用户价值评价模型的层次一般分为:

最高层:用户价值。

中间层:用户潜力和消费能力。

最底层:用户潜力包括用户的套餐指标与终端指标;消费能力包括用户的收入指标与业务指标。

基于以上的维度进行评分,可将评分落到各基站扇区,根据评分做出扇区化的图层,并将网络的价值扇区进行地理化呈现。

(2)确定用户价值评价模型各指标权重

以AHP法确定用户价值评价模型各指标的权重分为以下两步:

首先,构建递阶层次结构。如图2所示,目标层是用户价值,该层是建立评价模型的目的和追求的最终结果。一级指标层为{用户潜力,消费能力};二级指标层包括套餐、终端、收入、业务等。

其次,要建立判断矩阵。根据模型同一层级的相关指标体系指标可构造判断矩阵,将同一层次的指标元素按照其上层指标元素的重要性进行两两比较,判断相对重要程度。一般都会邀请通信专业人士和资深人员组成专家小组,依据他们的通信专业知识和研究经验进行评估,构造判断矩阵。

(3)综合权重计算用户价值

针对移动通信系统,服从一定社会(地理和逻辑)分布的具有不同消费能力、行为和移动特征的客户群体,在通信过程中形成的具有运营价值的业务活动区域叫做价值区域。

价值区域可以采用收入、终端、用户、业务(数据和语音)“四维度”,基于各自评分标准进行评分;将评分落到各基站扇区,再根据评分做出扇区化的图层,就可以将网络的价值扇区进行地理化呈现。

根据AHP法得出的权重以及各维度的评分标准,可以算出各小区的综合评分;再根据综合评分,可定义TOP30%为高价值扇区,TOP30%~TOP50%为中价值扇区,TOP50%~TOP80%为一般价值扇区,TOP80%以上为低价值扇区;最后,根据高低价值区域的评定,可以将网络的价值扇区进行地理化呈现。

该价值分析结果在规划中可进一步拓展到区域层面、微网格层面,从而实现网络建设目标精准定位,以更好地指导网络资源投放。

3.2 用户感知分析方法

(1)建立用户感知评价体系结构模型

如图3所示,与用户价值评价体系结构模型建立的方法相似,仍采用AHP分析法,用户感知评价模型可分为:

最高层:用户感知。

中间层:网络覆盖和网络质量。

最底层:网络覆盖主要为MR(Measurement Report,测量报告)覆盖指标;网络质量包括HSDPA(High Speed Downlink Packet Access,高速下行分组接入)用户速率与3G回落指标。

(2)确定用户感知评价模型各指标权重

与用户价值评价模型各指标权重计算方法相似。

首先,构建递阶层次结构。如图3所示,目标层是用户感知,该层是建立用户感知评价模型的目的和追求的最终结果。一级指标层为{网络覆盖,网络质量};二级指标层包括MR覆盖指标、HSDPA用户速率、3G回落指标等。

其次,建立判断矩阵。由专家根据经验确定权重。

(3)综合权重计算用户感知

用户感知可以采用MR覆盖指标、HSDPA用户速率、3G回落指标“三维度”,按照评分标准进行评分,再将评分结果落到各基站扇区,做出扇区化图层实现网络感知的地理化呈现。

3.3 价值与感知联合评估

为了更好地指导网络规划建设,可将用户价值分析方法和用户感知分析方法联合起来,建立4×3的价值与感知联合评估矩阵,针对不同矩阵中的网格分别制定对应的资源投放策略。

价值与感知联合评估矩阵中,不同网格的资源投放策略建议如表1所示(红色、绿色区域为重点投资区域)。

4 应用案例

在某运营商本地网的无线网络规划中,运用上述的分析方法对2014年6月的7 000万条语音原始详单、5亿条数据原始详单、238万条用户原始信息详单进行了大数据分析。

4.1 价值区域分析

(1)终端分布分析

网上现有用户约110万户,其中支持3G业务的终端56万户,占比50.7%,仅支持2G业务的终端54万户,占比49.3%;约一半用户终端不支持3G业务,3G终端使用者中有一半终端使用的是2G套餐。

(2)业务分布分析

现网用户的业务分布统计情况是:语音业务63%承载在2G网络上,37%承载在3G网络上;数据流量2G承载24%,3G承载76%。考虑到3G网络的业务体验更好,且网络资源更为丰富,应通过各种措施加快业务的迁移,促进2G/3G网络的融合发展。

(3)套餐分布分析

现有用户的套餐数据统计结果如图4所示:

从图4统计分布可知,低端用户贡献了61%的收入,但占用了73%的流量资源和65%的语音资源。低端用户单位收入消耗的网络资源更高,说明高流量不一定带来高收入;市场营销策略是影响用户规模、用户行为以及网络资源使用的主要因素,为此,建议规划与市场应紧密结合,以计划为先、网络先行,市场与建设互相配合、逐步推进。

(4)用户收入分布分析

从用户收入角度分析,结果如表2所示:

从表2统计分析可知,使用2G套餐2G终端ARPU(Average Revenue Per User,每用户平均收入)值低于2G套餐3G终端,3G套餐2G终端ARPU值低于3G套餐3G终端,3G套餐ARPU值整体高于2G套餐,3G终端ARPU值整体高于2G终端。

从以上“收入、套餐、终端、业务”四维度进行扇区化统计,各扇区统计结果如图5所示:

从图5统计分布可知,高价值小区数占比为30%,收入占比达到72%;中价值小区数占比为20%,收入占比达到16%;高/中价值全网小区数占比为50%,收入占比达到88%,高价值小区各维度占比均接近70%,各维度评估合理。

4.2 用户感知分析

(1)用户速率分析

网络单用户下载速率统计分布如图6所示:

从图6统计分布可知,全网速率大于1Mbps的扇区占比为90.3%,需重点关注低于1Mbps区域的速率改善。

(2)3G用户回落分析

3G用户回落指标统计分布如图7所示:

从图7统计分布可知,全网回落评估指标差的扇区占比为23.2%,需重点关注回落评估指标差的扇区的深度覆盖问题。

(3)用户感知MR覆盖分析

对MR数据中扇区级的RSCP(Received Signal Code Power,接收信号码功率)进行统计,其分布如图8所示:

从图8统计分布可知,全网MR覆盖指标差的扇区占比为20.87%,需重点关注MR覆盖指标差的扇区的深度覆盖问题。

4.3 价值与感知联合分析

综合以上价值区域及用户感知分析,按照专家法取定的权重对各维度指标进行综合评分,得到全网各小区的综合评估分析结果,统计各类小区占比如图9所示:

从图9统计分布可知,全网综合评估高/中价值扇区中感知中/差的扇区占比为34%,这部分区域将是本次规划中需要重点投入网络资源的区域。具体分布如图10所示:

5 结束语

综上所述,通过对现网用户的收入分布、终端分布、套餐、业务、用户感知等多维度分析,可精准定位高价值扇区及高价值区域,以进一步指导网络的精准化规划设计,引导投资的精准投放。除此之外,基于用户价值和用户感知的多维度分析还可以应用于市场营销、渠道规划等领域。

基于大数据的价值分析对运营商而言,是市场驱动、精细化管理的重要途径,有利于改变传统的经营模式,改善用户感知、增强自身竞争力,从而能够有效应对来自于虚拟运营和OTT业务的冲击。

参考文献:

[1] 黄勇军,冯明,丁圣勇,等. 电信运营商大数据发展策略探讨[J]. 电信科学, 2013(3): 6-11.

[2] 刘旭峰,耿庆鹏,许立群. 运营商获取移动互联网用户价值的策略研究[J]. 邮电设计技术, 2012(8): 9-12.

[3] 袁首. 多网协同下的电信无线网络规划方法研究[D]. 北京: 北京邮电大学, 2012.

[4] 曹艳艳. 3G无线网络规划[D]. 济南: 山东大学, 2005.

[5] 李勇辉. 大数据概念辨析及应对措施[J]. 互联网天地, 2014(1): 11-14.

[6] 龙青良,李巍,吕非彼. 基于用户感知的WCDMA无线资源效能评估方法研究[J]. 邮电设计技术, 2014(9): 33-39.

[7] 朱强. 3G无线网络规划和优化的探讨[J]. 通信世界, 2005(30): 57.

[8] 任毅. 3G无线网络规划流程[J]. 电信工程技术与标准化, 2005(11): 15-18.

[9] 郭金玉,张忠彬,孙庆云. 层次分析法的研究与应用[J]. 中国安全科学学报, 2008(5): 148-153.

数据分析方法范文6

关键词: 关键词模板库; 景区舆情; 满意度; 评价数据

中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2017)03-62-03

Abstract: This paper puts forward a method of analyzing public opinion and satisfaction on the evaluation data of scenic spots based on tourist demand template. By means of keywords template library building and expansion based on the template of tourism demand, the paper analyses and builds the model of the public opinion and satisfaction on the evaluation data. It solves the problem that unstructured content such as tourists' travels and evaluation cannot be efficiently searched and utilized by other tourists. It can not only provide tourists with scenic spots' comprehensive satisfaction value, but also satisfaction values in the specific area of cuisine, housing, transportation, travelling, shopping, and entertainment, and even more specific related content of the satisfaction value in those six aspects. Thus it helps visitors quickly understand the evaluation of the various parameters of the area.

Key words: template library; public opinion of scenic spots; satisfaction; evaluation data

0 引言

随着经济的发展,现在已经进入旅游智能化阶段和大数据的时代,游客通常通过查看媒体互动分享评价来决定自己旅游计划。然而,传统游客在游记中对景区景点的评价内容是非结构化、离散的,即难以采用一定的算法对其进行有规律地提取和组织,从而导致不能采用计算机智能对其提取分类。然而游客对“吃、住、行、游、购、娱”的评价获取需求颇为急切,因此需要采用一种新的技术来实现游客评价的自动化提取并对大量的数据进行高效的有价值的分析[1-3]。

1 本文提出的方法步骤及特征

本文提出一种基于旅游需求模板的景区评价数据分析舆情满意度方法,主要有基于旅游需求模板的关键词模板库构建(见图1)、关键词模板库的扩充(见图2)和针对景区评价数据的舆情满意度分析计算三个步骤。该方法的特征在于:所述的旅游需求模板主要由内容大类关键词、内容子类关键词和情感关键词构成,每个内容大类关键词下分属有其对应的内容子类关键词,每个内容子类关键词下分属有其对应的情感关键词[4-5]。

1.1 基于旅游需求模板的关键词模板库构建

主要由基于旅游需求模板引导评价的内容大类关键词、内容子类关键词和情感关键词构成,每个内容大类关键词下分属有其对应的内容子类关键词,每个内容子类关键词下分属有其对应的情感关键词。

关键词模板库初始由列举而成,所述的内容大类关键词包括吃、住、行、游、购、娱的六个类别;所述的内容子类关键词是在内容大类关键词的基础上构建的;所述情感关键词是对内容子类关键词的描述性词语。

1.2 关键词模板库的扩充

关键词模板库的扩充具体是采用以下方式对内容子类关键词和情感关键词进行扩充:

⑴ 在已构建的关键词模板库基础上,通过网络爬虫工具在内容大类关键词所在段落文字附近搜索内容子类关键词,将找到的在已构建关键词模板库中不存在的内容子类关键词作为新的内容子类关键词,并加入到关键词模板库中;

⑵ 在已构建的关键词模板库基础上,通过网络爬虫工具在内容子类关键词所在段落文字附近搜索情感关键词,将找到的在已构建关键词模板库中不存在的情感关键词作为新的情感关键词,对新的情感关键词赋权值后加入到关键词模板库中。

1.3 针对景区评价数据的舆情满意度分析计算

所述针对景区评价数据的舆情满意度分析计算具体是:由扩充后的关键词模板库通过网络爬虫工具搜索景区下的文字数据,抽取出内容大类关键词所在段落文字附近的内容子类关键词,再搜索抽取出每个内容子类关键词所在段落文字附近的情感关键词,从而获得所有情感关键词及其每个情感关键词对应的内容子类关键词和内容大类关键词,然后构建景区舆情与满意度的分析模型,通过景区舆情与满意度的分析模型获得以平均满意度值作为该景区的舆情满意度值。

2 景区舆情与满意度的分析模型

⑴ 先采用以下公式计算获得文字数据中所有评论中的关于某一个内容子类关键词的满意度值:

其中,表示第i个内容大类关键词下第j个内容子类关键词的平均满意度值,t是分值(1~5),表示i个内容大类关键词下第j个内容子类关键词对应分值为t的情感关键词的数量,Bij表示第i个内容大类关键词下第j个内容子类关键词,B{B11,B12,B13…B21,B22,B23…}代表内容子类关键词集合。

⑵ 再采用以下公式计算获得文字数据中一个内容大类关键词的满意度值:

其中,表示第i个内容大类关键词的满意度值,表示第i个内容大类关键词下第j个内容子类关键词的权值,n表示第i个内容大类关键词下内容子类关键词的数量,A{A1,A2,…,A6}代表内容大类关键词集合。

⑶ 再采用以下公式计算获得该景区的综合满意度值:

其中,Y表示景区的综合满意度值,i表示内容大类关键词的序号,i取值范围是1~6,表示第i个内容大类关键词下的的权值。

3 具体实施方式

3.1 基于旅游需求模板的关键词模板库构建

⑴ 内容大类关键词构建,主要包括吃、住、行、游、购、娱几个大类。

⑵ 内容子类关键词构建,主要是在内容大类关键词的基础上构建,比如和内容大类关键词吃相关的内容子类关键词有饭店、餐馆、快餐店、小吃街等。

⑶ 情感关键词构建,主要是在内容子类关键词基础上构建,比如和内容子类关键词‘吃’对应的情感关键词有味道很好,价格实惠,环境优美等。

3.2 关键词模板库的扩充

⑴ 基于需求模板引导评价的内容子类关键词库扩充,通过网络爬虫工具在内容大类关键词附近搜索相关的内容子类关键词并与已有的模板库进行对比,遇到新的内容子类关键词后,自动加入到模板库,比如遇到与内容大类关键词吃相关的新的内容子类关键词野味店等。

⑵ 基于需求模板引导评价的情感关键词库扩充,通过网络爬虫工具八爪鱼采集器,在内容子类关键词附近搜索相关的情感关键词并与已有的模板库进行对比,遇到新的情感关键词后,自动加入到模板库。

⑶ 情感关键词均已由用户进行赋分,给出分值(1~5),比如非常好/棒极了/美妙极了,这三个情感词表达的满意度是相同的,对应的分值都是5分,一般/凑合/还行对应的分值则都是3分;差极了/难受死了/简直就是受罪/再也不会去了,对应的分值则是1分。

3.3 针对景区评价数据的舆情满意度分析计算

⑴ 根据已有模版库构建评价体系表。内容大类关键词和内容子类关键词的权重和情感关键词的分值以及相同分值评论数量如表1所示,表中{}表示第i个内容大类关键词下第j个内容子类关键词对应分值为t的情感关键词的集合。

⑵ 通过网络爬虫工具搜索景区网页的每个帖子,按内容子类关键词,搜索所有相关的情感关键词,根据表1进行分类统计,把相应的情感关键词的数量记录到对应到中。

比如:通过网络爬虫工具搜到网页得到1000个情感关键词,有600个是与内容大类关键词‘吃A1’有关的,其中300个是与内容子类关键词‘味道B11’有关的,对应的情感关键词集{}及数量如表2所示。

由内容子类关键词满意度计算公式可知该景区关于吃的味道的满意度值为:

即:该景区关于吃的味道的满意度值为3.6,同理可以计算其他内容子类的关键词的满意度值。

4 结束语

通过这种方法得到满意度值,解决了以往游客的游记、评价等非结构化内容难以被其他游客高效搜索利用的问题,除了可以向游客提供某个景区的综合满意度值外,还可以向游客提供该景区具体的关于吃、住、行、游、购、娱六个方面的满意度值,以及比吃、住、行、游、购、娱更具体的相关内容子类关键词的满意度值,让游客快速了解该景区的各个评价参数。

参考文献(References):

[1] 维克托.迈尔舍恩伯格著,盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].浙江人民出版社,2013.

[2] 马建光,姜巍.大数据的概念、特征及其应用[J].国防科技,2013.2:10-11

[3] 黄先开,张丽峰,丁于思.百度指数与旅游景区游客量的关系及预测研究-以北京故宫为例[J].旅游学刊,2013.11:93-100