前言:中文期刊网精心挑选了统计数据分析范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
统计数据分析范文1
1.1与实际工作的融合性
机械加工企业的日常生产涉及多个方面的专业知识,总体可以概括为机械结构件的热加工和冷加工形式,包括热处理、电镀、装配、车、铣、刨、钻、磨、钳等工序和工种。所以,机械加工企业的统计管理者,需要对这些工序和工种有一定的了解,合理的分辨出各种生产信息和管理信息,并进行科学的统计,才能在本质上体现统计工作的意义和作用。
1.2监督管理的职能
机械加工企业的统计工作,主要表现在对企业各个部门、环节的经济和生产活动的运转状况,开展宏观和微观的检测,并根据检查结果对活动中出现的失控、异常情况进行分析探讨,考核企业的经济技术指标情况,明确部门的相关责任,为企业提供科学、全面、客观的信息资料,保证企业的经营决策更加科学性和先进性。
2、统计数据质量监控评价体系的建立
2.1建立评价指标体系
创建一套科学、合理且具有一定可行性的统计数据质量监控评价体系,是国内统计行业长期探讨并研究的课题。而对于企业评价指标体系的建立,必须要以能够彻底反映机械加工企业的实际生产经营活动为基础,确保统计数据的质量监控能够完全落实。鉴于这个出发点,企业评价体系的建立要满足以下四点要求:1)可行性。评价指标体系中指标的涵义要明确,涉及的资料要容易获得,计算方式简便,在保证各种指标能够相互衔接的同时,还要确保指标的稳定性。2)整体性。评价指标体系中涉及的内容要全面、评价要准确,并能系统地反映出企业各部门的生产经营情况。3)可比性。建立的评价体系需要通过对历史、行业等统计数据质量的应用情况中获取经验。通过对不同历史阶段的统计数据质量对比,可以了解到统计数据质量的发展与变化,并设置评价体系需要提高的幅度;通过对不同行业、不同单位、不同部门统计数据的质量进行对比,可使本企业的统计数据质量得以提高。4)可量性。统计数据质量的影响因素众多,这些影响因素有的可数量化,有的则无法进行数量化。所以,评价体系的建立应以可数量化的影响因素为基础,从大体上确保统计数据的质量。
2.2制定评价指标
统计数据使用者的不同,对质量的侧重点与评价标准的要求也不同。对于企业的管理者而言,统计数据的内容应包括生产经营的计划编制、成本核算等全面反映企业经营状况的统计数据,涉及的评价指标要具有适用性、全面性、及时性和准确性。1)适用性。评价指标的适用性是指统计数据在满足国家统计管理规范要求的前提下,能够完全适用于企业的微观管理需求。2)全面性。统计数据要系统的、全面的反映出企业经营生产的全孙惠鞍钢重型机械有限责任公司冶炼设备制造厂辽宁鞍山114021貌与全过程。3)及时性。数据的统计工作,要严格的按照统计报表中所规定的调查和搜集时间执行,并及时完成各种资料和报表的上报任务,以备企业管理者及时作出生产决策。4)准确性。统计指标要结合本企业的生产加工特点并按照统计工作流程,再经过科学的设计、调查和搜集,确保统计指标能够真实并准确的反映企业的经营状况。
3、原始资料偏差的测定方法
统计数据质量出现偏差大致可分两种情况,其一是人为的瞒报或虚报。这种情况属于系统性的偏差范畴,其内部具有一定的规律可寻;其二是随机性偏差。当企业的统计人员预测定原始资料是否存在偏差时,首先应判断这些大量的原始资料是否属于系统性的偏差,找出失真的原始资料并将其剔除或修正,确保评估结果的准确性,保证统计数据的监控质量。在技术应用上,可以采用方差分析的方法和思想,对原始资料中的失真情况进行判别,再经过多重比较或采用效应图的分析方法对这些资料进行筛选。在修正并清除部分失真的资料后,对原始资料再进行最终评估。利用方差分析结合多重比较或效应图的方法,可以有效的鉴定原始资料的偏差,确保统计数据的可靠性和真实性。
4、统计数据质量的保障措施
企业的统计工作属于基层统计,是国家经济统计数据的源头,是企业未来发展规划与决策的基石。因此,提高企业统计工作的评估质量,就必须要从统计的源头数据做起,通过严格落实一些列的监控保障措施,提高原始资料的可靠性和准确性。1)机械加工企业的统计数据质量监控体系的建立,应以国家统计的法津和法规为基本出发点,将企业的统计工作并入法制的轨道,依法统计、法制监控。2)机械加工企业要始终以“实事求是、质量第一、相互监督”为基本原则,对企业统计人员和领导的统计工作态度和道德进行监控。3)加强企业统计工作的基础建设,确保企业统计工作的标准化,监控制度的规范化。4)企业应加快统计工作的网络化建设并运用现代化的统计方法,实现统计工作的网络化办公。同时应增设统计信息的管理中心,对企业的统计工作和数据进行实时监控。5)加强对企业统计人员的业务能力培训,提高统计团队的综合业务素质,减少较高业务能力的人才流失,并对统计人员的日常统计工作进行有效监控。6)运用科学且合理的统计和分析方法,反复验证和评估统计数据质量的真实性和可靠性,对数据产生偏差的原因进行分析,对统计的过程进行监控。7)建立并健全统计工作的质量考核与奖罚制度,严格落实统计数据质量监控体系的相关规定。
5、结束语
统计数据分析范文2
文献标识码:A 文章编号:1672-7800(2015)005-0098-02
作者简介:陈冠星(1984-),男,广东揭阳人,硕士,海南软件职业技术学院网络工程系助教,研究方向为数据库、网络技术与物联网。
1 数据仓库简介
数据仓库(Data Warehouse,DW)是随着关系数据库、并行处理和分布式技术的飞速发展而产生的[1], W?H?Inmon出版了《Building the Data Warehouse》一书,给出了数据仓库的定义:数据仓库是一个面向主题的、集成的、非易失的、随时间变化的用来支持管理人员决策的数据集合[2]。数据仓库包含的是整个企业视图的粒度化数据。
数据仓库系统通常对多个异构数据源有效集成,集成后按照主题进行重组[3]。存放在数据仓库中的数据通常不再修改,用作进一步的分析型数据处理。
数据仓库系统的建立和开发以企事业单位的现有业务系统和大量业务数据的积累为基础 [4],其开发是一个循环迭代过程,通常需要企业有一定的业务数据积累,开发人员将这些历史数据通过ETL输入到数据仓库中,进行分析和统计,以建立决策支持辅助系统,为企事业单位管理者提供决策支持。
2 保险业需求分析
随着保险业发展及保险市场竞争的加剧,保险公司在管理和运营方面面临着更高的要求,来自监管、竞争、技术更新及全球化等各方面的压力不断考验着保险企业。保险业发展的核心动力表现在以下几个方面:①进入新分市场及提高业务质量;②巩固客户忠诚度,适应客户多变的需求;③高效的运营;④精确的风险及成本控制;⑤消除各种技术壁垒。
要做到上述目标并不容易。对高层管理者来说,由于统计口径的关系,很难获取一致性数据进行比对,很难及时监控到业务状况,不能有效地进行决策支持。对于业务部门主管与业务分析员,所需报表难以及时获取,即使取得的数据也难用于多视角、全方位地分析业务问题。对于IT部门来说,要不断帮助业务部门制作报表,时间相对较长,而且开发的报表越多,特别是分析型的报表越多,业务系统性能越受影响。
以某人寿保险有限公司为例,该公司的数据支持情况如下:
(1)保单管理系统中大致有50张左右的报表在运行,但随着公司业务的发展,数据分析及用于日常管理的制式报表与日俱增,报表数量将很快无法满足业务发展需求。
(2)各业务管理部门有各自的制式报表及统计需求,但在将数据汇总时,时常出现因统计时点不同、指标定义的理解差异等原因造成数据不一致,导致额外的数据校验工作。
(3)当前报表的IT实现基本上是按照单个报表需求来设计的,造成IT设计无法复用,报表开发缺乏整体规划,呈一种临时性状态,随着报表及统计需求的增加,IT相应的工作将与日俱增。
(4)因当前报表及数据统计都在保单管理系统中运行,随着需求数量的增加,保单管理系统将面临沉重的夜间批处理压力并严重影响日间日常业务操作的效率及稳定性。
针对上述系统现状,在建设中决定采用数据建模、ETL、数据分析以及数据展现等技术,实现风险管控分析、客户服务分析、客户维持分析、市场销售分析、综合分析和综合管理6大功能,达到以下目标:①代替原有手工报表方式,为业务人员节省时间;②提供精细的分析数据。业绩分析可以从营业部,钻取到营业组,甚至每个FC(理财顾问),保全分析可以分析每种保全项目的明细;③统一的分析口径。各部门统计指标,可以在统一的时间点上进行公司级汇总;名称一致的统计口径,可以唯一定义一种统计方式;④唯一的报表平台。从报表需求获取到报表需求分析以及最后的实现都在一个体系下完成,公司数据分析工作逐步系统化和实用化。
3 系统设计
统计分析系统采用灵活架构,在构建一个统一、稳定的企业级数据仓库基础上,分步构建各个独立的分析应用数据集市,满足灵活性、扩展性要求,系统架构如图1所示。
保险数据仓库是一个中央的知识数据库,包含来自寿险系统、团险系统、短期险系统和电话销售系统等源系统的源数据,数据模型分为3层:
(1)数据准备层(Staging Layer): 采用同源系统相似的数据结构存储源系统的每日增量数据。
(2)保险企业模型层(Insurance Enterprise Models Layer): 作为保险数据仓库的核心,相应的保险企业模型部署在该层。根据保险行业的业务视图,保险企业模型分为10个主题,根据保险信息的特性而非事务处理的目的来设计,企业级上所有保险业务信息根据历史版本进行记录。在数据准备层通过ETL(数据抽取转换装载程序)进行数据批处理,采用增量机制装载进入保险企业模型。
(3)分析数据模型层(Analysis Data Models Layer): 各种各样的数据分析需求归类到不同的数据集市,如市场及销售数据集市、运营效能数据集市、风险管控数据集市等。分析数据模型即为满足数据集市需求而采用维度建模方法特别设计的模型。分析数据模型从保险企业模型衍生而来,数据通过ETL 批处理,采用增量机制装载进入保险企业模型。
ETL采用增量机制,每日从源系统抽取变更数据至Staging层,接着将Staging层数据转换至企业模型和分析模型。在ETL批处理完成后,系统运行报表批处理生成报表并到相应的报表文件服务器上。
OLAP元数据管理工具: 提供OLAP 元数据管理工具,用于管理所有OLAP 业务元数据,包括指标定义、维度层次定义、指标与维度的关系及分析需求。通过使用这个工具可帮助保险企业统一KPI 定义及促进企业标准化管理,同时其管理的内容可作为统计分析系统所支持的知识库来使用。
OLAP平台:选择微软的SQL Server 2008作为OLAP平台。OLAP 工具支持分析的类型包括管理仪表盘、平衡记分卡、制式化管理报表、临时查询、数据挖掘等。
4 系统实现
4.1 ETL实现
ETL采用SQL Server集成服务来实现。Microsoft Integration Services 是一个可以生成高性能数据集成解决方案(包括为数据仓库提取、转换和加载ETL包)的平台。Integration Services包括生成和调式包的图形工具和向导;执行工作流函数操作和执行SQL脚本等任务;提取和加载数据的数据源和目标;清除、聚合、合并和复制数据的转换;管理包执行和存储的管理服务,即Integration Services;用于Integration Services对象模型编程的应用程序编程接口(API)。
4.2 多维数据实现
创建报表之前,需要通过SQL Server分析创建多维数据模型。之所以使用SQL Server分析服务创建多维模型,主要是为了实现对业务数据的即席查询。系统开发人员创建多维数据集以支持快速响应,并提供单个数据源以进行业务报告。商业智能的重要性不断提高,使用单一的分析数据源可确保将差异减到最小(如果无法完全消除差异)。
4.3 报表系统实现
报表系统实现使用了SQL Server报表服务,报表服务包含一整套管理报表的工具。报表工具在微软的开发环境中工作,并与SQL Server无缝衔接。通过报表服务,可以从多种不同的数据源创建各种不同样式的报表。
5 应用效果
该系统目前已经在某人寿保险有限公司正式投入使用,结果显示,该系统使业务数据的分析效率、分析能力大大提高,在一定程度上简化了业务人员数据统计工作,对公司决策支持起到很大的帮助作用,系统良好的应用价值体现在以下几个方面:①数据集成。数据仓库能够把来自多个不同子系统的数据进行有效集成,提供统一的、一站式的业务报表系统;②查询灵活方便。统计分析系统能够根据不同的需求进行条件过滤,并支持数据向上向下钻取,数据查询方式更加灵活,追溯更加简单直接,为业务分析人员提供了很大的便利;③安全性高。为了保证数据的安全性和可靠性,对数据仓库中的数据实行统一管理;④降低成本。统计分析系统的建立,可以代替原来的手工汇总操作,一次创建,只需要进行简单的维护就可长期使用。
6 结语
本系统开发及系统运行工作得到如下经验及启示:
(1)理念的转变。在数据分析上,需要从清单和简单汇总上升到数据分析,从单个部门分析到全局分析,从数据库到数据仓库进行分析设计。
统计数据分析范文3
[摘 要]以区域卷烟重点消费者调查为主要内容,阐述了消费者调查的战略意义与基本思路。进一步以XX市卷烟消费者调查为例,将重点消费者按卷烟价位划分消费群体,运用SPSS软件比较研究了年龄组成、职业组成、月收入、卷烟月支出等四项基础指标数据,对后续建立卷烟消费者数据库具有重要支撑作用。
[关键词]消费者细分 重点消费者 卷烟价位 统计指标
一、消费者调查
消费者细分是把握卷烟消费市场的重点,也是把握卷烟消费市场细分的关键环节。因此,实现营销服务向消费者延伸,与消费者进行更为直接的接触,构建起面向消费者的现代卷烟营销体系,成为烟草行业全面迎接市场竞争的重要工作。而打造一条与消费者的高效沟通渠道,建立与消费者的长效沟通机制,则是建立面向消费者营销体系的一项基础工作。在此项工作中,对卷烟消费者的选取应遵循自愿原则,对消费者的选择应包括不同价格消费人群、不同的消费习惯、省内省外卷烟购买习惯等。此外,所选取的消费者要进行筛选,确保进入消费者数据的消费者能保持长期的稳定性,并可以不断进行补充。与消费者的沟通内容及途径、配合要求及支持分别阐述如下。
1.沟通内容及途径
与消费者的沟通主要包括下列信息:烟草行业发展史、近期烟草行业发展策略、品牌发展、新品上市、服务意向、价格变动、市场管理、消费变化等,使消费者了解和掌握相关信息内容。此外,与消费者沟通的途径大致包括:(1)建立消费者沟通网站,让消费者自由登录浏览,获取其感兴趣的卷烟信息及政策法规;(2)自办杂志刊物发放,将企业掌握的近期最新消息向消费者传递;(3)定时向消费者发送手机短信和邮件,让消费者随时随地感受到关心与被关注;(4)品牌经理要对消费者进行定期的面对面拜访交流,根据消费者的服务需求提供个性化的服务营销;(5)定期召开消费者座谈会,双方客观、全面、开放地查找和解决问题,让消费者感受自身群体的存在和企业对消费者的关心。
2.配合要求及支持
以卷烟重点消费者为例,其配合要求大致包括:(1)定期填写市场调研表。能够按要求认真填写品牌经理发放的各项调研表格,并及时进行反馈,反馈内容要真实可靠,保障沟通的效率。(2)及时反馈卷烟消费信息。对于重点消费者在其消费群中发生的消费变化情况,可通过相关渠道及时进行反馈,反馈的信息要真实可靠。(3)进行卷烟的上市宣传。对于新上市的品牌,重点消费者在其消费群体中可进行宣传,了解其周围消费群体的消费态度并将收集情况向品牌经理进行反馈。(4)对烟草公司服务进行评价。对烟草公司的服务在其消费群体中的反映,重点消费者要进行收集并反馈。此外,与重点消费者的沟通支持方式有:新品卷烟发放试吸、邀请参加公司促销会议、人情关怀、重点消费者评优等。
二、消费者调查实例
对XX市重点消费者的调查,采用分群随机抽样法在该市所有辖区展开问卷调查活动,收集重点消费者信息,通过关键购买因素和对品牌的需求因素开展消费者识别,从性别、年龄、职业、收入、爱好、价值观、健康意识等方面进行消费者细分,在XX市所有辖区建立不少于2000户的重点消费者信息库。为此,设计并印制了包括15个问题在内的重点消费者调查问卷。进行问卷调查的时间共计15日,问卷回收率为84%,问卷有效率为96%。问卷涉及XX市7区2县1市,问卷涉及大中型企业、商业公司、政府机关、事业单位在内的13类行业。将重点消费者按卷烟价位划分为“10元~15元”和“15元~20元”消费群体,分别统计并分析年龄组成、职业组成、月收入、卷烟月支出等四项指标数据。
1.卷烟价位处于“10元~15元”消费群体分指标统计数据
(1)消费者年龄组成
表1表明,购买卷烟价位处于10元~15元的消费群体,年龄处于18岁~35岁阶段的人数最多,占59.97%;其次是35岁~55岁阶段,占36.8%;55岁以上的消费者仅占2.39%;18岁以下的消费者最少,占0.84%。运用SPSS软件对购买卷烟价位处于10元~15元的消费群体年龄组成频数分布情况进行数据分析,见表2。表2显示:此分布结构中偏度为0.533,表明偏度值大于零,此变量分布为正偏,偏度较轻微;同时,峰度为-2.98,表明峰度值小于零,此变量分布的峰度为轻微的平顶分布。
(2)消费者职业组成。表3表明,购买卷烟价位处于10元~15元的消费者群体,大部分消费者的职业是工人,占30.76%;其次是学生和自由职业,分别占12.92%和15.54%;再次是政府职员和商人,分别占9.41%和5.76%;较少的是农民和军人,仅占1.4%和0.14%。运用SPSS软件对购买卷烟价位处于10元~15元的消费群体职业组成频数分布情况进行数据分析,见表4。表4显示:此分布结构中偏度为0.63,表明偏度值大于零,此变量分布为正偏,偏度较轻微;同时,峰度为-0.528,表明峰度值小于零,此变量分布的峰度为轻微的平顶分布。
(3)月收入组成。表5表明,购买卷烟价位处于10元~15元的消费者群体,月收入大多为2000元~3000元,占40.03%;其次为1000元~2000元,占32.72%;再次为3000元以上,占16.15%,最少的为1000元及以下,占11.1%。运用SPSS软件对购买卷烟价位处于10元~15元的消费群体月收入组成频数分布情况进行数据分析,见表6。表6显示:此分布结构中偏度为0.125,表明偏度值大于零,此变量分布为正偏,偏度较轻微;同时,峰度为-4.021,表明峰度值小于零,此变量分布的峰度为较严重的平顶分布。
(4)月支出组成。表7表明,购买卷烟价位处于10元~15元的消费者群体中,每月用于购烟的支出大多为200元~300元,占45.22%;其次为300元以上,占23.74%;再次为100-200元,占21.91%;最少的为100元及以下,占9.13%。运用SPSS软件对购买卷烟价位处于10元~15元的消费群体月支出组成频数分布情况进行数据分析,见表8。表8显示:此分布结构中偏度为0.844,表明偏度值大于零,此变量分布为正偏,偏度较轻微;同时,峰度为1.833,表明峰度值大于零,此变量分布的峰度为轻微的尖顶分布。
2.卷烟价位处于“15元~20元”消费群体分指标统计数据
(1)消费者年龄组成。表9表明,购买卷烟价位处于15元~20元的消费群体,年龄处于18岁~35岁阶段和35岁~55岁阶段的人数最多,分别占47.9 %和46.31%;55岁以上的消费者仅占4.59%;18岁以下的消费者最少,仅占1.2%。运用SPSS软件对购买卷烟价位处于15元~20元的消费群体年龄组成频数分布情况进行数据分析,见表10。表10显示:此分布结构中偏度为-0.012,偏度值小于零且接近零,故此变量分布为负偏,偏度较轻微;同时,峰度为-5.893,表明峰度值小于零,此变量分布的峰度为轻微的平顶分布。
(2)消费者职业组成。表11表明,购买卷烟价位处于15元~20元的消费者群体,大部分消费者的职业为工人,占24.95%;其次为自由职业,占14.57%;再次为商人和政府职员,分别占9.98%占9.38%;学生和农民较少,分别占4.19%和3.19%;军人几乎没有,仅占0.2%。运用SPSS软件对购买卷烟价位处于15元~20元的消费群体职业组成频数分布情况进行数据分析,见表12。表12显示:此分布结构中,偏度为0.998,表明偏度值大于零,此变量分布为正偏,偏度较轻微;同时,峰度为0.111,表明峰度值大于零,此变量分布的峰度为轻微的尖顶分布。
(3)月收入组成。表13表明,购买卷烟价位处于15元~20元的消费者群体,月收入大多为2000元~3000元,占49.1%;其次为3000元以上,占31.54%;再次为1000元~2000元,占15.77%,最少的为1000元及以下,仅占3.59%。运用SPSS软件对购买卷烟价位处于15元~20元的消费群体月收入组成频数分布情况进行数据分析,见表14。表14显示:此分布结构中偏度为0.32,表明偏度值大于零,此变量分布为正偏,偏度较轻微;同时,峰度为-1.243,表明峰度值小于零,此变量分布的峰度为轻微的平顶分布。
(4)月支出组成。表15表明,购买卷烟价位处于15元~20元的消费者群体,每月用于购烟的支出大多为200元~300元和300元以上,分别占39.72%和37.13%;其次为100元~200元,占17.96%;最少的为100元及以下,仅占5.19%。运用SPSS软件对购买卷烟价位处于15元~20元的消费群体月支出组成频数分布情况进行数据分析,见表16。表16显示:此分布结构中偏度为-0.477,表明偏度值小于零,此变量分布为负偏,偏度较轻微;同时,峰度为-3.099,表明峰度值小于零,此变量分布的峰度为平顶分布。
综上,以XX市卷烟重点消费者调查为例,将消费者按卷烟价位划分为“10元~15元”和“15元~20元”消费群体,比较研究了年龄组成、职业组成、月收入、卷烟月支出等四项基础指标数据。上述研究结果,属于XX市卷烟重点消费者调查研究范畴,对后续区域卷烟品牌发展战略、卷烟消费市场细分、卷烟消费者数据库建立等均具有重要支撑作用,特别是对未来建立卷烟消费者数据库提供了宝贵的基础数据和对比研究成果。
参考文献:
[1]刘思峰,党耀国. 预测方法与技术[M].北京:高等教育出版社,2005.
[2]林杰斌,林川雄等.SPSS12统计建模与应用实务[M].北京:中国铁道出版社,2006
[3]统计预测与决策(第三版)[M].上海:上海财经大学出版社,2008.
[4]杜栋,庞庆华,吴炎.现代综合评价方法与案例精选(第2版)[M].北京:清华大学出版社,2008.
统计数据分析范文4
随着市场竞争的日益激烈,倡导所有的企业“以用户为中心、以市场为导向、以效益为目标”,企业的发展都面临着前所未有的挑战,要想在竞争中立于不败之地,就有必要不断增强企业的精确化管理和精确化营销。报表广泛应用于各行各业,不仅是整理和分析数据的有效的手段之一,也是企业单位决策的重要依据,在企业单位中有着重要的地位,也是信息化的最重要的组成部分。但是由于报表的种类繁多、形式复杂多变,给计算机的实现带来一定的麻烦。为了适应不断变化的格式,需要重新改写程序,通常需要为每一格式的报表定制编程,使得成本很高并且不具有灵活性。所以企业单位中数据统计分析报表系统的设计一直是研究开发人员的重点研究的问题。
报表情况概述
(一)报表的定义理解。报表,就是将内容信息(一般是数据、文字、图片等)以某种形式组织起来,并将组织结果呈现出来的文件。只要是做数据的呈现,无论数据存在于文本文件内、Excel文件或者是在数据库之内,只要可以将它呈现出来,打印输出格式化的数据信息,就是一份报表。报表作为一种信息组织和分析的有利手段,在各行各业都应用广泛,是信息浏览、分析、打印的有利工具,也是企业信息系统重要组成部分之一。
(二)报表的分类。按格式可以分为静态格式和动态格式。静态格式报表是由政府等管理组织制定的,格式固定而且复杂,格式与数据来源在开发时就已经固定,在使用时不需要改动,通过开发环境的自带报表组件、应用程序、第三方控件实现,比如财务报表等。动态格式报表数据量较大,数据和格式需要经常变动,用户需要自由定义,所以要有变通性和通用性,比如统计报表等。
(三)报表的构成。无论是静态的还是动态的报表都是由表头区、标题区、表体区及表尾区四个区域组成的。
(四)报表的内容。报表的内容包括两个方面,一个是静态不变的框架结构,即表头区、标题区、及表尾区,这些结构在一段时间内是不会改变的。另外一个是动态的数据,指将数据库内容,经过计算、查询及综合动态的操作,写入到表格中的相应位置。
数据统计分析报表的重要性
向企业的领导和决策部门提供高质量的、准确的、及时的数据统计分析报表是企业数据管理部门的职能。提供高水平的数据统计分析报表是数据经过深加工的最终产品,是统计数据、分析研究的有机结合,为企业领导和决策部门提供优质的服务,是他们分析经济运行态势,制定宏观决策和长远规划必不可少的重要依据。在计算机辅助技术迅速发展,世界市场动态多变,竞争日益激烈的世界经济环境下,企业的生存环境发生着巨大的变化,各种新概念新模式不断涌现,企业开始朝着全球化、敏捷化、智能化、信息化和个性化的方向发展。
传统数据统计分析报表中存在的问题
常规的数据统计分析报表主要通过纸质报表、Excel报表及专门定制的软件来呈现。而纸质的报表是最为常见的,大多企业的生产自动化的程度不高,计算机的应用不够广泛,工作人员接受创新事物的能力差等原因,所以大多的企业采用的是纸质的报表,数据的统计部门,根据需求手绘制定报表的格式,下发到其他的部门或者是生产的车间内,由部门的负责人或者是车间的管理人员按照要求填写所要的数据或者其他的指标性文字,再返回到数据统计部门。
Excel报表是在纸质报表上的一大进步,简化了纸质报表的很多程序。统计部门可以根据数据的要求在计算机上绘制电子表格,定义要求。通过网络下发到各部门和车间。数据的计算工作可以通过在计算机上引入公式完成。但是这种报表的统计分析工作还得通过统计人员手动汇总计算,统计分析形成最终的报表。
还有就是专门定制的软件,这样的软件并不是通用于所有的部门的,他们有着许多使用的局限性,例如制造企业的管理和设计软件能实现各生产部门的数据统计分析、形成制造业通用的报表,而不能灵活的完成其他形式的报表。
数据统计分析报表系统的设计
数据统计分析报表的设计最关键的环节就是报表的模板和报表的输出,下面就Excel报表模板及利用DDE通信、ACCESS数据库、OLE几种报表的输出方式探讨了数据统计分析报表系统的设计。
(一)利用Excel制定报表模板。通过运用Excel的制表功能,制定出不同的报表模板,不管是检定结果还是鉴定证书等样式的报表,每个报表的模板可以按照不同的数据需求,制定不同的结构,有报表格式、表头、表尾、框架等固定的部分。在制表的过程中由于计算机的智能会自动完成一些简单的合并、对齐、字号、字体等工作。但是对于某些非常复杂的表格编程,上述的自动化程序不起太大的作用,这时我们可以在制表之前就对表格的格式及公式定义做一些设定。这样,不仅减轻了编程与维护的工作量,还提高工作的效率。
(二)利用DDE通信来实现报表输出。Excel是办公必备的软件,也是人们最常用的表格、计算及统计的软件,它不仅查询、浏览的功能强大,而且其中内置的运算函数十分丰富,使用非常便捷。Excel在报表中应用,应用人员得心应手。动态数据交换是Windows平台中能够彼此进行交换数据与发送指令,是完整的通信协议之一。DDE方式的应用,使计算机中的各种程序通过动态数据交换的方式和MCGS来进行数据交换,是实现利用计算机中的资源对MCGS的功能进行扩充的方式,通过动态数据交换使程序读取MCGS数据库的数据,再依据要求把所读取的数据在Excel中显示出来,完成报表的输出。
(三)利用ACCESS数据库来实现报表输出。报表的制作通常是通过报表设计器或利用第三方的Activex的报表控件来实现。但是这两种方法都存在着这样那样不足:报表设计器只适用于制作一些不带有表格的报表,同时它必须与vB所提供的设计器进行结合使用,异常的麻烦;而利用第三方的Activex的报表控件来实现的,虽然相对简便,可以通过套用应用于多种的报表格式中,但是实用性较差,在实际应用中某些功能难以满足实际项目的要求。然而利用ACCESS数据库能解决上述的问题,利用MCGS数据库的访问功能,把采集到的现场数据输Access的数据库中,然后通过MCGS内部函数来调用已有程序,把Access数据库中的数据输入到的Excel的报表中,从而实现报表输出。
(四)利用OLE实现报表输出。它是一种对象连接和嵌入技术,是一种集成应用程序,是一种能够让用户共享各种不同程序的信息资源的技术。OLE技术可以将声音、图像、文字、影像结合于一体的。MCGS组态软件其本身的OLE功能可帮助用户在数据统计程序中十分方便地操作并读取组态软件所采集到的实时数据,从而制成报表。
统计数据分析范文5
关键词:海量数据 NoSQL数据库 高并发处理
中图分类号:TP311 文献标识码:A 文章编号:1007-9416(2015)07-0000-00
1 引言
针对海量移动应用数据构建一套可行的统计分析系统,从基本的数据统计,到深入的数据分析、挖掘,可以为移动互联网企业提供全方位的海量数据解决方案,帮助开发者更好的了解市场动向,了解用户的使用习惯和需求,从而创造出更有价值的移动应用。
2 系统分析设计
本系统的用户为移动应用开发者,系统的最终目的是为开发者们提供一个应用数据的统计分析平台,为开发者提供实时的用户统计数据和应用统计数据,开发者可以利用这些有价值的数据对应用进行调整,从而更好地适应不断变化的市场需求。系统主要完成应用趋势分析,版本分析,渠道分析,用户参与度分析和终端属性统计五部分。应用趋势分析提供对新增用户、活跃用户、留存用户和应用启动次数的统计分析功能,开发者从这些数据中了解当前应用的用户情况,判断出未来趋势。版本分析提供对当前应用所有版本的统计分析,开发者可以从中了解目前市场上的版本分布情况,从而可以对版本的更新迭代做出调整。渠道分析提供对当前应用各市场下载量的统计分析数据,开发者可以从中分析出各市场的推广情况如何,从而有针对性的调整应用的推广策略。
系统分为数据服务器、移动终端和WEB展示端三部分来完成,其整体的功能结构图如图1所示。在实现的过程中充分考虑解决海量数据处理的问题。通过使用非关系数据库NoSQL,Epoll技术及数据库优化技术解决高并发请求,有效地缓解了海量数据对整个系统的压力。系统整体在Linux系统下完成开发,综合运用当前主流高效的开发工具和技术。
数据服务器部分是整个系统的核心部分。数据接收模块负责从移动终端获取用户数据和应用数据,数据缓存模块用于缓存接收到的数据,数据存储模块负责向数据库从存储基础数据,数据统计分析模块负责对基础用户数据进行统计分析操作,处理后的数据用于网站端显示。移动终端部分用于获取数据。基于XML语言对Android界面进行设计,通过对系统函数和XML解析获取用户数据和应用数据,后将数据通过TCP/IP协议发送给服务器端,若网络不允许则将数据临时缓存,等待下一次发送请求。网站展示端向开发者展示最终的统计分析数据。页面设计模块使用CSS对整体风格进行控制,绘图模块使用highcharts,使用php和javascript向highcharts填充数据。
3 系统总体设计与实现
本系统分为数据处理服务器,移动终端,WEB展示端三部分来完成。其中移动终端负责采集用户数据和应用数据,将采集到的数据通过网络传输给数据处理服务器。数据处理服务器一遍负责存储数据,一遍对数据进行统计和分析。统计和分析的结果通过相应WEB端网站的请求反馈给开发者。整体的开发都在Linux系统下完成,移动终端部分使用Android平台,使用Java语言进行开发。数据服务器使用Python进行开发,数据接收部分使用Linux下GCC库,使用C++编写,数据库使用MongoDB。WEB展示端使用PHP语言进行开发,整体风格使用Bootstrap框架。同时使用Git作为版本控制工具,用GitHub作为版本容器,方便团队协作和代码更迭。
3.1 数据处理服务器架构
数据处理服务器需要实现数据接收、数据缓存、数据存储和数据处理四部分功能。
数据处理服务器负责接收移动终端发送过来的用户数据,通过高并发处理手段缓存到本地。数据库处理程序负责从缓存文件中读取数据插入到数据库中。数据库处理程序同时需要对基础数据进行统计和分析处理,存储到相应集合空间去。数据接收部分需要解决高并发请求。移动终端与服务器之间的通信使用TCP/IP协议,使用非阻塞的Socket连接来轮询用户请求。整体的底层架构使用Epoll库,能够很好的支持万级别的并发量。数据缓存部分使用文件直接缓存。为了避免文件同时读写的锁定问题,文件缓存按照一定的时间间隔写入不同的文件中去。使用脚本文件拷贝写入完成的数据文件到另外的文件夹用于向数据库中写入,写入完成之后再将文件删除。脚本使用python语言编写。数据写入部分也使用python进行编写,数据采用非关系数据库MongoDB。非关系数据库在解决海量数据处理的问题上有着独有的优势,降低了程序与代码的耦合度,同时还保证了数据存储的可靠性。使用python处理数据写入时需要用到MongoDB的python语言驱动,一般用pymongo即可。数据处理部分也使用python编写。程序从MongoDB中读取完数据之后,按照业务逻辑的要求对数据经行统计和分析。比如统计出某一应用一天的启动次数。将这些统计数据存入到新的集合中去,留作网站展示端进行检索。这样可以大大减少网站端实时搜索对数据服务器造成的压力。
3.2 移动终端架构
移动终端分为数据获取、数据缓存、数据传输和界面设计四部分。移动终端整体架构使用MVC设计模式。前端界面设计使用XML进行配置,控制层将获取到的数据一部分送至前端显示,一部分送至数据服务器进行存储。数据缓存使用SQLite保存未能发送至服务器的用户数据。数据获取指获取用户设备参数和用户应用数据,设备参数包括设备的型号、分辨率、入网方式、内容服务商、系统版本号等,用户应用数据包括应用的包名、版本号、启动时间、使用时长、渠道信息、页面访问路径等。数据缓存部分主要为了保证数据的完整性,因为用户的设备并不能时刻保持网络接入。当用户处于离线状态时,使用SQLite保存用户信息。当用户再次启动时检测是否有网络接入,当发现网络接入时将上一次的数据发送出去,同时清空SQLite数据库。数据传输使用TCP/IP协议向数据库服务器发送数据包。因为数据库采用NoSQL数据库,NoSQL数据库的存储格式为BSON(BSON是对JSON格式的二进制化),因此在数据发送之前需要将数据序列化为JSON格式。数据发送时需检测数据是否正常发送,如果没有正常发送则进行重发操作。界面设计采用Android标准开发模式,使用XML文件配置界面。顶部使用Google官方库ActionBar,中间部分为ListView组件,ListView的每个Item都为一个数据,表示移动终端获取到的某个变量。
3.3 网站展示端
网站展示端包括前端设计、数据处理和数据报表三部分。
前端设计以美观大方为目标,使用twitter前端开源框架Bootstrap。Bootstrap提供了优雅的HTML和CSS书写规范,它由Less写成,Less是一种优美的动态CSS语言。使用Ajax、jQuery、Javascript等前端技术,融入最新的HTML5、CSS3结构设计,优化UI的整体表现。数据处理使用PHP和 javascript。使用PHP语言的MongoDB驱动连接数据库,获取数据库中相应的数据,格式化成json数据之后再送给前端的javascript层。Javascript与前台界面经行交互,控制前台界面的展示效果。数据报表部分是整个网站展示端的核心,主要用户想用户展示各种类型的统计分析数据。包括柱状图、折线图、饼图等。图形的绘制使用开源项目Highcharts。Highcharts是一个使用纯javascript编写的图标库,可以便捷的在WEB网站显示交互性的图表。
参考文献
[1] 谭磊.New Internet:大数据挖掘[M].北京:电子工业出版社,2013(2):13.
[2] 艾荣荣.基于电信统计分析平台的关键性指标分析系统设计与实现[D].西安:西安电子科技大学,2010.2-4.
统计数据分析范文6
在我国经济结构调整和转型升级的时代背景下,高等学校通过产学研合作服务社会的功能和实现方式迫切需要转型升级。如2015年通过的《中华人民共和国促进科技成果转化法》修订稿,2016年国务院出台的“实施《中华人民共各国促进科技成果转化法》若干规定等,表明国家对成果转化的高度重视,而技术合同经费作为技术转移转化的一个重要指标,该指标可以体现一个学校技术转移转化的活跃度及市场价值。本文试图以江苏涉农高校近3年技术合同经费情况以来找到我校与其他高校的差距,并提出方法与对策。
1 近3年统计数据(万元)
数据分析:
1)根据省技术市场提供的数据,高校纳入统计的学校共计41所,大部分是理工类的学校或综合性大学,涉农高校共4所,南农,南林、扬大、江南。综合3年来看,我们几年都逐年进步,但和江南大学和扬州大学差距还是比较大.在技术转让上,我校的数据并不落后,但在技术开发上差距较大,这点,我们和林大比较相似,主要数据贡献体现在技术咨询和技术服务上,也体现农业或林业技术的公益性强的特点。但我校的技术转让又远超过林大,说明我们科研实力还是远超对方的。
2)技术开发少,一个是项目少,二是单项开发合同额也少。项目少说明我校参与社会服务或者说与企业的合作还是小众行为的,合同额小说明农业技术开发相比工业技术来说要价更低,这也是体现了农业技术商品化的特点。主要原因,可能是我校对于合同科研没有进行一定的考量。相对于纵向经费来说,横向经费不仅难拿而且在项目实现过程中付出时间和其他成本更高。有能力从事社会服务或进行合同科研的团队往往优先可能会考虑申请纵向项目,而且普通科研教师,往往纵向和横向机会都很少。
3)从客观上讲,扬大和江南大学经过并校及所在城市的关系,都已经成为综合性大学,无论在师资、学科数及规模上都超过我们学校。扬大和江南大学都有不少理工科的学科,江南大学以前更是轻工类学科强校,除食品学院外,其余大部都是理工科,而且都拥有科技园。我校目前的发展方向中世界一流农业大学,行业性大学发展,这点和南林有点相似。
4)起步较晚,重视度不够。2012年执行新的对外服务管理方法后,我校的合同额无论从数量和总额上都有了明显的提高,从2012年占扬大总额1/7,到2014年也占到扬大的1/4左右。但经过这两年运作之后,也有一个明显的问题,就是后续无力,既无科技园又无孵化器。
5)在机构上,扬大有社会合作与服务处与科技处科技成果推广科统共同负责社会服务与产学研工作,科技处主要负责各类产学研相关的项目管理,社会处主要负责各类平台的搭建。江南大学在管理上项目管理主要科研院内成果处和江大技术工程公司,平台搭建主要在产业技术研究院。
2 方法与对策
1)机构整合,把产学研处和成果处进行整合,从成果的源头进行,实现专利申请、持有、转化一条龙服务。另外一种模式,推广与转化一体化。在新成果新技术的推广过程,完成转化的过程。
2)在成果转化上,尤其是需要有产出的产学研合作,就要加强与农药企业、肥料企业、饲料企业、种子企业、农机企业等合作,这类企业在生产中能做到标准化、规模化、技术保密性强、产品明确、科研投入大、知识产权交易清晰,技术投入对于的企业的经营有着明确的影响的。主要是有涉及生产工艺或生产线的农资类企业。
3)要设立种子基金或者概念证明基金,以解决科研成果与企业产品开发之间的“死亡之谷”因为大学与企业本质的不同,所以大学和企业在技术发展和推销阶段信息、动机的不对称以及科学、技术和商业企业存在的制度距离,构成了大学研究成果走向市场的障碍。这个目前国家主要通过孵化器和科技园及一些配套的政策来解决。但目前高校如果没有相应的孵化器或科技园。可以先通过种子基金来扶持一批有商业化前景的成果来进行深入开发。
4)成立涉农科技企业的孵化器。与工业或其他领域的孵化器相比。涉农科技企业有其独特的要求。对于土地或实验基地有着一定的要求。现在工业项目的孵化器比较多,专门为农业的很少。
5)尤其是大的学科组,设立兼职的技术经济人。进行一系列的培训。可以负责所在学科组或学院的成果挖掘和技术交易等相关事务,可以通过工作量或交易额提成的方式进行激励。
6)继续建立技术转移中心。利用地方的资源进行有效的布点,深入了解地方的企业科技需求状态。筛选有效信息,促进高校教师或学科团队与地方及企业的合作。促进学校科研成果的转化及获得更多科研经费投入。
7)充分利用网络平台,现在各类技术交易平台比较多,要选择一些比较活跃的、有政府背景平台,尤其针对农业技术和农业企业的更好,作为我们成果转化的有效平台。
8)转化模式要多样化。在知识产权管理方法的允许下,我们要更多以债权或股权的方式进行转化。和资产经营公司和各类投资公司合作,进行以商业化为目标的成果转化。