网络统计发展问题探讨

前言:寻找写作灵感?中文期刊网用心挑选的网络统计发展问题探讨,希望能为您的阅读和创作带来灵感,欢迎大家阅读并分享。

网络统计发展问题探讨

作者:阮 敬      单位:首都经济贸易大学统计系

网络统计是传统统计在新的信息传播媒体上的应用,具体指为研究总体特征而利用计算机国际互联网络进行的统计数据资料收集、处理、展示、等活动的总称。网络统计的发展是计算机科学(特别是其中的网络科学技术)与统计活动相结合而产生的新的领域之一。作为理论研究,目前主要集中于两个方面:一是考证传统的统计方式与利用网络进行统计的方式之间的优缺点问题;二是如何有效地完善利用网络进行统计活动的新方式,研究内容包括统计网站的建立、调查网页的设计、在线数据处理、统计信息系统等。本文从目前网络统计发展的基本状况出发,着重从宏观上阐述构建网络统计平台、设计网络统计信息系统的内容、方法、结构、步骤。

一、网络统计发展的必要条件及特点

网络统计作为传统统计与现代互联网络技术结合的产物,具有其产生的必要条件:首先,网络统计是经济发展的必然产物。首先,我国互联网络发展的突飞猛进,这为网络统计提供了发展的空间。其次,国际间的竞争日益激烈,统计信息的需求量不断增长,促使传统统计为了获得更多的国际国内信息而朝着网络统计的方向发展。其次,传统统计的局限性,决定了传统统计必须要向网络化的方向发展。传统统计的局限性不是指统计分析方法的局限,而是指统计资料收集、统计调查方式、统计信息传播等方面的局限。新兴的计算机互联网络借助其高效、安全、迅捷的科技手段,可以大大提高统计工作的效率,有利于统计信息的快速传播。最后逐渐趋于成熟的互联网络技术,为传统统计转向网络化发展提供了必要条件。

网络统计是在互联网络的基础之上发展起来的,除具有互联网络的特点之外,还具有其自身的特点,具体体现在:(1)即时性。网络统计可以利用互联网络快速传递的特点,进行即时的信息收集、信息反馈、信息分析和信息传播。(2)高效率性。网络统计可以利用特定的统计分析软件对收集而来的统计数据进行在线或离线的统计分析,提高统计工作的效率。(3)互动性。网络统计可以通过在线调查的方式,直接与被调查者沟通,大大提高了获得统计数据的可能性和统计数据的正确性。(4)广泛性。互联网络可以说是触及了我们社会生活的方方面面,我们可以利用互联网络对社会生活的各方面进行调查。互联网络连接着世界各地,我们可以利用其在全球任何范围内进行调查。(5)低成本性。与传统调查法相比,网上调查至少可以省去传统调查法中40%的费用[1]。利用高效统计分析软件对统计数据进行分析,也可节省人员费用的开支。从网络统计的几个主要特点不难看出网络统计发展的意义:根据市场的特点和互联网络发展的现状,利用现有网上资源进行网络调研,高效、迅捷地提供客观的统计信息,促进经济的稳定、快速发展。

二、构建网络统计平台

构建高效的网络统计平台,促进网络统计的快速发展主要体现在以下两个方面:

(一)构建统计数据收集和处理平台

1.建立专门的网络统计网站,进行网上统计数据收集和分析。网络统计网站要加大宣传力度,必须要得到被调查者的充分信赖,才有可能收集到良好的统计数据。要具有先进的网络技术和统计技术为保证,才能提高网站的公正性和权威性。

2.利用计算机抽样技术,确定抽样样本。模拟随机事件是计算机的主要功能之一,利用计算机的模拟随机功能进行随机抽样,不仅可以排除人为抽样的主观因素的影响,而且可以减少人工随机抽样的工作量,提高工作效率。

3.采用多种网络调查方法(包括电话网络),广泛收集统计资料。现阶段可以采用的网络调查方法主要有以下几种:(1)发送电子邮件法。用E-mail将调查问卷直接发送到被调查者的电子邮箱中,被调查者回答完毕后,由被调查者将问卷发回。这种方法在国外为几大专门网络调查网站(如SendMor-eInfo.com)所广泛地采用,但在国内却很少采用,其中原因可能在于被调查者对于不明邮件的高度敏感性。但是对于国内4580万[2]网民这个大样本来说,在国内发展电子邮件调查是十分有必要的。我们可以采取付费调查的方式,提高问卷的回收率。(2)直接站点调查法。这种方法主要有两种:第一种是直接建立专门的统计调查网站进行网上调查,这种方法的优点在于专业性较强,收集的信息比较准确;第二种是采用与各大主要网站联合的方式,在其主页上开辟专门的调查专区进行调查,这种方法的优点是针对性较强,调查面比较广泛。(3)随机IP地址调查法。运用计算机的随机模拟功能,随机产生一组IP地址,然后对这些IP地址进行直接的网上调查。(4)进行实时交互式的网上调查。这种方法主要体现为在网上开辟专门的由调查者主持的论坛,与被调查者直接交流,从而获得需要的统计信息。这种方法不仅可以获取特定的统计信息,而且还可以通过沟通加强被调查者对调查者的了解程度和信赖程度。

4.运用计算机技术,对统计资料进行分析。由于网络统计数据的样本量都比较大,采用计算机的技术势必会取得良好的效果。但是关键的问题是要选择好准确性高、权威性强、并且能用于网上实时统计分析的计算机统计软件,才能提供让人信服的统计分析结果。目前可供选择的统计软件很多,如SAS、SPSS、TSP、EXCEL、MINITAB等,选择这些国外著名公司的统计软件进行统计分析,可以提供良好的具有国际对比性的权威统计信息。

(二)构建统计信息传播平台

1.统一统计口径,采用国际通行的统计指标,提供具有国际可比性的统计信息。网络统计的统计口径应该与国际上通行的保持一致,这样有利于避免网络统计出现混乱,减少网络统计数据失真的可能性。同时,统一统计口径也是建立网络统计数据库的基础,是加快统计信息传播和扩大统计信息应用范围的必要条件。

2.利用网络资源共享的优点,建立统计信息数据库,加强大型数据库联合服务网络系统的建设。在国际政治经济活动、宏观经济政策分析、微观经济决策、投资决策等方面,需要大量的信息。在传统统计的条件之下,这些大量的信息是很难即时地收集到的,要想即时、准确地获得大量的时序数据和截面数据是几乎不可能的,必须要经过一个长时间的、消耗大量人、财、物力来广阔收集必要数据的过程。因此,要想十分及时、准确地作出预测或决策是比较困难的。随着互联网络的出现,高效、迅捷地收集和处理统计信息已经可以实现,我们可以利用收集而来的统计信息建立一个庞大的统计信息数据库,根据特定的标志进行分类,然后利用网络资源共享的特性,提供准确、及时的统计信息服务,从而可以加快预测和决策的进程,提高预测和决策的准确性。而加强大型数据库联合服务网络系统的建设是在建立统计信息数据库的基础之上进行的,其目的在于把各个分散的数据库通过互联网络有机地联合起来(如国内影响最大的中国科技信息所TRIP〈CHINAINFO〉,上网数据可有60多个[3]),为信息需求者查找信息提供方便,同时也可以节约网络资源。#p#分页标题#e#

3.建立交互式的统计信息咨询网站,提供统计信息在线服务。所谓交互,就是指统计信息咨询网站能够根据在线用户的实时需求,即时提供符合用户要求的服务。统计信息咨询网站通过这种交互的方式所提供的信息服务,能在最大程度上满足用户的需求,同时,通过直接与用户进行交流,也有助于统计信息咨询网站自身的发展。

4.积极开发高效率的信息查询和信息浏览软件。开发高效的信息查询软件可以为信息使用者方便快捷的从世界上任何一个地方提供最新的和最有用的统计信息。此外,统计信息是具有一定的价值和使用价值的,从某种意义上讲是一种商品[4]。这就必然要求对统计信息进行编码处理和加密,对信息进行保护。与之相对应的便是要开发出一套安全高效的信息浏览软件,通过软件对数据进行快速解码,以达到统计信息安全快速传播的目的。

三、建立合理的统计信息管理系统

信息在当代社会已经成为最重要的战略资源之一,建立合理的统计信息系统就具有了特别重要的意义。合理的统计信息系统是建立在网络统计平台的基础上的,它与传统统计活动的整个过程是密切结合的。在传统统计活动中,我们可以把整个统计信息的处理过程划分为数据收集、数据处理(包括数据整理和数据分析)、数据信息的三个过程。于是,就可以建立起与之对应的统计信息管理系统(见附图),迅捷而准确地提供信息和决策支持。

(一)利用统计数据收集平台,建立统计数据收集系统。由于在当代网络已经连至千家万户,网络统计的样本量可能非常的大,这样,我们就可以利用已经搭建起来的统计数据收集平台来收集数据,然后建立起庞大的数据库,用来存放各种调查的原始数据,为统计活动提供充分的依据。这个阶段又包括了几个子系统:设计统计调查组织方式和方案子系统、调查表与问卷设计系统、数据编码系统等。

(二)利用统计数据处理平台,建立统计数据处理系统。统计数据处理系统包括数据整理系统和数据分析系统两个方面。首先,对于数据整理系统来说,就是利用统计分组、统计数据汇总等方法对已经经过编码的原始数据库进行数据整理,使之条理化,符合人们的要求。其次,就是对已经整理好的编码数据利用统计数据处理平台进行高效而准确的统计分析,从而得出我们需要的统计结果。

(三)利用统计信息传播平台,建立统计信息系统。在以上两个步骤的基础之上,我们已经得出了可以利用的统计信息,但是要想获得完整而又相互联系的统计信息,还必须借助统计信息系统。系统是信息与信息需求者之间的桥梁,通过系统,可以把各个分散的分析处理结果数据库联合起来,建立大型的统计数据仓库,使得各种统计信息之间的内在联系得以表现出来。这样,不仅可以提高统计信息服务的质量,又可以为经济发展和社会发展提供更加可行、可靠、全面的统计信息。

(四)积极开发统计信息查询系统,按照需求者的要求提供高质量的信息。统计信息系统的统计信息虽然全面准确,但是对于有些需求者来说不需要这么多的信息或者说他只需要一些特定的信息,这时候,光靠系统是很难解决的,因为系统是面向大众的,的信息可以供各行各业所使用(有点类似《中国统计年鉴》),对于只需要其中一部分信息的需求者来说,为了获得其需要的数据就得在浩瀚的数据海洋中慢慢的寻找,其效率之低下是显而易见的。统计信息查询系统正是为解决这一难题所设计的,用户只要在系统内输入查询条件,计算机就马上会根据用户的条件在网络数据库中检索每一条统计信息,然后在极短的时间里把查询结果反馈给用户,这整个过程也许就在一瞬间就可以完成。目前,随着数据库技术以及ASP(ActiveServerPages)的广泛应用,在不久的将来,任何一台连在统计信息管理系统中的终端都可以随时随地准确获取人们特定的统计信息。

(五)建立决策支持系统(DSS),利用统计信息建立统计模型,并借助最新的数据挖掘技术(DataMining)为用户提供决策支持。决策是提供统计信息的最终目的,建立DSS可以加快决策的过程,更可以提高决策的准确性,为社会经济的发展提供强劲的动力。

四、应注意的问题及其解决的办法

网络统计已经成为传统统计发展的必然,但要使其朝着正确、健康的方向发展,还必须注意并解决以下几个显著的问题:

(一)提高统计人员的素质。统计人员的素质是影响统计数据和统计信息质量的主要因素。提高统计人员的素质,包括提高统计人员的思想道德素质、业务素质、市场意识素质以及法制意识素质等。

(二)提高网络的普及程度,采取合理措施,减少网上调查的有偏性。虽说互联网络已经有了迅速的发展,但对于我们国家来说,网络的普及程度还是很低的,人们的网络意识仍然比较淡薄。根据CNNIC2002年7月的最新中国互联网络发展状况统计报告,我国网民在全国人口总量的比重是微乎其微的(仅为3.60%),目前仍然有不少地区的人们缺乏网络互联条件,从网上获取信息的意识很淡薄。这些问题还需要我们花费较长的时间和采取有效的方法去解决,如:加大网络硬件设施的建设投入、加强网络方面的宣传并强化网络在社会经济生活中的角色、适当降低网络讯息资费以吸引更多的网民等。此外,网上调查由于具有其自身的特点(如上网人群中年轻人占绝大多数,18岁以下及60岁以上的上网人口只占总上网人口的17.2%),某些调查活动中的被调查者所组成的样本并不能有效地代表所要进行估计的总体,这种情况光靠提高网络的普及程度是避免不了的,这就难免会产生统计结果的有偏性甚至是错误。对于具体如何避免这种由调查工具产生的有偏性问题,有待日后专家学者进行商榷。

(三)网络统计必须要以传统统计的统计分析方法为基础,以现代计算机网络为平台。网络统计毕竟是传统统计的延伸,它所采用的统计分析方法应当与传统统计一致。无论传统统计发展到什么程度,它的基本原理、基本准则、理论基础、分析方法和原理均是一脉相承的。借助计算机网络技术发展网络统计只是对传统统计外延上的扩充,必须保持其原有的理论精髓[5]。

(四)提高网络统计数据库的安全防范意识。网络统计数据库作为一种信息资源,具有一定的价值和使用价值。笔者认为,要做好网络统计数据库的安全防范工作除了强化相关人员的安全防范意识以外还必须注意以下几点:第一,建立数据库的多重登录系统,设定对数据库的操作权限。第二,建立具有反追踪技术的防火墙,在不法分子侵犯数据库的时候提供保护措施,并且可以追踪到不法分子的IP地址,对其进行有效的制裁。第三,利用计算机反病毒软件对数据库提供保护,并及时查杀病毒。第四,利用计算机加密技术对数据库的信息进行加密,这样即使是不法分子通过不法途径得到了统计数据,但是没有特定的算法也不能读出其中蕴含的统计信息。第五,及时进行数据备份。#p#分页标题#e#

(五)加强对网络统计的监督,提高网络统计信息的质量。统计信息的质量主要体现在客观真实性与合法性两个方面。真实性是指统计信息必须客观公正准确地反映统计对象的特征。在实际的网络统计调查活动中,由于调查活动的双方并非面对面的进行,再加上互联网络自身具有的特点,使得被调查者有机会进行所谓的“做票”,从而使调查结果偏向于“做票”者的期望值,调查结果缺乏客观性。我们应当积极采取有关防范措施(如在调查网页上加入Cookies对象进行投票过滤),杜绝诸如此类影响统计结果真实性的行为发生,提高统计结果的客观性;合法性是指统计信息的来源与应用必须合乎有关法律法规的规定。在实际工作中,我们可以采取审查原则,对来源不明或不合法的数据源坚决不纳入统计信息数据库,坚决不向信息用途不明或不合法的客户提供统计信息。

(六)完善有关统计方面的立法,政策上给予充分扶持。笔者认为应该对统计过程的每一个环节中容易出现的问题进行立法,这样才能堵住违法的源头。对于刚刚兴起的网络统计活动而言,统计活动过程中的网上调查阶段利用网络作为调查工具时调查双方都具有隐匿性,因此笔者认为比较重要的是该阶段的调查内容和调查方法要合理合法,法律方面有必要对此作出强制性的规定以及制裁措施,才能真正做到从数据收集的源头上保证数据的真实性和合法性。此外,在网络统计发展的最初阶段,国家有关政策的规定和法制上的健全及完善将是带动网络统计发展的最基本的因素。国家统计政策和统计信息市场需求导向是网络统计起步和发展的基本杠杆,而现阶段统计信息的需求有着巨大潜力,但目前网络统计发展过程中所欠缺的是强有力的政策支持和政策引导。对于刚起步的网络统计来说,则更需要政府有关政策的扶植和引导,这些政策包括网络统计的发展导向,投资取向,行业规范与管理监督等都必须尽快地健全,来促进网络统计的快速、平稳、健康发展。