前言:中文期刊网精心挑选了云计算与分布式技术范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
云计算与分布式技术范文1
中图分类号:TP315 文献标识码:A 文章编号:1006-1010(2013)-05-0084-04
1 前言
随着电信企业的业务范围拓展、服务精细化要求和IT技术发展,在企业内部或互联的IT系统中,存在着飞速膨胀的海量数据。和以往对比,现阶段企业海量数据呈现出数据量更大、数据类型复杂、处理速度要快的新特征。与此同时,越来越多的企业开始重视海量数据的处理,研发出各种海量数据处理技术,从中发现巨大的商业价值,以Google、Facebook、淘宝为代表的中外互联网企业,走出了一条以免费的基础服务为根本、以海量数据运营掘金的信息企业模式。
这种现象可以称作“海量数据运营”,它是以海量数据处理为基础,以服务对象为核心,以客户关系为目标来进行信息的生产、交换,商业模式更有价值,企业运作更加优化,达到盈利或提供更好服务等商业或社会目标。
2 电信行业面临的困境和对策
在传统运营模式下,电信业务从技术到商业模式相对封闭,对于IT系统中产生的数据如用户话单、信令日志、运行日志等,除了部分用于提供给用户查询,大部分用于故障处理、简单统计。而对这些海量数据的分析,面临4大技术困难:
(1)数据量太大,用于存储和计算的设备成本高昂;
(2)没有合适的工具支持,传统关系型数据库只能存储几T数据、上亿条记录;
(3)随着设备变更、网络升级、业务更新,原始数据模型经常变化,构建结构化模型并同步更新的难度非常大;
(4)分析结果无法快速有效地实施到网络或业务平台。
随着3G业务的发展、终端渗透率的提高和IT技术的进步,电信业务从技术到商业模式越来越开放,业务的盈利能力越来越依赖前面的终端和后面的业务平台。苹果、三星等智能终端厂家成为运营商争先拉拢的对象,移动互联网带来的大部分增量利润更多地涌向了创新型技术公司,而海量数据流量却冲击着电信网络的承载能力。
业务承载量增长、收入增长、利润下滑,变成全球电信运营商普遍面临的困境,把网络建好、坐等收钱的好时代已经过去,运营商的主导地位岌岌可危,被管道化的趋势越发明显。
面对这种局面,运营商开始提出“智能管道”、“流量经营”等思路求变,希望能够提升对用户的业务使用管理能力,寻找更好的业务模式,充分发掘网络承载能力,增加单位流量价值。一方面提升网络能力,达到精细化控制目的,如PCC(Policy Control and Charging,策略控制和计费);另外一方面,对生产关键环节的海量数据进行细化分析,能够动态、精细化地实现有效控制和资源优化,如DPI、信令分析。其中DPI分析的上网记录每日高达30T,信令日志的数据量也以T级别增加,海量数据运营开始出现。
这些方面的建设当前都取得的不少成绩。在国外,相关运营商推出了定向套餐和流量控制业务,如Vodafone、BT在流量高峰时段控制P2P业务,O2优化网络让iPhone、iPad终端拥有高优先级和最大可用网速,Orange推出自有业务获得最高的端到端优先级等。
3 海量数据运营的探讨
当前的海量数据运营大部分在网络层面,充分体现了数据包、带宽、QoS、信道、小区、容量等网络特征,对三户一品(客户、用户、账户、产品)、营销、服务、计费、信控等业务特征进行了简化或弱化处理。大量数据如用户状态、业务订购关系、累计量等需要从业务侧同步到网络侧,存在着时延较长和不一致现象。
运营商应该建设覆盖面更广的体系,有机融合现有支撑系统,充分利用现有支撑体系内部数据和功能,为客户提供更好的服务,产生更大的价值。但这种系统容量需要达到上百T,处理的实时性要求更高,若采用传统的“scale up”的建设思路,不但成本高,而且无法根据用户和业务变化进行有效的调整和更新。
云计算技术的发展,提出了“scale out”的建设模式,根据互联网企业的经验和电信企业的特点,新的海量数据运营系统必须支持如下特性:
(1)分布式架构:只有采用这种架构,才能充分利用现有的低端PC,在合理的成本基础上,将其组合成为满足电信企业的体系;
(2)半结构化数据:电信领域的业务种类繁多、设备厂家多、升级频繁,固定结构的数据在灵活性方面很难适应;
(3)动态作业能力:只有自动适应、自动分解、负载均衡的系统,才能对海量数据做快速运算和分析,满足网络侧的低时延要求。
4 云计算清账单系统试点
在电信企业内部,用户使用清单和账单(以下简称“清账单”)的存储和查询是一项基本业务。这一业务的特点在于数据量巨大(一个省公司每月的清单条数可达数十亿,每条记录可包含数百个字段),同时对实时性(从事件发生到可查询的时间间隔)和历史性(保存多久的记录)的要求很高。
传统的系统是基于小型机和SAN存储实现的,存在容量有限、插入速度低、查询并发性差等问题。同时,传统的系统只能提供导入、查询和简单的固定统计功能。如果要对清账单进一步进行分析,则需要搭建昂贵的数据仓库,采用专有软件和设备,才能实现有效分析。
云计算清账单系统,一是要克服现有的清账单系统存在的问题,建立一个低成本大容量的系统,二是要能够对于清账单实现数据仓库级别的灵活分析统计功能,三是能够和网络侧及支撑体系其他部分结合,提供实时的营销和服务功能。
云计算方案基础采用Apache Hadoop系统,并采用多重优化和创新来满足企业运营需求。整个体系共80台左右(HBase/HDFS/JobTracker/Thrift共享PC服务器)自带硬盘的双路PC服务器,共同搭建起Hadoop集群(如图1),支持1.2亿移动用户6个月的清账单处理工作。
HBase实时数据引擎:实时NoSQL数据库引擎,基于列存储方式,很好支持稀疏表,提供强大并发查询能力。
HDFS分布式文件系统:分布式文件系统,支持PB文件存储,最大可支持三份数据冗余,确保数据在分布式环境的安全性。
MapReduce计算框架:基于HDFS的分布式计算框架。具有数据在存储服务器本地计算的特点,替代传统的把数据从存储迁移至小型机再进行计算的旧模式。
ZooKeeper管理软件:调度管理集群中的服务器,一般为单数多台服务器,具有仲裁能力。
Hive查询软件:支持SQL查询,提供了一种利用MapReduce分布式计算框架对HBase中的数据进行高效的分布式处理的简便方法。
Thrift接口软件:提供C、C++、Java等多种高级语言统一访问接口,实现与外部不同种类异构平台实时数据交流。
该系统全部使用廉价的X86服务器及Linux操作系统,提供600TB有效数据空间。新系统每5分钟加载一次数据,入库资源控制在20%左右,已经实现1000MB/s(100万条/秒)入库效率,在业务最忙时也不会产生数据积压。
原来小型机的系统,只能满足200笔查询/秒。Hadoop通过HDFS分布式文件系统把海量数据分隔存储在各集群服务中,再通过HBase主键索引快速定位待查数据块。总体上,不同的用户访问不同的服务器,由Hadoop集群统一管理及调度,大大提高系统的并发能力,新系统在已经支持8000笔查询/秒的用户随机查询,返回结果集达80万条/秒。而且随着集群规模的横向扩展,性能还可以线性地提供,这是传统的小型机解决方案很难实现的。
除了优异的加载及查询性能外,基于X86的Hadoop系统另外一个重要的特点是节省成本(如图2)。当前大主流的X86服务器,性能上基本都能达到40万tpmC,甚至过百万。而一台中高档的小型机,tpmC值大部分在100万~200万之间。因此,如果需要达到上述HBase RegionServer同样的硬件计算能力,至少需要14台中高端小型服务器,假设按每台100万人民币计算(实际价格更高),总计1400万人民币。同时,传统的解决方案一般使用计算服务与存储分离的方式实现。为了满足高性能及安全性要求,一般会选择中高端存储,每TB存储的平均价格在5万人民币左右,即如需满足600TB容量要求,需要约3000万人民币。而使用X86的解决方案,平均每台服务器价格约在3.5万左右,80台服务器只需不到280万。除此之外,以上价格仅是硬件的投入,还不包括传统商业数据库昂贵的商业许可。
对于上述体系的分析统计功能,采用Hive+Map
Reduce方式来实现,它提供了一种类SQL的查询语言HiveQL。该方法将HiveQL翻译成MapReduce任务来交给集群执行,实现更高的开发效率和更短的开发周期。同时,Hadoop有集群IO带宽的优势,能大大地提高海量数据统计分析的速度,原来36小时的任务集在Hadoop上只需要数小时即可完成。
现在广东移动公司正在内部的清单系统上部署分布式数据挖掘框架Mahout的机器学习和数据挖掘功能,对用户的用户行为、基站等方面进行分析,通过分类等数据挖掘算法的应用,挖掘出更多的信息。例如对客户进行精细化营销、防止客户流失等方面提供决策帮助。根据用户的使用记录,按照若干指标(业务类型使用分布情况、终端类型、上网时长等)对客户群进行分组,并标签化。据此可向用户推荐合适的套餐,也可以据此设计更合理的套餐。
广东移动公司基于Hadoop平台构建的新清账单系统已经平稳运行半年以上,有效地证明了云计算技术能切实地帮助国内运营商降低成本,提高竞争能力。
5 结束语
基于Hadoop的云计算实现方案,降低了电信运营商对小型机、存储、商业数据库/数据仓库的依赖,大大降低了投资成本,为海量数据运营提供了一个优秀的平台,为电信企业开展更大范围的流量经营提供了坚实的技术基础。淘宝、百度、Google等众多的互联网公司经验证明,分布式云计算技术的发展为企业经营模式转变提供了契机。
参考文献:
云计算与分布式技术范文2
关键词:分布式计算机;应用情况;发展趋势
中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2013)22-5161-02
众所周知,分布式计算机是将若干计算机联系起来,从而实现分布式计算的运算处理方式。分布式计算机系统是一种计算机硬件与功能的配置方式,是一种多处理器由互联网相连接为一体的计算机系统[1]。因为采用的是分布式计算结构,既简化了主机逻辑结构,又加快了数据处理速度,既成本低廉,又易于维护,被应用于社会生活的诸多领域,也成为计算机应用发展中的重要方向。文章就分布式计算机的应用发展进行论述。
1 分布式计算机具有的主要优势
分布式计算机主要有如下三种分布形式,即集中式分布、分散式分布和网络式分布。当系统内所有硬件部分间均存在密切合作关系时,我们将此系统称为分布式计算机系统。一般而言,分布式计算机是由硬件、控制、数据三个维度所构成的立体结构,对分布式计算机这种共享型多处理机系统进行探究,我们即可发现其具备诸多应用优势,主要表现为以下两种:
1.1 有较强的容错功能
众所周知,计算机是可以自行运转的,一部计算机是整个分布式信息系统的组成因子,当某台计算机出现运行错误时,系统能将错误自动消除,系统中其他组成因子与资源的功能并不会受某一计算机的运行错误影响,这是因为分布式计算机有较强的容错功能,从而使分布式信息系统有更高的安全性与可靠性[2]。
1.2 多处理器并行运行
分布式信息系统能够实现多台计算机的并行运行,这就使得系统计算步骤得到简化,系统内计算机有各自负责的区域,计算机依照规定对自身负责区域内的数据加以运算,仅需要具备共享式存储器系统即可。多处理器的并行运行使系统内的计算机运算效率较高,也是对分布式信息系统整体性能的大幅提高。
2 分布式计算机的应用情况
信息技术开拓与创新的脚步从未停止,人们的信息交流日益频繁,信息交流方式也更为多样。现阶段,分布式计算机被应用于诸多领域,并取得了良好的应用成果,现将当下分布式计算机的主要应用情况概述如下:
2.1 用于教学系统设计领域
近年来,随着信息技术的广泛应用与教育体制改革的深入推行,分布式计算机系统被更多地应用于教学系统设计领域。一般而言,这是一种服务体系结构,通过中立式接口把程序中的各个结构单元与功能单元衔接起来。将分布式计算机系统应用于教学系统设计领域中,主要具备如下几种优势:
一是在教学系统设计过程中,符合设计标准的组件能得到良好的衔接与合并。
二是通过松散化耦合方式与共享式服务手段,能实现整个教学系统的整合,这使得整个教学系统被纳入标准化管理的范畴[3]。
三是分布式计算机系统具有可重复使用的性质,这样进行教学系统中简单的教学软件设计时,诸如设计、开发、测试、部署、应用等阶段都可采用原有模式,不但推进了教学系统的设计进程,也使得整个设计的成本大为降低。
综上所述,分布式计算机系统在教学系统设计领域的应用优势极为明显,因此,在该领域的应用必将得到拓展和延伸。
2.2 用于计算机云计算领域
云计算是立足于互联网的超级计算模式,通过远程数据中心的管控,数以万计的计算机及服务器连成电脑云,实现并行处理技术、分布式处理技术与网络计算技术的联合应用。通过云计算,数据处理被分布于数量众多的分布式计算机上,处于这个“云计算”时代,电脑云帮助我们做好计算与存储工作。云计算具有诸多优势:一是“云计算”下的计算机群可以囊括几十万台,甚至是几百万台的计算机,在需要时,我们可以随时随地地运用计算机或手机等工具查找或计算数据;二是云计算有惊人的运算能力,目前已经达到十万亿次,正因如此,可以应用到更多的领域,如预测天气、市场预测、模拟核爆炸等;三是处于“云”中的计算机可以随时进行更新,使计算机群保有生命活力。
2.3 用于连锁系统设计领域
现下,诸多行业的销售采取的是连锁经营模式,这种模式建立于分布式计算机网络基础之上,是以分布式计算机网络的发展应用情况为依托的[4]。现用应用实例加以介绍:一是餐饮行业的连锁经营就应用到分布式计算机系统;二是应用了大量继电器与电缆设备的系统可采用分布式计算机系统来减少整个设备系统的安全运行隐患;三是在铁路信号控制领域,为了规避传统集中式控制中故障部件对其他部件的不利影响,也可以采用分布式计算机系统来进行控制。大量的应用实践已然证明,分布式计算机系统在连锁系统设计中有良好的应用效果。
2.4 用于动态取证系统领域
近年来,计算机技术与网络技术日臻成熟,但上述两项技术并非十全十美,网络环境是不断变化的,网络安全问题与计算机系统安全问题仍然存在,1966年,美国出现第一起计算机犯罪案件,之后的计算机犯罪数量就在全球范围内快速地增长,计算机犯罪涉及到的领域更为广泛,由最初的涉及军事领域,扩展到国家事务、金融、科技、政治、宗教、商业、个人隐私等诸多领域[5]。我国计算机犯罪案件出现得较晚,1986年7月13日,我国首例计算机犯罪案件被侦破,是银行内部人员利用主管电脑的便利盗取银行账号与密码,进而伪造银行存折,从而骗取现金。从上世纪九十年代我国正式进入国际互联网起,我国的计算机犯罪就不断上升,所造成的损失也日益增多。现阶段,如何有效制止计算机犯罪并令犯罪分子伏法是各国政府所关注的问题。打击计算机犯罪需要可靠、充实而有力的证据,但电子证据往往具有脆弱性、隐蔽性、可伪造、可复制、可删除的特点,正因如此,如何于计算机中获取与计算机犯罪相关的完整电子证据是司法部门所面对的难题。
针对上述状况,计算机取证学成为人们关注的焦点。计算机取证成为打击计算机犯罪的有力手段,但传统计算机取证往往采取事后静态分析取证的方式,这降低了证据提取与分析的效率,又因为采集证据不够及时与全面,很多可恢复性的数据存在被篡改的可能,降低了电子证据所应有的法律效力[6]。随着分布式计算机技术的发展与完善,基于多Agent的分布式计算机动态取证模型被研发出来,这是一种将入侵检测技术应用到计算机取证领域的有效手段,并形成了日益完善的动态取证系统,具有如下几个优势:
一是采用分布式数据采集策略,有更为宽广的取证范围,获取的信息能经由Agent实现动态扩展,有较好的系统扩展性。
二是对数据采集与入侵检测任务进行分配处理,这将大幅提升整个动态取证系统的工作效率及处理能力。
三是引入了入侵检测技术,能够实时监控被保护子网系统中的用户行为与网络流量,主动记录系统环境,特别是同步记录易于丢失的证据,提高了电子证据的法律效力。
四是采用了融合性数据分析技术,将多源信息进行联合分析,从而增加了电子证据的可信度与有效性,也使得电子证据误警率大大降低。
五是具备多重的安全保障措施,如身份认证、VPN、数据加密与数据签名等,能够保证电子证据的不被篡改与完整性。
2.5 广泛用于实时监控领域
近年来,人们的安全意识不断增强,许多安全要求较高的场合都设有实时监控设施,为人们带来巨大安全保障,但也应看到,实施实时监控时常会出现无效监控问题,致使计算机存储空间被大量占用,也增加了计算机数据处理耗时,不利于对计算机资源及人力资源进行有效应用[7]。针对这一问题,可安装分布式计算机系统,因为具备良好的信息共享性能,当红外感应器接收到监控对象所发出的红外线辐射刺激时,涉及到的子计算机的监控系统将被启动。即使是出现多个子计算机同时发出启动请求的现象,在分布式计算机系统的管控下,可以同时生成多个启动指令,子计算机在接收到启动指令后,可以自动制作出监控短片。随着实时监控领域的不断扩大,分布式计算机系统的应用范围亦将日益广泛。
3 分布式计算机的应用发展趋势
纵观未来,分布式计算机应用领域有着一定的发展趋势,既该计算机系统将会被应用于更多的领域,但却有着“化整为零”的共同应用原则。具体解释为,对集中而复杂的系统做拆解工作,形成众多较少的、较为简单的数据,运用具有紧密联系的计算机群组对上述数据加以处理,可以更为便捷地获取数据处理结果。纵观分布式计算机的未来发展,将会有更为广泛的应用空间及发展前景,但解决实际问题都要遵循“化整为零”的思想,寻找将疑难问题加以简化的分散点,更好地运用分布式计算机系统为人们的日常生活与研究带来便利条件。
参考文献:
[1] 徐耕.计算机通信实用技术研究[J].计算机光盘软件与应用,2012(17).
[2] 孙超.计算机网络系统在医院管理中的应用[J].现代阅读:教育版,2013(5).
[3] 叶尔逊江·阿布都热合曼.浅谈少数民族地区的计算机教育[J].教育教学论坛,2012(10).
[4] 冯涛,郑云水.新型网络计算机联锁仿真系统研究与设计[J].铁道标准设计,2013(3).
[5] 徐鹏举.计算机网络安全问题浅析[J].计算机光盘软件与应用,2011(14).
云计算与分布式技术范文3
分布式控制系统现状
分布式控制处理系统是继工控机处理系统、嵌入式处理系统后的第三代控制系统。目前市场上常见的分布式图像控制系统架构主要有两种:第一种是采用分布式信号采集,集中式信号处理的架构。第二种是采用网络式架构的分布式控制系统,如Jupiter公司推出的PixelNet高清视频分布式解决方案以及台达DVCS分布式图像控制系统,其每一路信号输入/输出均由一个单独的处理器进行处理,每一路信号的处理均为独立通道,任何一个信号点出现故障都不会影响其他信号源,从根本上保证了大屏幕显示的安全、可靠。
据北京飞利信电子技术有限公司营销中心副总经理王章敏介绍,目前,分布式控制处理器由于成本的问题,暂时在市场中还不能取代传统的集中式控制处理系统。但是在拼接规模较大,信号源输入较多以及对安全可靠性要求较高的场合,分布式控制处理系统优势突出,主要表现在其应用灵活、扩展性好、易操作、易维护,信息输出质量高且节能环保。所以这两年分布式控制器在拼接控制器行业中的市场份额逐年上升,目前市场份额大概在处理器系统中占15%左右。
云计算、物联网的新型控制系统平台
云计算的兴起和发展,让视讯企业用户可以将重要的数据分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将与互联网更相似,帮助企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。飞利信是国内第一家提出云分布式的分布控制技术的厂家,并且于2012年5月在PALM展中给客户展现。
飞利信打造独有的将拼接控制技术与云计算、物联网技术三者融合的控制平台PX-CVCS。云计算相当于大脑,物联网相当于眼睛、鼻子、耳朵、嘴巴、四肢等等,而拼接控制器则将这些有机地拼接成一体,构成一个新的平台,所有的运算都在大脑里进行,将眼睛、嘴巴、耳朵等搜集到的信息进行计算和整理,根据应用场合和客户需求,将资源最大化应用,既避免了集中式控制系统的低可靠性和有限运算能力的缺陷,又避免传统分布式控制的资源浪费,比如某一路在不工作状态时,传统的分布式系统对于该路的控制器就是一种浪费,而云技术的控制则不同,可以根据情况,灵活分配。
除此之外,拼接控制器结合云计算与物联网技术,实现每个节点的地址查询及显示,共享软硬件资源和信息资源,并可以按需提供到显示平台和其他设备上,清投结合此技术打造了众多新型控制系统平台,如“一云三端”、“高清底图机”、“整屏录播系统”,同时结合云计算技术及物联网技术打造第三代融合控制系统平台,其相对比第一代软件融合和第二代硬件融合最大的区别在于可扩展多种应用。
另据台达集团国内子公司中达电通视讯产品经理朱力介绍,台达集团紧密把握物联网技术潮流,最新研发出面向广域大规模的智慧型监控与管理系统――iPEMS。iPEMS系统由数据处理子系统与分布式显示子系统2个部分组成。数据处理子系统包括数据感知与传输,数据分布式存储,大数据分析以及数据可视化;分布式显示子系统包括显示控制器,拼接显示墙以及显示管理软件。该系统通过实时模拟/数字信号获取、网络化数据传输、海量数据存储、智能大数据挖掘与分析、超高清晰度数据可视化等技术,为人们提供海量可视化信息,帮助人们及时有效决策和远程控制。
新型平台具备革命性优势
传统的集中控制系统,由于资源有限,因此在大规模、复杂的拼接墙以及信号源较多的场合下,由于传输距离的限制、接入点的上限、图像处理速度慢、不间断运行易宕机等问题而不能使用,同时,由于所有的输入输出都由集中控制器处理,一旦控制器出现问题,则整个系统都崩溃,导致系统的安全性和可靠性不足。传统的分布式控制系统,最大的缺点是每一路都需要一个控制器,无论输入和输出,虽然能解决运算资源和可靠性问题,但造成了另一种局面,就是资源浪费,成本增加,占用的体积也相应加大,灵活性也还不够。同时整个拼接系统仍处于图像控制的范畴内,无法与正处在高速发展的传感器、互联网技术更好地结合发展。而新的结合了云计算和物联网技术的控制系统,则可以解决上述所有问题。
清司相关负责人表示,采用云计算、物联网技术的控制平台具有更高的可扩展性和灵活性。传统处理器为机柜插卡式结构,机箱需按照输入输出的路数预先订制,且最多只能处理72路信号,扩展性和灵活性受到了极大制约;而分布式拼接系统采用以太网进行数据交换传输,仅需用网线将节点设备接入交换机即可实现系统扩展。
分布式系统的布线以网线为主,简单而且方便。传统的RGB线缆、DVI线缆都有传输距离的限制,超过了30m以后就会出现信号质量下降、画面抖动、闪烁问题,需要增加其他外设补偿信号,从而降低了图像的真实性,很难满足用户对信号质量的高需求。特别是监控系统,远端信号传输已经过一次转换,如果再进行数/模转换,就会大大降低信号强度。这就会影响用户的使用体验。而采用分布式只需要将信号源接入网络,在网络带宽满足的情况下就可以保证远距离传输,而且保证色彩还原度。
物联网拼接控制系统具有更高的稳定性和更低的功耗。集中式系统的拼接控制器是整个系统的核心,一旦故障,整个系统便会崩溃;而分布式系统中不存在中央处理器,各个控制节点彼此并不互相依赖,单个节点故障并不影响整体系统正常运行,而且核心数据交换设备采用网络交换机这种非常成熟的产品,稳定性非常高。另系统中每个节点功耗只有5-10W,节能环保。
用户的福音
网络化、分布式作为未来拼接系统的发展趋势,正在越来越多的大型拼接系统应用中崭露头角。对行业用户来说,分析自己的应用需求,选择性价比最高的拼接系统会尤为重要。同时,除了考虑拼接系统的稳定性、可靠性之外,如何利用新技术和平台,实现更多的便捷功能、与现有IT资源整合、提升投资回报率也会成为评估的重点。
云计算与分布式技术范文4
【关键词】 云计算 大数据 MapReduce Hadoop一、大数据
1.1什么是大数据
大数据概念可以从四个维度去解,即三个V和一个C。三个V分别指的是数据量大(Volume)、数据种类多(Variety)和数据增长速度快(Velocity),最后一个C指的是处理、升级或利用大数据的分析手段比处理结构化数据要复杂的多(Complexity)。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像Map-Reduce一样的并行计算框架将复杂的计算任务分配到“云”中成百上千的节点。
1.2大数据与云计算
大数据本身就是一个问题集,云计算技术是目前解决大数据问题集最重要最有效的手段。云计算提供了基础的架构平台,大数据应用在这个平台上运行。目前公认为分析大数据集最有效手段的分布式处理技术,也是云计算思想的一种具体体现。
云计算是分布式处理、并行处理和网格计算的发展,或者说是这些计算机科学概念的商业实现。云计算将网络上分布的计算、存储、服务构件、网络软件等资源集中起来,基于资源虚拟化的方式,为用户提供方便快捷的服务, 实现了资源和计算的分布式共享和并行处理,能够很好地应对当前互联网数据量高速增长的势头。
1.3大数据与Hadoop
Hadoop是一个Apache的开源项目,主要面向存储和处理成百上千TB直至PB级别的结构化、半结构化或非结构化的大数据。Hadoop提供的Map-Reduce能将大数据问题分解成多个子问题,并将它们分配到成百上千个处理节点之上,再将结果汇集到一个小数据集当中,从而更容易分析得出最后的结果。
Hadoop项目包括三部分,分别是Hadoop Distributed File System(HDFS)、Map Reduce编程模型,以及Hadoop Common。Hadoop具备低廉的硬件成本、开源的软件体系、较强的灵活性、允许用户自己修改代码等特点,同时能支持海量数据的存储和计算任务。这些特点让Hadoop被公认为是新一代的大数据处理平台。 Hadoop同样具备出色的大数据集处理能力,在获取、存储、管理和分析数据方面远远超越传统的数据库软件工具。Hadoop经常在构建大数据解决方案时被用作基础构架软件。
二、大数据技术综述
大数据处理不仅仅是Hadoop,许多特定的数据应用场景是需要实时分析和互动反馈的,这时候就需要利用包括内存检索、流处理和实时计算等其他技术。而云计算的分布式存储和计算架构开启了大数据技术研究的大门,打造健全的大数据生态环境,所有这些技术结合在一起,才是一个完整的大数据处理系统。
2.1分布式计算框架
MapReduce是Google开发的一种简化的分布式编程模型和高效的任务调度模型,用于大规模数据集(大于1TB)的并行运算,使云计算环境下的编程变得十分简单。
MapReduce将数据处理任务抽象为一系列的Map(映射)和Reduce(化简)操作对。Map主要完成数据的分解操作,Reduce主要完成数据的聚集操作.输入输出数据均以〈key,value〉格式存储.用户在使用该编程模型时,只需按照自己熟悉的语言实现Map函数和Reduce函数即可,MapReduce算法框架会自动对任务进行划分以做到并行执行。
Pregel是Google 提出的迭代处理计算框架,它具有高效、可扩展和容错的特性,并隐藏了分布式相关的细节,展现给人们的仅仅是一个表现力很强、很容易编程的大型图算法处理的计算框架。Pregel的主要应用场景是大型的图计算,例如交通线路、疾病爆发路径、WEB 搜索等相关领域。
2.2分布式文件系统
为保证高可用、高可靠和经济性,基于云计算的大数据处理系统采用分布式存储的方式来保存数据,用冗余存储的方式保证数据的可靠性。目前广泛使用的分布式文件系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS。
GFS即Google文件系统,是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。GFS的设计思想不同于传统的文件系统,是针对大规模数据处理和Google应用特性而设计的,运行成本低廉,并提供容错功能。
HDFS即Hadoop分布式文件系统,受到GFS很大启发,具有高容错性,并且可以被部署在低价的硬件设备之上。HDFS很适合那些有大数据集的应用,并且提供了数据读写的高吞吐率。HDFS是一个master/slave的结构,在master上只运行一个Namenode,而在每一个slave上运行一个Datanode。HDFS支持传统的层次文件组织结构,对文件系统的操作(如建立、删除文件和文件夹)都是通过Namenode来控制,Datanode用来存放数据块。
2.3大数据管理技术
互联网数据已超出关系型数据库的管理范畴,电子邮件、超文本、博客、标签(Tag)以及图片、音视频等各种非结构化数据逐渐成为大数据的重要组成部分,而面向结构化数据存储的关系型数据库已经不能满足数据快速访问、大规模数据分析的需求,随之而来,一系列新型的大数据管理技术和工具应运而生。
2.3.1 非关系型数据库
NoSQL,也有人理解为Not Only SQL,它是一类非关系型数据库的统称。其特点是:没有固定的数据表模式、可以分布式和水平扩展。NoSQL并不是单纯的反对关系型数据库,而是针对其缺点的一种补充和扩展。典型的NoSQL数据存储模型有文档存储、键-值存储、图存储、对象数据、列存储等。而比较流行的,不得不提到Google的Bigtable,它把所有数据都作为对象来处理,形成一个巨大的表格,用来分布存储大规模结构化数据,数据量可达PB级。而HBase是Hadoop团队基于Bigtable的开源实现,使用HDFS作为其文件存储系统。同时,Cassandra(K/V型数据库)、MongoDB(文档数据库)和Redis等一系列优秀的非关系型数据库产品如雨后春笋般问世。
2.3.2 数据查询工具
Hive是Facebook提出的基于Hadoop的大型数据仓库,其目标是简化Hadoop上的数据聚集、即席查询及大数据集的分析等操作,以减轻程序员的负担.它借鉴关系数据库的模式管理、SQL接口等技术,把结构化的数据文件映射为数据库表,提供类似于SQL的描述性语言HiveQL供程序员使用,可自动将HiveQL语句解析成一优化的MapReduce任务执行序列.此外,它也支持用户自定义的MapReduce函数。
PigLatin是Yahoo!提出的类似于Hive的大数据集分析平台.两者的区别主要在于语言接口.Hive提供了类似SQL的接口,PigLatin提供的是一种基于操作符的数据流式的接口.可以说Pig利用操作符来对Hadoop进行封装,Hive利用SQL进行封装。
Google Dremel是个可扩展的、交互式的即时查询系统,用于完成大规模查询结构化数据集(如日志和事件文件)。它支持类SQL语法,区别在于它只能查询,不支持修改或者创建功能,也没有表索引。数据被列式存储,这样有助于提升查询的速度。Google将Dremel作为MapReduce的一种补充,被用于分析MapReduce的结果或者是作为大规模计算的测试。
2.4实时流处理技术
伴随着互联网业务发展的步调,以及业务流程的复杂化,企业的注意力越来越集中在“数据流”而非“数据集”上面,他们需要的是能够处理随时发生的数据流的架构,现有的分布式计算架构并不适合数据流处理。流计算强调的是数据流的形式和实时性。MapReduce系统主要解决的是对静态数据的批量处理,当MapReduce任务启动时,一般数据已经到位了(比如保存到了分布式文件系统上),而流式计算系统在启动时,一般数据并没有完全到位,而是经由外部数据源源不断地流入,重视的是对数据处理的低延迟,希望进入的数据越快处理越好。数据越快被处理,结果就越有价值,这也是实时处理的价值所在。
流计算的数据本身就是数据流,不需要数据准备的时间,有数据流入就开始计算,解决了数据准备和延迟的两个问题。现有的解决方案中,Twitter的Storm和雅虎的S4框架更适合数据流计算的场景。Storm是开源的分布式实时计算系统,可以可靠的处理流式数据并进行实时计算,单机性能可达到百万记录每秒,开发语言为Clojure和Java,并具备容错特性。S4是面向流式数据和实时处理的,所以针对实时性较高的业务,可以很好地对数据做出高效的分析处理,而且系统一旦上线,很少需要人工干预,源源不断的数据流会被自动路由并分析。对于海量数据,它和MapReduce都可以应对,但它能比后者更快地处理数据。
三、思考与展望
以云计算为基础的信息存储、分享和挖掘手段为知识生产提供了工具,通过对大数据分析、预测会使得决策更为精准,这对媒体融合具有重要意义。
新闻媒体的数据库中拥有海量信息存储,这些多媒体数据包括文字,图片,视频和音频等多种格式,符合大数据处理的基本特征,利用大数据技术对这些资源进行存储,计算和分析,了解用户行为,挖掘数据本质和关联,为领导提供决策支持,为终端用户提供更好的服务和新闻定制,增强新闻信息产品的质量和影响力。
云计算与分布式技术范文5
作为一种新型计算模式,云计算的应用对于改善物联网运营平台的信息处理与计算能力具有重要作用。本文首先介绍了物联网运营平台的总体结构构建,然后具体探讨了物联网运营平台构建中采用的关键云计算技术,以期为相关技术与设计人员提供参考。
【关键词】云计算 物联网运行平台 构建
物联网的智能处理过程需在信息技术的支持下才能完成,而IT技术与通信技术未来发展的结合点便为云计算技术。云计算具备信息数据快速处理的性能,若要将其迅速普及到各行各业和社会中,则必须依靠高速及宽大的网络发展。因此,加强有关基于云计算的物联网运营平台构建分析,对于改善物联网运营平台的设计质量具有重要的现实意义。
1 物联网运营平台的总体结构构建
在综合分析物联网运营平台需求与特点的基础上可以发现,物联网需具备大规模的资源与数据处理能力,而对于大规模数据的处理与计算则必须使用云计算技术。基于云计算的物联网运营平台通常包含以下内容:
1.1 平台服务
作为物联网的重要组成部分,云平台具备控制与配置网络节点、信息计算与采集的功能,其通过分布式计算技术和分布式存储技术对海量数据信息进行分析,并给出大数据量数据动态处理服务。云平台能同时对多项业务及任务进行处理,且能依据不同业务特点对计算功能进行分离,以构建优化计算模型供云调用利用。
1.2 软件服务
物联网与云计算可通过虚拟物力资源向客户提供基本的业务服务,也可专门供第三方使用。第三方提供软件,云平台通过虚拟化过程分别租赁给不同的商户,且让不同租户间进行资源共享,依据租户需求实施计费,此种方式不仅能大幅度降低运行成本,还可改善资源利用率。
1.3 基础设备服务
云计算应用过程中所需的基础设备有网路设备、服务器、带宽、存储设备等出售设备。利用虚拟化模型对物理资源进行有效处理,可促进物联网平台不同行业间或同行业间不同客户间的资源共享,且不会受到设备与地点的限制,由此便能加大资源的有效配置,减少资源浪费,且可大幅度降低成本,提高使用质量。
2 物联网运营平台构建采用的关键云计算技术
2.1 用户个性化推荐与用户聚类的分布式应用构建
在应用构建前应先开展应用业务分析,在组织和评估内外部资源的基础上界定不同类的业务问题;依据应用种类的差异进行数据采集与处理,并按照应用需要采用网页解析、爬虫、分词等技术对数据实施获取与辨认。对于已采集到的数据进行处理方法通常有数据重构、数据格式化、数据量化处理与数据整合等。在选用独立性变量时要构建分类模型,采用不同的数据挖掘算法以实现用户分群功能。依据聚类结果开展业务解析,并依据不同用户群的特质建立个性化方案。
2.2 数据挖掘算法
以云计算为基础的数据挖掘算法的分布式文件系统HDFS是分布式计算平台的重要组成部分。在平台构建时要先全面分析了解分布式文件系统的write-one-read-many访问模型及其对于并行计算、分布式文件系统的层次结构及其Namespace、分布式文件系统的Datanode与Namenode划分机制及Master/Slave架构;然后研究分析Hadoop中的并行计算算法,其主要包括并行计算算法的应用程序接口、通讯过程与其RPC实现机制、应用程序处理流程与基本组成、解决死锁问题的错误处理机制等。在此类研究的基础上,构建基于Hadoop的包括SSH安装配置、硬件环境配置、Hadoop服务、环境变量设置、分布式文件系统的目录文件结构设置、Data Node与Name Node配置、配置文件参数等部分的云计算集群平台。
2.3 数据挖掘算法的并行算法实现
数据娃聚算法的并行算法实现主要通过以下流程:对类数据挖掘算法实施对应的MapReduce改造;对算法中的各MapReduce过程进行具体定义;在Hadoop平台上开展编码;测试已完成的数据挖掘并行算法。解析效果评测数据主要为SougouT 1TB或天王200G网页数据,任意抽取不同网页开展人工测评,正文提取的准确率应保证高于90%。
采用MapReduce对定义输入输出格式化OutFormat与InputFormat类、Reducer与Mapper类等过程进行处理,利用对MapReduce的参数和过程函数定义调整来改善算法的并行度,由此完成具有高度并行的分布式数据挖掘算法,集群中的机器数量与算法数据处理能力接近线性分布。
3 结束语
云计算技术的应用质量将直接关系到物联网运营平台的构建水平与功能使用,因此,相关技术与研究人员应加强有关基于云计算的物联网运营平台构建研究,总结平台构建的基本要点及关键云计算处理措施,以逐步改善平台构建中的云计算应用水平。
参考文献
[1]梅海涛.基于云计算的物联网运营平台浅析[J].电信技术,2011,13(14):74-75.
[2]于洋.构建基于云计算的物联网运营平台分析与研究[J].电脑知识与技术,2013,06(10):61-62.
[3]王昆昆.论基于云计算的物联网运营平台建设[J].计算机光盘软件与应用,2013,05(35):57-58.
作者简介
刘倩(1981-),女,满族,硕士研究生学历。现为宁夏大学数学计算机学院讲师。主要研究方向为图形图像处理与多媒体技术。
云计算与分布式技术范文6
关键词 数学实验;云平台;分布式计算;MATLAB
中图分类号:G642.423 文献标识码:B
文章编号:1671-489X(2017)04-0012-03
Abstract This article elaborates design and implementation of the cloud platform of mathematical experiments, and the key technologies used in the process of platform development. The cloud platform is an integrated environment of mathematical experiments on the internet with openness, real-time and accessibility and capable of executing distributed computations. It is able to provide the online service of mathematical experiments and scientific computations for teachers and students, moreover solve complex computation problems. The cloud platform is a way to share the computational resources of high quality in mathematical laboratory within and between campuses, and explore the development road of mathematical laboratory in future.
Key words mathematical experiments; cloud platform; distributed computing; MATLAB
1 前言
目前国内众多高校的数学实验室是基于局域网的以微机为主体的机房,难以将其计算资源共享给广大师生或者科研人员使用,不具备开展大型实验项目和执行大型计算任务的能力,如大数据的分析处理。如何整合数学实验室的计算资源,使之能够提供高性能的计算服务,并将计算服务方便快捷地提供给广大师生使用,是数学实验室建设中亟待解决的问题[1]。
因此,一些学者提出基于网络的虚拟数学实验室,具有网络执行MATLAB程序的功能,能进行简单的数学实验,具有一定的实验教学管理功能;还有一些研究提出基于Web和MATLAB的虚拟实验系统,这些系统针对特定的数学实验项目编制,允许学生通过网络修改模型参数进行演示[2-3]。目前这种基于网络的数学实验室或者虚拟实验系统,不能进行分布式计算,难以开展大型的数学实验项目和完成复杂的科学计算任务,难以处理大规模的并发访问,离实际应用还有一段距离。
本文应用云计算的技术理念,提出构建基于J2EE(Java 2 Platform, Enterprise Edition)和MATLAB分布式计算技术的数学实验云平台,实现数学实验室的多核、多处理器、多台微机和大型数值计算软件等优质计算资源的校内和校际共享,满足广大师生日益增长的科学计算需求,特别是在分布式计算和大数据处理方面的计算需求。
2 数学实验云平台的设计
系统概述 云计算既指在互联网上以服务方式提供的应用系统程序,又指在数据中心用来提供这些服务的硬件和系统软件。云计算可理解为并行计算、分布式计算和网格计算的发展,或者说是这些计算机科学概念的商业实现[4]。
实验云是远程实验技术与云计算技术的融合,将改变传统的教育模式。数学实验云平台应用云计算的技术理念,将数学实验和科学计算理解为可以提供给用户的服务,数学实验室的软硬件资源为生产该服务的基础设施。因此,数学实验云平台定义为云计算技术下的集成数学实验环境,为学生、教师和其他用户提供即时的云端数学实验和科学计算服务,如并行计算、分布式计算和大数据处理等计算服务,让传统数学实验室的计算和服务能力有质的飞跃。
功能模块设计 数学实验云平台是一个集成的数学实验环境,在此环境中主要的操作对象有教师、学生、执行特定计算的科研人员和平台管理人员,该平台主要功能集中在数学实验、课程管理、科学计算、协作交流和资源共享等,具体的功能模块有:
1)数学实验,用户通过该模块接收数学实验任务、在线进行数学实验、查看实验结果及实验成绩、撰写并提交实验报告和储存及查看历次实验记录;
2)科学计算,用户通过该模块提交计算任务、编写计算程序、上传相关数据和获取计算结果,进行项目管理;
3)课程管理,该模块使用者主要为数学实验教师,主要功能有实验任务、收集并查看实验报告、评定实验成绩等;
4)协作圈子,该模块帮助用户完成需要团队合作的实验或者科研项目,在一个圈子里,圈子成员共享实验空间、代码空间,在线讨论交流等;
5)文件管理与共享,该模块提供讲义、辅助材料、课程录音、录像等课程资源的存储和共享;
6)人员管理,该模块用于管理教师、学生和其他人员的个人信息,包括所上课程、所侔嗉妒笛樾∽榛蛘呖蒲谢构、参与项目、项目角色等信息。
3 数学实验云平台的技术实现
系统架构 数学实验平云台基于J2EE和MATLAB集群技术开发,采用B/S(Browser/Server,浏览器/服务器)架构,如图1所示。Web服务器负责业务逻辑控制,MATLAB集群负责数学实验和科学计算,数据库负责存储用户信息、实验和计算代码、计算结果、分析报告等。用户从网页上发出计算请求,用户的请求给Web服务器处理之后,将发往MATLAB集群管理器,集群管理器给各计算机分配作业,完成计算任务后将收集计算结果并通过Web服务器返回给用户,其他需要存储的信息发往数据库。服务器端软件包括J2EE Server(Apache Tomcat 7.0.52)、MATLAB 2012a和SQL Sever2005。
MATLAB分布式计算集群的搭建 MATLAB分布式计算环境由其并行计算工具箱(Parallel Computing Toolbox)、分布式计算服务器软件(MATLAB Distributed Computing Server)和计算机集群构成(Math Works. 2012. MATLAB Reference guide. Natick, MA, USA)。在MATLAB集群架构中有3种角色:客户端(Client)、作业管理器(Job Manager)、Worker。客户端是发起计算任务的MATLAB线程,客户端发起的计算任务称为作业(job),作业是运行在MATLAB上的大型运算,客户端在并行计算工具箱的支持下定义作业并将其分割成若干个可以同时进行的小的运算,这些小的运算称为任务(task);客户端将作业发送给作业管理器,作业管理器是服务端应用程序的一部分,用来协调管理作业及其任务的执行;作业管理器将任务分配给服务端独立的MATLAB线程进行计算,这些MATLAB线程称为Worker;Worker运行结束返回结果给作业管理器,再由分布式计算工具箱对其结果进行合并,得出最终结果发送给客户。
在一台计算机上,MATLAB并行工具箱只允许最多12个Worker同时运行,要使用更多的Worker,需要通过MATLAB的分布式计算服务器软件组建MATLAB集群。MATLAB集群的搭建分为四大步骤:MATLAB软件的安装、搭建集群局域网、分布式引擎的安装(MATLAB Distributed Computing Engine,
MDCE)、作业管理器和Worker的启动配置。MDCE是MATLAB的分布式计算服务器软件的一部分,用以维护Worker之间、Worker与作业管理器之间的通信,打开集群内各计算机的终端界面,进入MATLAB的安装路径“/toolbox/distcomp/bin”下,输入命令“mdce install”安装MDCE。安装完毕后,输入“mdce-version”,出现MDCE版本信息则说明安装成功,此时,输入“mdce start”,开启分布式计算服务。启动
MDCE服务后,输入“startjobmanager-name”命令创建作业管理器。
学生的数学实验程序较简单,计算量小,但是面临大量学生并发访问的问题;科学计算则针对大型计算或者大数据处理,用户数较少,但每次计算需要占用大量计算资源。为利用MATLAB集群高效完成这两项功能,在MATLAB集群中建立两类作业管理器:一类是数学实验作业管理器,名为EJobManager,拥有80个Worker;一类是科学计算作业管理器,名为SJobManager,拥有120个Worker,分别接受数学实验和科学计算任务。
MATLAB分布式计算集群的Web调用 Matlabcontrol是让Java程序与MATLAB交互的API,可以实现从Java程序向MATLAB发送命令,让MATLAB执行某个M文件等,其jar包可以在goole code中下载。Matlabcontrol调用MATLAB分为四大步骤:设置获取MATLAB时的相关参数,通过MatlabProxy的工厂方法获取,运行代码获取结果,关闭。在实际应用中获取和关闭MATLAB要消耗大量的系统资源,运行起来也非常慢。为此,笔者建立一个MATLAB池。池在服务器开启之时初始化,创建一定默认数量的MATLAB,并且设置一定的限制规则:设置池内最大数,达到这个数目后,新增用户需要等待其他用户释放。在这个机制下,用户可以直接在池中获得空闲的,而不是每次连接时新建一个;使用完了之后也不是直接关闭它,而是将放入池中。同时在Servlet中还设置了一个监听器来监听每个所使用的连接数,可以标记一个MATLAB进程同时被多少个用户所使用。本文系统以每个同时最多由20个客户使用作为限制。
用户向Web服务器发送求,Web服务器通过Matlab-control建立与服务端的MATLAB链接,用户通过此链接向MATLAB集群上的作业管理器注入作业,从而实现调用集群计算机完成计算任务。开启Tomcat服务器之后,自动加载InitServlet,InServlet中的Init()方法自动初始化MATLAB池,并且默认开启1个MATLAB进程,把MATLAB的池对象放入Application中。
数学实验与科学计算模块的实现 每个用户所编写的MATLAB程序执行时间不一样,用户通过MATLAB提交作业并等待作业管理器返回计算结果,需要占用MATLAB较长时间,在大量用户并发访问时会导致MATLAB资源不足。其解决方案是将作业提交和获取计算结果异步执行,这样不仅可以克服因某个用户程序执行较慢而阻塞MATLAB进程的问题,而且由于用户提交作业后即释放对MATLAB的占用,可以让一个MATLAB响应更多的用户请求,减少系统开销。
该解决方案的具体做法是将用户MATLAB程序封装成指定名字的作业,通过MATLAB提交给相应的作业管理器,由作业管理器调度MATLAB集群处理。同时采用MATLAB定时器技术在集群端间隔一定时间扫描作业管理器中的作业状态,对状态为完成的作业,取回其结果并以文本形式保存到指定目录下,客户通过文件监听和Ajax技术获取该文本文件中的结果。这样使得作业提交、作业计算和输出结果分别在不同的计算机上完成。
通过MATLAB定时器输出已完成作业的计算结果的MATLAB函数如下:
function getResult(savepath,jobmanager)
[p q r jobM]=findJob(jobmanager);
for i=1:length(jobM)
directory=get(jobM(i),’UserName’);
filename=[directory,datestr(now,30)];
result=getAllOutputArguments(jobM(i));
xlswrite([savepath ‘\’ directory ‘\’ filename],result)
destroy(jobM(i))
end
前端页面的实现 数学实验云平台采用J2EE中的Jsp+
Servlet+Bean的MVC(Model View Controller)设计模式,前端页面采用Bootstrap框架开发,会根据显示器大小自动调整页面显示,用户可以在电脑、移动设备上登录该平台。用户成功登录系统后,进入数学实验或者科学计算模块之后,可以新建实验(科研)项目,或者进入已有的实验(科研)项目,编写计算程序提交作业,保存计算程序到数据库,方便下次调用查看,科学计算模块允许用户上传计算需要的数据和其他M文件。
4 结语
本研究基于云计算的技术理念,在J2EE环境下开发基于MATLAB分布式计算技术的数学实验云平台,具有开放性、即时性、易接触性,能够方便快捷地为广大师生提供数学实验和科学计算服务。该平台将数学实验室软硬件计算资源组建成集群,可以进行大型科学计算,充分发挥实验室资源的潜在效能。用户通过浏览器即可向该平台提交计算任务获取计算结果,实现实验室资源的校内校际共享,有利于提高实验教学水平。因此,本研究为高校利用现有实验室构建云计算实验室及实现其资源共享做了有益尝试,并为数学实验室的未来发展拓展了道路,符合教育技术信息化的未来发展方向。
⒖嘉南
[1]孙苏菁,白占兵.关于数学实验室建设的若干思考[J].科技视界,2013(11):41.
[2]宋绍云,师红.基于Matlab Web Server的数学实验室体系结构的建立[J].玉溪师范学院学报,2007(12):38-42.