城市设计数据分析范例6篇

前言:中文期刊网精心挑选了城市设计数据分析范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

城市设计数据分析范文1

关键词:成绩数据仓库;OLAP;多维数据集;数据透视表;数据透视图

中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)13-2944-05

The Design and Implementation of OLAP Data Warehouse of Student Score Analysis

HUANG Yu-da1,2,LI Xiang-qian2

(1.College of Computer Science and Technology,Southwest University of Science and Technology,Mianyang 621010,China;2. Information and Engineering Department,Zhoukou Vocational and Technical College, Zhoukou 466000, China)

Abstract: In response to the situation that a lot of student achievement data Stored in a transactional database are scattered, inconsistent, and independent,using Sql Server 2008 BI Business Intelligence platform and three-tier modeling approach to build an analysis-oriented student achievement data warehouse.The creating of multidimensional datasets,OLAP analysis ,and OLAP analysis results’showing by means of the pivottable and pivotchart of EXCEL 2007 front tool Provide strong support for Educational administrators in Decision analysis, the forecasting of teaching trend and the formulation of management measures.

Key words: score data warehouse; OLAP; multidimensional datasets; pivottable; pivotchart

目前,无论是与学生成绩直接相关的教务管理系统还是与学生成绩间接相关的学籍管理系统(存储学生基本信息)和人事管理系统(存储教师基本信息)等都已经积累了大量数据。但对这些数据的使用平时基本上都限于一些单方面分析且难以被再次利用,不仅缺乏一些相应技术对它们加以综合分析[1],而且这些系统由于相应业务不同导致相应的平台、开发工具、数据库系统等都不尽相同,可以说互相之间各自为政且缺乏科学、统一的协调和规划。然而各院校为提高教学质量,对大量教学决策信息的需求显得更为迫切。另外,数据仓库是从历史和发展的角度来组织和存储数据[2],是面向主题且为决策分析提供服务,而且学生成绩数据也比较符合数据仓库一些特征,如面向主题(成绩分析)、相对稳定(每学期一次考试)、随时间变化(学年学期)等。因此将与学生成绩相关的一些数据库系统中大量历史数据加以预

处理后载入数据仓库,可充分利用其中的多维数据分析技术(如OLAP)及数据挖掘工具等对仓库中数据加以智能化分析处理,从而更好地为教学管理者提供决策服务。

本文采用微软公司的Microsoft Visual Studio 2008中的Sql Server Management Studio平台来构建学生成绩仓库,采用Microsoft Sql Server 2008中的Sql Server Business Intelligence Development Studio平台工具来建立BI项目并实现多维数据集的创建、OLAP分析功能。

1成绩数据仓库的三层建模

本文采用通用的自顶向下、逐步细化的仓库建模方式即三层建模,依次为:概念模型设计、逻辑模型设计、物理模型设计[3]。

1.1概念模型设计

概念模型设计是一种面向全局的、较高抽象层次上的设计,该阶段主要任务是确定系统中主要主题域及其内容[4]。考虑到学生成绩特点及影响因素,该文把学生成绩分析作为主题来建立成绩数据仓库,仓库中包含学生学籍信息、课程信息、教师信息、班级信息、专业信息、系别信息、学年学期信息和学生成绩信息共八个方面的数据,将学生成绩作为关键性能指标并将除学生成绩信息以外的另外七个方面的信息作为维度数据,所有数据都分别来自学生学籍管理系统、教务管理系统和人事管理系统。

1.2逻辑模型设计

由于本文需建立的成绩仓库的维度数并不是太多而且数据量并非很大即不会占用较多存储空间,所以针对关系模式的定义以及较高查询效率的需求,这里决定采用星型逻辑模型,如图1所示。

图1成绩数据仓库星型逻辑模型

1.3物理模型设计

目前由于大部分数据仓库都是基于关系型数据库而且数据的最终管理及存放都是由相应数据库系统来处理的,所以这里的物理模型设计就主要考虑关于物理数据库的一些模型设计,如数据的索引、存储及其结构等[5]。

本文设计的数据仓库的核心数据库是微软的SQL SERVER 2008企业版关系型数据库管理系统。对实体表的主外键均建立索引以提高响应速度。

2数据ETL过程实现

本文采用笔者所在工作单位—周口职业技术学院几年来的学生成绩相关数据作为数据源。考虑到2007年以前尚未全面启用教务管理系统、时间略显仓促及数据收集和预处理需花费大量时间、精力,所以数据源范围暂先定于信息工程系、机电系和财经系三个系的07级、08级、09级学生成绩数据。

2.1数据的抽取及清洗

在确定了成绩仓库中事实表及各个维度表的具体结果模型之后,就需要以这些结构模型为重要参考依据分别从各自对应的业务型数据库系统中进一步抽取相关数据并经过预处理后再载入成绩仓库。

数据的清洗主要是对数据中的杂质、噪声、不一致、不规范、遗漏等情况加以处理。一般应视各自具体情况区别对待,不要一律删除。比如对于某名学生,若有少量课程成绩遗漏或出现0-100范围外的个别噪声数据则应考虑取平均成绩替代;若遗漏课程成绩门数较多(4门以上)或因学籍异动造成其数据无法有效参与比较,为保证分析的可靠性则应考虑删除。另外对于一些关于教师、课程、班级、专业维度信息数据的缺失或出现不一致的情况则进一步核实后加以填充。如有重修或补考成绩则均采用正考即首次成绩。

2.2数据的转换

对于考查课中的“优”、“良”、“中”、“差”四个层次,为了便于统一分析,应向百分制转换。这里对应关系为:“优”-90、“良”-80、“中”-70、“差”-50。此外,对于源数据表中各属性名、类型及长度都要统一设置并与成绩仓库中对应的维度表及事实表保持一致。

2.3数据的加载

上述各环节工作处理完毕后,接下来就是最后一步即数据的加载。首先在Sql Server 2008 Management Studio环境下建立一个名为“StudentMA”的数据库,然后利用Sql Server中的数据导入功能将已整理好的8个数据表导入到新建的数据库中,如图2所示。在载入目标成绩数据仓库数据库后,还需根据星型逻辑结构和物理结构的具体设计来设置好各表主/外键并为其建立相应索引。

3多维数据集的创建及OLAP技术的应用

3.1多维数据集的创建

进入Sql Server 2008 Business Intelligence Development Studio集成环境后,新建一个名为“学生成绩多维分析”的Analysis Service即SSAS项目,然后使用“解决方案资源管理器”来分别创建项目的“数据源”、“数据源视图”、“多维数据集”。其中“数据源”所对应的连接字符串代码为:

Provider=SQLNCLI10.1;Data Source=SWUST-573110AE0;

图2预处理后数据源导入SQL SERVER 2008

Integrated Security=SSPI;Initial Catalog=studentMA

另外,为了满足决策分析的需要,还需要再通过添加“平均成绩”计算成员来新增度量值,新建的“平均成绩”计算变量(avg? Score)所对应的MDX语句为:

CREATE MEMBER CURRENTCUBE.[Measures].avgScore AS round([Measures].[Score]/[Measures].[Score计数],0), VISIBLE = 1;

创建后的多维数据集视图如图3所示。

图3成功创建后的多维数据集

最后,对SSAS项目“学生成绩多维分析”加以部署和处理操作,部署并处理成功的结果如图4所示。

3.2多维分析及OLAP技术的应用实现

首先可利用SSAS自带的“浏览器”功能进行多维分析和OLAP操作[6]。在“浏览器”界面中,可根据用户的OLAP处理要求来对创建的CUBE加以自由组合其中的维度,只需将左侧窗口界面中的目标对象如维度、维度成员、度量值成员等直接拖动到窗口右侧的显示区域相应位置后即可查看OLAP处理结果。如果要进行数据筛选则需要将筛选条件所涉及到的相应维度名或其成员值拖放到右侧窗口上方的筛选字段指定区域。如图5所示。

另外,由于Microsoft Excel 2007全面支持Sql Server2008的SSAS服务,目前其作为微软前端展现工具中的一个重要组件已在商业智能方面得到了较为广泛的应用[7]。Excel 2007中的数据透视表和数据透视图可直接访问SSAS项目中对应多维数据集,这样就不必开发应用程序即可快速而灵活地生成各种图表及报表。因此可利用该组件来进行多维分析并展现分析结果。

下面通过Excel 2007中的数据透视表来进行多维分析。可在透视表窗口任意组合一些度量值和维度,直接拖动到EXCEL表格模型的相应行列中即可自动生成所需表格数据。如果想以数据透视图方式来展示数据则只需点击工具栏中的柱状小图标即可立即生成对应的透视图。在某些情况下,透视图的显示效果要比透视表会更加直观,如图6、7、8所示。

其中图6为教师、课程、班级所有学年学期信息的汇总显示,细节区域内容为班级人数和平均分;图7为信息工程系建筑设计技术专业在2009年第二学期教师、课程、班级及平均分信息汇总显示;图8为信息工程系道路桥梁工程技术专业在所有学年学期的教师、课程、班级及平均分信息汇总显示。

图4项目成功处理示意图

图5多维分析结果展示

图6利用PivotTables功能在EXCEL前台展示多维分析结果

图7利用EXCEL前台透视图功能展示多维分析结果一

图8利用EXCEL前台透视图功能展示多维分析结果二

4结束语

本文利用Sql Server 2008 Management Studio及Sql Server 2008 BI平台成功构建了学生成绩数据仓库并建立了数据集市,然后进行了OLAP即联机分析处理,最后利用Microsoft Excel 2007前台工具中的数据透视表及数据透视图组件对OLAP分析结果进行了直观展示,为管理者进行科学决策分析提供了重要决策依据。另外,增加数据仓库中的成绩数据量以及对成绩仓库中的数据进行深入挖掘分析将是笔者下一步主要研究内容。

参考文献:

[1]魏丽,王雁苓.高校学生成绩分析数据仓库的建立[J].吉林省教育学院学报,2010(6):42-43.

[2] Jiawei Han,Micheline Kamber.范明,等,译.数据挖掘概念与技术[M].北京:机械工业出版社,2007.

[3]罗跃国.高校教务系统数据仓库的建模及应用[J].长江大学学报:自然科学版,2009(3):235-237.

[4]王丽珍,周丽华.数据仓库与数据挖掘原理及应用[M].北京:科学出版社,2005.

[5]陈文伟.数据仓库与数据挖掘教程[M].北京:清华大学出版社,2006.

城市设计数据分析范文2

关键词:海绵城市;气象概念;问题思考;池州市

中图分类号:TU984

文献标识码:A文章编号:16749944(2017)12016004

1引言

随着我国城镇化的发展,气候变化对城市的影响日益显现出来。我国相当多的城市不仅面临着缺水问题,还面临着城市内涝,每到夏季,受强降水侵袭,“城市看海”在多地出现。城市建设带来的水资源紧缺、水安全威协、水生态恶化等问题已成为当下城市急需解决的难题。如何科学规划城市的空间布局,使城市在遭遇气象灾害时经得住考验,值得我们思考。因此,海绵城市建设已成为新型城镇化建设的迫切需求。

海绵城市是一种形象的表述,是指城市能够像海绵一样,在适应环境变化和应对自然灾害等方面具有良好的“弹性”,下雨时吸水、蓄水、渗水、净水,需要时将蓄存的水“释放”并加以利用[1]。自2015年4月国家启动海绵城市试点项目以来,目前全国海绵城市建设如火如荼。池州市作为全国首批海绵城市建设试点城市,各项建设顺利推进,一些建成的示范区,水患大为降低,减少了城市居民生命与财产损失。因此,有必要总结海绵城市建设中如何将城市气象灾害减少到最低限度的成功经验。鉴于海绵城市建设技术在国内尚属起步阶段,示范项目建设和推广实践较少,笔者结合工作实践,就海绵城市建设中的气象问题进行了探讨。

2“海绵城市”中涉及的气象概念

2.1雨水与降水

目前,我国城市排水基本上采取的是快排模式,雨水落到地面汇集后,通过地下管道排出。这种以“快速排除”和“末端集中”控制为目标的建设模式[2],往往容易造成逢雨必涝,涝旱急转,雨水的循环利用考虑较少。建设海绵城市,就是利用工程措施解决雨水资源流失、城市内涝灾害频发等一系列问题,减少市政管网压力和投资。优先考虑把有限的雨水留下来,涵养城市水资源,补充城市地下水,促进城市水循环。由此可见,海绵城市具有两大功效:一是防治城市内涝,二是雨水的收集利用。

显然,这里的“雨水”实际上就是气象上所说的降水。降水是水自然循环的重要环节,是地下、地表径流的唯一源泉,也是人类水资源的唯一来源。建设海绵城市,首要问题就是要摸清楚城市降水的底,在防治城市内涝和雨水收集利用上做文章。海绵城市依据的重要数据是城市水循环中自然降雨量的多少,这是涉及气象的核心问题。

2.2年径流总量控制率与设计降雨量

在《海绵城市设计技术指南》中,有两个术语c气象关系十分密切,即年径流总量控制率和设计降雨量。

作为海绵城市的设计和考核指标,年径流总量控制率是根据多年日降雨量统计数据分析计算,通过自然和人工强化的渗透、储存、蒸发(腾)等方式,场地内累计全年得到控制(不外排)的雨量占全年总降雨量的百分比。而设计降雨量是为实现一定的年径流总量控制目标(年径流总量控制率),用于确定低影响开发设施设计规模的降雨量控制值[3],一般通过当地多年日降雨资料统计数据获取,通常用日降雨量来表示。

2.3城市内涝

海绵城市建设是针对城市内涝现状提出来的。城市内涝是指在城市区域遭遇暴雨或短时强降水天气后发生的气象衍生灾害。当城市地区降水量过多,超过其排水能力时,往往形成低洼地段积水,当积水过深、范围过大,影响到城市交通、居民生活和生产活动时即形成内涝气象灾害。

根治内涝的关键是要保护和恢复城市内原有的河湖、湿地、坑塘等具有集水涵养功能的自然“海绵体”,通过科学规划,完善城市排水防涝系统,打造人工湿地、雨水花园、下沉式绿地、“绿色”屋顶等人工“海绵体”,就地蓄留和消化雨洪,提高城市防御内涝的能力。

2.4暴雨强度公式

城市内涝在很大程度上是由暴雨造成的。城市排水系统的工程预算和相关设施建设与其设计的流量,特别是暴雨形成的流量息息相关。一般说来,设计流量的合理计算依赖于所采用的暴雨强度公式的精准程度,其计算结果直接影响城市排水工程的安全性与经济性。

暴雨强度公式是描述降雨量、降雨历时和重现期三者之间数学关系的经验公式,它依据水文气象频率分析的理论,基于已有的降雨记录数据,采用数理统计的方法得到的城市暴雨量、暴雨强度、降雨历时、时间空间的分布等,是科学表达城市降雨规律的一种方法[4]。

目前我国城市建设所采用的暴雨强度公式多为20世纪80年代初期编制,受当时气象资料、观测站点及计算条件所限,准确性大大降低。近30年来,在气候变暖的背景下,极端的暴雨频率、暴雨强度和局地强降雨特征发生了变化,现行的暴雨强度公式已不能客观反映当地暴雨的实际情况,因此,有必要重新修订和编制适用性更强、精度更高的暴雨强度公式,以适应“海绵城市”建设的需要。

2.5降水监测和内涝风险预警

降水监测是城市内涝风险预警的前提。由于城市各区域内地形地貌不同,遭遇强降水时,各处的内涝程度也不尽相同。因此,有必要开展易涝点的实地调查和研究,圈定易发洪涝及积涝点,划分高风险区域。要利用区域自动气象站的实时雨量观测数据分析雨情,为内涝风险预警提供参考依据。同时要根据强降水的监测,及时强降雨临近预报和城市内涝风险预警信息。

随着海绵城市建设的深入,越来越多城市的气象部门在开发研究以城市内涝仿真模拟为基础的城市内涝风险预警系统。在城市遇到强降水时,可根据自动雨量站的逐时雨量、应用数值预报产品、雷达估测、预测降水产品等,结合城市河道、路面、地下管道等多种不同地理信息,模拟出城市积水深度,并实现城区分区预警,全面提升城市内涝灾害的预报预警服务能力。

2.6城市干旱与缺水

城市缺水的主要原因是少雨干旱,此外,城市地面硬化面积的增加,使城市内能够涵养水源的绿地、湿地、河流、湖泊面积减少,破坏了自然水循环,加上地下水过度开发,城市水资源便会出现紧缺。

解决城市缺水问题,应顺应自然,在确保城市排水防涝安全的前提下,最大限度地实现雨水在城市区域的积存、渗透和净化,补充地下水、调节水循环。同时,应加强生态绿地等“海绵体”建设,涵养水资源。在干旱缺水时,可发挥“海绵体”的功效,让这些涵养和蓄存的水资源能够“释放”出来,并加以利用。

当然,在城市干旱缺水严重时,气象部门开展人工影响天气,选择合适时机,适时启动增雨作业,在一定程度上也可缓解城市旱情和缺水问题。

2.7城市热岛效应

城市热岛效应,是指城市市区的气温高于郊外的一种气候现象。由于城市的工业、公共设施与居民等耗费大量燃料,使城市成为一个重要热源。无论从早上到日落以后,市区的气温都比周边地区高,相对于温度较低的农村,城市好像是一个“热岛”[5]。

减轻热岛效应的关键是改造城市的生态环境,最有效的措施是增加城市的绿化面积,增加市区的水体容积,营造新的小气候。开展城市绿化既可美化环境,又可调节空气温度、湿度是改善城市气候的途径之一。城市水体的热容量大,在吸收相同热量的情况下,升温值最小,表现出比其他下垫面的温度低;水面蒸发吸热,也可降低水体的温度[6],在一定程度上能够缓解热岛效应。

3池州市海绵城市建设分析

3.1自然气候

池州市位于安徽省西南部,长江中下游南岸,市域地形为东南高、西北低,自南向北呈阶梯分布;境内有三大水系十条河流,江河湖水面348.4 km2,占总面积的4%,水资源极为丰富。池州市属暖湿性亚热带季风气候,季风特征明显,雨量充沛,但是自然降雨的季节分布却极不均匀,根据池州地面气象站的观测资料发现,池州市每年2~11月均有暴雨发生,其中5~8月为暴雨多发时段,暴雨日数占全年的78.9%。近50年的气象统计数据显示,池州市的年平均降水量为1556.1 mm,其中总暴雨1107 场次。由于其地理位置和环境十分复杂,天气复杂多变,池州市降水年际变化大,春、夏季易涝、秋、冬季易旱,总的说来,旱、涝年份多于风调雨顺的年份。

3.2背景与现状

作为中国第一个国家生B经济示范区,池州市拥有园林城市、森林城市的称号,具有得天独厚的“海绵城市”架构,市区内绿化面积大,水体容积大,水域面积占中心城区面积的11.7%,湿地面积达11 km2,天然“海绵体”硕大丰满。然而,伴随城市在短期内的急剧扩张,快速的城镇化挤占河湖,城市建设侵占雨水通道和雨洪调蓄空间,河流行洪能力减弱;同时,由于城市排水系统不完善,原有城市排水管网规划设计标准偏低,排水基础设施滞后,严重降低了城市调蓄水量的能力,在遇有强降水条件下,无法及时排除地面积水。加上城区受到长江洪水和上游山洪的双重威胁,一方面,下游城区段直接受长江水位顶托;另一方面,上游山洪未得到有效控制,涝情显得尤为严重,城区内不少易涝点往往不堪重负,积水成涝。

据池州防汛部门统计,近几十年来,池州主城区多次发生水灾,内涝严重时,中心城区易涝点高达200多个,主要积水区域有30多处,多表现为市政道路、居民小区积水,阻断城市交通,带来严重损失。由此可见,池州市海绵城市建设的重点是要解决好城市的内涝问题。

3.3规划目标

为积极保护和改善城市环境现状,引导海绵城市建设示范区及其他新建的建设项目实践低影响开发建设模式,池州市在成功申报全国首批海绵城市建设试点城市过程中,制定了《池州市海绵城市建设水系及湿地规划》,根据规划,选取中心城区核心区域18.5 km2的范围,辅之点、线示范,先行先试。示范区覆盖池州市主要建成区(老城区)和典型新城区(天堂湖新区)。其中,老城区10.68 km2,占比57%;天堂湖新区为7.82 km2,占比42%。试点区域人口17.6万人。同时,专门编制了3年实施计划,计划建设水生态水安全系统等5 大类117 个项目。到2017年底,示范区年径流总量控制率72%,对应设计降雨量24.2 mm/d,城市内涝防治标准达30年一遇,城市防洪标准达100年一遇,基本建成现代雨水控制利用系统和海绵城市建设长效管理机制。

此外,池州市天然拥有丰富的水系,城市内河管道复杂,平天湖、天堂湖、月亮湖和秋浦河、白洋河、清溪河所构成的“三湖三河”六块“大海绵”,为池州市打造“海绵城市”提供了充足的自然优势,方便在降雨的时候充分将雨水留住。在这样的前提条件下,通过科学规划,优质施工,可以为雨洪创造足够的蓄洪空间并进行资源化利用,充分发挥自然海绵体系功能,既能在多雨时避免洪涝,又能在干旱时缓解缺水,真正构建名副其实的“海绵城市”。

2017年6月绿色科技第12期

4海绵城市建设中的气象思考

海绵城市建设是一个全新的课题,如何在海绵城市建设中更好地发挥气象的作用,有如下思考。