数据治理范例6篇

前言:中文期刊网精心挑选了数据治理范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

数据治理

数据治理范文1

Ron Ben Natan 博士是IBM Guardium公司副总裁兼首席技术官,一位军人出身、有着20多年数据安全领域从业经验的专家。2009年随着IBM收购Guardium而进入IBM。大数据是这位安全专家新近重点关注的领域。自然,作为安全专家,Ron Ben Natan博士的视角还是落在大数据的安全、审计等与数据治理相关的问题上。

在Ron Ben Natan看来,随着大数据热的持续升温,大数据的应用开始从互联网企业向金融、电信、制造等传统企业渗透,安全和审计需求正在逐步显示出来,如何在充分挖掘大数据潜在价值的同时确保企业信息的安全与合规开始引起业界的关注。

大数据的安全隐患

大数据为数据分析开启了一个新的世界。以Hadoop为代表的大数据处理平台利用开源软件结合通用服务器实现了商业智能,大大降低了商业分析的门槛,从而惠及了更多普通的中小企业。然而,由于大数据是一种数据集中存储的方式,这种集中存储也给企业的信息安全带来更高的风险。

“总结过去有关数据安全的事件,90%以上都与数据库相关。应该说,把好了数据库的安全关,大部分数据安全的问题也就基本解决了。如今,大数据面临的安全风险与数据库是非常相似的。”Ron Ben Natan说。

Ron Ben Natan解释说,目前来看,大数据的安全问题还不是特别突出。原因在于早期的大数据用户主要是互联网公司,比如谷歌、亚马逊以及一些电子商务网站,其应用侧重于对用户上网后的点击行为进行分析,用于了解用户对品牌的偏好、挖掘新的商业机会等,其安全问题还不突出。不过,随着大数据的用户向更多行业和领域进行扩展,比如,在金融和电信领域,一些大数据应用就涉及用户的隐私,此时,安全问题就会显现出来。

“即使在互联网公司,也不能说大数据的安全就不重要。实际上,如果社交网站把用户的一些网页浏览行为等信息泄露出去,也可能带来非常不好的结果,至少会引发用户对它的不满和不信任,最终可能导致客户的流失。”Ron Ben Natan说,比如,Facebook现在有超过10亿用户,它如果出现安全漏洞,可能影响这10多亿的用户,其影响是很大的,因此,这类互联网公司对数据安全也有很高要求。

来自合规的推动力

就大数据的安全而言,除了确保数据本身的安全这个需求外,合规也是一个重要的推动力,尤其是对一些上市公司而言。

“一些用户常常只是重视数据本身的安全需求,而较少注意到合规。其实,不少法律、法规都会对数据安全有着严格的规定,保证合规也是确保信息安全的重要手段。”Ron Ben Natan表示。

Ron Ben Natan认为,合规和安全本身追求的目标本质上是一样的。“为什么我们会制定法律、法规对安全进行监管,就是因为过去曾出现过数据泄露。比如,过去几乎所有数据的泄露都是发生在数据库,所以相关部门制定了很多法律法规来专门针对数据库的安全。”

Ron Ben Natan表示,大部分的法律法规提出的各种合规要求不只是确保数据安全,还会要求监控对数据库的访问行为,这一点对像APT(高级持续威胁)这样的攻击行为非常关键。如果不监控数据的访问行为,数据可能泄露很长时间了都不知道。比如,APT攻击发生后,数据非法访问就可能会持续很长的时间。

借鉴数据库的最佳实践

目前,大数据相关技术还处于发展过程之中,因此,大数据的安全技术也在继续演进,好在过去几十年来,人们在数据库安全方面积累了非常丰富的经验,这些宝贵的最佳实践完全可以复用到大数据的安全方面,这也正是Guardium将业务从传统数据库领域拓展到大数据的重要原因。

Ron Ben Natan介绍说,Guardium从10年前成立以来在数据库安全方面积累了丰富的经验,也有着很多的相关产品。通过这些产品可以实现从用户、应用服务器到数据库的全程跟踪即可记录,实现对数据的全方位准确监控(来自网络的访问和本地登录访问),确保企业对 SOX、PCI等法律的合规。这些行为不依赖于数据库的日志,对数据库服务器性能影响极低,大大优于数据库本身的审计产品。因此,拥有非常多的用户。

“此前,Guardium专注在数据库的安全,如今我们延伸到大数据,为大数据的软件环境提供。这个过程中,我们把过去在数据库方面学到的经验和教训,应用到大数据的环境里面。” Ron Ben Natan表示。

实际正如Ron Ben Natan所言,Guardium已经把这些经验复制到大数据解决方案中。比如,在其大数据安全解决方案中同样首先要保护敏感数据,监控特权的用户,包括授权用户、管理员等。

数据治理范文2

数据治理体系概述

具备高度信息化管理能力,是国内银行向“以客户为中心”转型的要求,是银行业务决策、客户营销、内控管理向精细化发展的要求,是发挥风险管理技术应用价值、共享全行风险管理经验、全面提升风险管理能力的要求。随着信息科技的日益发展,银行多年来为实现业务自动化处理建设了庞杂的IT应用系统,存储在这些应用系统中的海量数据为银行实现信息化管理提供了坚实的基础。比如非零售信贷风险中的违约率计算、财务分析等,零售信用风险中的催收打分卡、申请打分卡等,市场风险计量、操作风险事件识别等,高级风险技术中的经济资本计量、风险调整后资本收益率(RAROC)计算等相关指标考量,都需要银行对客户、客户集团、交易、合同、市场信息、产品、财务甚至IT系统操作信息等3~7年的数据积累以及整合与应用。如何为精细化管理提供高效、高质的数据支持,数据治理由此成为商业银行面临的重要课题。

商业银行数据治理的内容,主要包括建立数据治理机制、数据管理制度及流程,以及数据标准制定等。数据治理的最终目的是提升数据质量,通过有效的数据整合、数据应用与数据服务使企业真正具备业务信息化管理能力。其中数据应用与数据服务包括面向财务管理、风险管理、绩效考核、客户营销四个方面的支持。

构建全面的数据治理体系,需从组织架构、管理流程和操作规范、IT应用技术、绩效考核支持四个纬度,对企业数据模型、数据架构(包括数据仓库、数据应用)、数据管理(包括数据质量、数据标准、元数据管理、数据安全等)、数据生命周期等各方面进行全面的梳理、建设并且持续改进。可以简单概括为:明确数据治理主体、建立数据质量标准、加强数据生命周期的全过程管理。

银行数据治理实践探索

数据治理历程与规划

自2005年始,光大银行用六年完成了企业级基础数据平台(即数据仓库EDW)的建设,并整合了核心系统、对公信贷系统(CECM)、个贷系统、网银系统、国际结算系统等41个源业务系统数据,在有效整合全行数据的同时完成了银监会非现场稽核报表(1104)、人行大集中、信用卡BI、电子银行BI、信用风险集市、风险加权资产(RWA)、资产负债等19个数据集市和应用的建设。

伴随数据仓库和数据应用的建设,光大银行制定了数据标准的五年规划并展开实施,秉承定义、执行、监督检查三者并重的原则,先后完成了客户、产品、渠道、交易、关键统计指标、内部机构以及风险主题数据标准的定义。2009年基于客户数标准,推进全行对私统一客户管理系统(ECIF)的建设。2010年基于风险新资本协议相关数据标准推进了RWA数据集市建设。2011年完成了全行渠道类型数据标准在各交易系统中的落地改造。鉴于数据标准实施的难度,未来光大将持续落实数据标准实施规划,做好数据标准系统落地以及监督评价工作,并结合数据质量管理、数据应用与数据服务的要求准备下一个实施周期的规划。

数据治理组织与规范

为保障全行数据治理相关工作推进,光大银行从下到上由几个层面的组织构成:第一层面由数据使用相关各业务部门组成,它们负责本条线的数据标准制定和数据质量管理,例如风险管理部设立了数据管理岗,专门负责数据管理相关工作;第二层面是由计财部、科技部组成,它们是银行IT战略委员会下设数据标准小组的牵头管理部门,负责数据标准实施的管理和组织推动,以及数据质量的综合管理;第三层面是审计部,负责数据管理、数据应用、数据服务过程的审计、监督、评价;更高层面是董事会和行领导的关注,审计委员会和风险管理委员会的明确了相关职责。

随着数据仓库以及数据标准的实施,光大银行逐步制定了数据治理相关管理规范,最终落实在数据标准和数据质量的绩效考核指标上。只有合理制定数据治理相关考核指标并切实推进到业务基层,才有可能从数据产生开始实现对数据的真正治理。例如光大银行已经制定的风险数据补录质量考核指标、对公客户信息准确性考核指标等。

数据治理应用与管理

一般包括数据仓库、数据应用、数据服务、数据管理(包括企业元数据管理、数据标准、数据质量管理等)等技术平台的建设和应用。光大银行在建设数据治理相关应用过程中,充分结合数据标准的落地,使数据在整合、应用以及管理过程中实现统一标准管理(见图)。

数据治理助力风险管理

数据治理机制使风险管理有数据可依,也使高级风险技术发挥真正价值。首先,风险数据集市支持RWA的整合计算。风险数据集市是建立在数据仓库基础上面向全行风险管理主题的数据集合,是全行风险管理数据分析、业务决策的重要数据基础。同时,整合数据支持风险偏好评估管理。银行风险偏好计算评估是内部资本充足评估流程(ICAAP)的重要组成部分,风险管理通过风险限额、准入管理等方式对业务发展进行控制和调节,资本管理通过经济资本分配以及绩效考核等手段在各业务线、产品对资源进行最优配置。数据仓库以及风险数据集市为风险偏好计算评估提供了高效、准确、整合的信用风险、市场风险、操作风险以及计划财务的数据支持。

关于数据治理的思考

如何评估银行的数据治理能力,目前可以通过信息导向架构进行初步衡量。该架构包括数据文化、数据管理能力、数据应用建设能力三个方面,其中数据文化是衡量银行从组织层面是否具备信息化管理能力,也是数据治理体系实施是否成熟、是否成功的重要衡量标准。

培养业务管理信息化

银行高层管理人员应适应业务精细化管理的要求,培养依靠数据信息进行业务管理决策的意识和习惯;中层业务经理要养成用数据信息分析业务、分析客户,依靠数据信息进行业务创新思考的习惯,并具备基本数据分析的能力;基层业务人员要培养信息收集的习惯,应具备在日常业务操作中保证收集信息的数据质量和数据安全的意识;同时,人力资源和绩效考核部门需通过制定信息管理培训计划以及涉及信息管理绩效考核指标与相关奖励机制(如信息收集、数据质量提高等都需要通过绩效和奖励来激励一线员工执行),帮助和促进信息化管理文化在银行各级机构层面的落实。

建立数据治理长效机制

管理层应对数据治理予以高度重视,在梳理并完善企业数据体系架构的基础上制订长效机制,确定适合银行文化、高效的数据治理管理组织架构。采用虚拟组织与实体部门相结合的管理模式,有利于数据治理过程中的横向协调和纵向有效落实;定期重检数据治理相关制度、流程、规范;规划与评价并重,合理规划是复杂的数据治理过程有序进行的必要保证,定期评价回顾规划落实,根据评价结果及时调整规划策略是数据治理真正发挥价值效能的必要手段。

坚持信息科技建设创新

将先进的科学技术快速应用于数据管理与数据服务中。例如,研究并建设集数据服务、数据管理、数据分析共享社区为一体的开放式数据服务平台,为实现全行业务信息化管理提供应用支持。

数据治理范文3

关键词:大数据;税收治理;隐私保护

一、引言

税收工作是关乎国计民生的大事,其科学性和合理性直接影响着国家发展、社会稳定和民生保障。信息化时代背景下的税收治理工作充分发挥大数据等信息化技术的优势,提高了税收治理宏观控制的同时却忽视了对纳税人隐私的保护。以我国新个税法为例,其体现了税收政策与时俱进、以人为本的理念,但也出现了纳税人隐私暴露等问题。根据我国现状,对大数据下税收治理的隐私保护问题进行分析研究,成为社会各界讨论的焦点。

二、纳税人隐私权概述与理解

所谓的隐私权,是法律赋予公民所享有的私人信息以及生活中受法律保护的,使公民不会受到非法侵扰的权益,公民隐私权的一个重要前提是必须与公共利益无关。隐私权是法律赋予公民的一种相对独立的人格,其主要包括了公民隐私的保护权益、使用权益、支配权益和救济权益。纳税人隐私权是法律赋予纳税人所享有的上述内容,税收机关在依法采集和保存纳税人隐私信息的同时,有义务对纳税人隐私信息进行依法保护和管理。通常情况下纳税人隐私权是针对自然人而言,而法人纳税人的信息归为商业机密范畴内,对于法人纳税人中涉及的企业股东、法人代表、管理层等自然人的隐私信息同样属于纳税人隐私权的范畴。

三、大数据下税收治理的隐私保护现状

在我国目前的税收治理体系中,纳税人的证件号码、工作单位、家庭住址等个人信息以及家庭成员信息等内容均应在税收机关对纳税人隐私保护的体系范围之内,当然除此之外的财产信息也都属于纳税人的隐私。但是比较复杂的一个问题是在对于隐私权利边界的确定上,很难给予一个明确的定义,隐私保护的主要目的是为了保护纳税人的个人权益不受侵害,尊重纳税人的人身自由。因隐私权的边界确定问题,致使大数据下的纳税人隐私保护方面问题比较突出。1.税收机关定位不清晰,纳税人隐私保护权责关系模糊。我国税收政策经历多次调整,每一次调整都是在与时俱进、以人文本的基础上对税收政策的变革和创新,但经历多次改革和创新的税收政策始终没有在税收征管方式上有所变化。税收机关工作过程中对于自身的定位模糊不清,致使民众和社会经济体依法依规纳税的主动性和积极性受到了影响。大数据下的税收工作为了提升纳税人的主动性和积极性,在获取纳税人的纳税信息后会对信息内部的逻辑性进行分析,确定和发现规律,以便于税务机关工作的开展。同时,这些纳税信息会在财政、人力资源等部门以及行业内进行流动和分享,以保证税收的公开透明。从隐私保护的角度出发,这种情况无疑使得纳税人隐私存在很大的泄露风险,或者说这种行为本身就是对纳税人隐私保护不到位的体现。随着全社会对隐私权保护重视程度的不断提高,一些地区的税收机关已经认识到该问题,但由于对纳税人隐私保护的权责关系不明确,致使各部门之间存在相互推诿扯皮的现象。2.法制建设滞后,税法中对纳税人隐私权的保护存在空白。我国现行的税收政策中,税种是由相关部门所制定。从法律体系上看,某一个部门制定的税种其法律地位有待商榷。而随着建设步伐的不断加速,我国的社会主义经济市场发展十分迅速,市场经济呈现欣欣向荣的景象;市场经济的快速发展也使得其多样性和复杂性有了明显提升,而与之相关的税法却并没有做出与时俱进的调整。所以就目前的情况看,我国的税法建设已经滞后于社会经济发展。税法建设的滞后性增加了税收治理过程中的不确定性,使得税收治理的风险性也随之增加。大数据技术在税收治理中的积极作用毋庸置疑,但是大数据技术也对税收数据提出了较高的要求。以税收数据的采集和共享为例,数据的流动和共享势必会增加数据丢失、盗取的风险,而我国目前的税法并没有对大数据下税务数据管理在权责上进行明确的规定,这使得纳税人的隐私保护受到了很大威胁。我国税法中在纳税人隐私权保护上存在空白,税法建设和完善还有很大的提升空间。加强税法建设的与时俱进、提高税法建设的社会发展导向是大势所趋。3.税收治理格局停滞不前,隐私权保护参与度较低。我国税收治理格局中,税收治理的主体是税收机关和纳税人,协税护税组织由财政、审计机关组成。就目前的情况看,我国的协税护税组织建设存在一些问题。例如,协税护税组织成员缺少社会组织和民众的参与;审计、财政等部门对于协税护税的意识和工作定位不明确;协税护税组织内部管理制度不健全等。目前的协税护税组织主要来源于政府的财政和审计机关,其在税收治理的专业性上存在一定不足,加之协税护税意识不高,其在提高纳税人依法纳税意识、监督审查纳税人依法纳税情况、税收数据和信息管理与监督等方面发挥的发用非常有限。纳税护税组织建设上的一系列问题,使得其作用发挥有限,有的地区甚至形同虚构,纳税护税流于形式。税收治理格局发展停滞不前,使得纳税人参与税收治理的机会寥寥无几,而且纳税人对税收治理的认知度并不高,对于纳税治理中的纳税人隐私保护更是知之甚少。4.信息技术自身发展不足,纳税人隐私管理存在风险。以大数据为代表的信息技术的应用很大程度上提高了税收治理的现代化,保证了税收的质量和效率,但是其带来的风险和问题同样不可小觑。税收治理中的大数据、云计算等信息技术的运用都是依托互联网,而在互联网下的纳税人信息的采集和共享有可能受到网络病毒的攻击,互联网下的纳税人信息存储也可能受到黑客的恶意窃取,从而导致纳税人隐私泄露。加强大数据技术应用的同时,提高其安全性和稳定性成为大数据下税收治理工作可持续发展的重要方向。

四、大数据下税收治理的隐私保护应对举措

大数据下的税收治理实现了数据治税,工作人员通过大数据技术能够快速准确地采集纳税人的相关数据后对纳税信息和数据进行分类、分析和计算,并利用互联网和移动通讯实现数据的流通和共享。在数据流通和共享的基础上,税务系统还可以实现纳税人管理、税务申报和支付,进一步凸显了信息化技术对税收治理在效率和质量上的重要性。1.加快税务行政职能的改变,进一步明确纳税人的责任。纳税人作为税收治理的主体之一,也属于协税护税的主体。税收部门有责任保障纳税人对税收治理过程中的知情权,在税收治理过程中的相关工作要保持公平公正、公开透明的办事原则,加强对依法依规纳税的宣传和推广,建立纳税人诚信纳税系统,并同其他诚信体系进行关联,以此来促进良好纳税环境的建立。政府职能转变下,税收部门的职能也要做出相应的改变,以呼应政府职能转变。大数据下的税收治理可以对纳税人的历史纳税信息以及纳税时间进行有效的管理。鉴于此,税务部门需要进一步健全纳税人管理,学习社会其他组织的管理经验。例如,建立纳税征信系统并与银行等第三方的征信系统连接,将存在偷税漏税行为的纳税人列入失信名单;将法律规定的纳税期间进行划分,不同的纳税期内采取一定的优惠政策;对于未能按时纳税的纳税人,通过纳税系统,将其信息提交给执法机关,由执法机关依法对其进行处罚等。税收机关职能的转变要以规范纳税人的行为,提高纳税人依法依归纳税的积极性和主动性为目标,保证税收政策的有力贯彻与执行。2.健全和完善税法体系,提高税收治理的法制性建设。纳税人隐私保护同样属于税收治理的范围内,健全和完善税法体系,进一步明确纳税人隐私边界问题,并对纳税人隐私保护制定相应的法规制度是提高纳税人隐私权保护力度,提高税收治理法执建设的关键举措。税法中对纳税人隐私保护上的空白,使得纳税部门在对纳税人隐私信息保护中缺少相应的法律依据,通过健全和完善税法,使得税务部门对于纳税人隐私信息保护能够有法可依、执法必严、违法必究。大数据技术为税收治理质量和效率提升带来了便利,但大数据下的税收治理同样要在法律规定范围内开展,健全和完善税法体系,同样有利于大数据在税收治理中的作用发挥。例如,税法中应对税收系统的安全性建设作为明确的规定,对保存纳税人信息的数据库在安全等级、风险抵抗能力上进行要求,利用法律的约束性提升税收系统的安全性。3.强化税收治理的监管,提高纳税人隐私保护力度。大数据下的税收治理中对纳税人隐私权的保护,除了要通过法律体系的建设来提升外,还要在税收治理的监管上提高保护力度。税收部门作为税收治理的主体,要加强自身对纳税人隐私权保护的力度,建立纳税人隐私权保护制度,对纳税人隐私保护进行细化,明确隐私内容、惩罚措施以及法律责任;对于内部分工作人员恶性泄露、贩卖纳税人隐私信息的情况,要加大处罚力度;税收部门应该积极地开展社会公众监管,建立网络维权和电话维权,鼓励民众通过互联网和电话热线对恶意泄露纳税人信息的行为进行举报。在加强对税收治理监管的同时,税收部门要培养和提升工作人员对纳税人隐私保护的意识,通过讲座和培训,提升工作人员对隐私权保护的认知和理解,加强其对保护纳税人隐私信息的重视程度。4.大力发展第三方协税护税组织,提升税收治理质量。第三方协税护税组织的成立和加入,对于提升税收治理的质量,防范税收治理中存在的风险具有积极作用。第三方协税护税组织同财政、审计部门虽然同属于协税护税组织,但因为自身性质的不同,其可以有效地开展内部监督,促进各方主动履行职责。在纳税人隐私保护上,第三方协税护税组织处于社会组织的位置上,对于税收治理中的纳税人隐私保护中存在的问题看得更全面、更清楚,对于其产生的原因以及治理措施会有更加独立的见解。虽然第三方协税护税组织的加入对税收治理具有积极的影响,但必须加强对其管理,以使得其作用能够得到充分的发挥。政府要建立严格的协税护税组织准入机制,完善对协税护税组织的管理制度、行业标准,规范其行为准则;同时政府要加大对协税护税组织的监管力度,建立奖惩措施,引导其正确履行自身职能。5.加强信息化新技术的应用,提高税收治理中隐私安全性。大数据下的税收治理工作需要完善的税收系统作为支撑,完善的税收系统不仅具备纳税人管理、税费缴纳和支付、税务信息采集与处理等功能,还要具备强大的安全管理功能。加强对现阶段税收系统的建设,要借助大数据技术在数据采集、汇总、分析上的优势,对税务治理中存在的风险进行有效防控。同时,要完善纳税人信息数据库的建设,加强数据库安全方面的投入和对纳税人信息安全性的管理。数据库安全管理中,需要对纳税人隐私边界进一步的明确,制定纳税人信息查阅制度,明确哪些人可以查看纳税人信息,能够查看哪些纳税人的信息,能够查看纳税人的哪些信息;纳税人信息查阅制度要对信息管理部门的工作职责进行明确,提高管理部门对纳税人信息安全性的重视程度。

参考文献

1.汤火箭,宋远军.大数据时代个人所得税征管中第三方涉税信息共享制度研究.税务研究,2020(01).

2.金元浦.论大数据时代个人隐私数据的泄露与保护.同济大学学报(社会科学版),2020(03).

3.马伟杰.对实施大数据治税的几点思考.中国税务,2019(12).

数据治理范文4

《纲要》体现了国家层面对大数据发展的顶层设计和统筹布局,为我国大数据的应用提供了行动指南,最终目的就是利用大数据提升全民数据意识、发展数据文化、释放数据红利、打造数据优势。相较以往,此次发展的目标更明确,内容更全面。《纲要》对大数据的定义是,以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。大数据不等同于海量数据的集合,而是可被利用的海量数据集合。同时,大数据应具有以下特征:

第一,大数据可以创造价值。根据已有的数据发现联系是大数据能够创造价值的基础。2012年达沃斯论坛的报告《大数据 大影响》宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样,叫数据资产,它的价值赛过黄金。当前,大数据已经在政府公共服务、医疗服务、零售制造等各个方面得到广泛应用,而且产生了巨大的社会价值和产业空间。

第二,大数据推动数据共享开放。大数据时代政府需和各个社会组织、社会主体合理共享,在共享最新数据的基础之上,发挥各自的发展优势,深度挖掘数据的价值。数据的共享开放可以让政府少管一些事情,节省很多的人力,同时也能解决大部分公共事务信息不对称问题。

第三,大数据可以预测未来。大数据是以分析大量数据的相关性为基础进行预测,这是大数据不同于海量数据的最重要的特征。在掌握数据的情况下,才能做出科学的预测,才能做出正确的预判。当前,大数据可以对人们的需求、灾害、犯罪的发生等问题进行分析预测,有了大数据作为支撑,各类商业服务和社会服务将更为精准有效。

二、大数据对社会治理环境的影响

随着互联网、云计算、大数据的发展,政府面临的社会环境将会更加复杂,社会治理方法也会更加多样。社会治理环境的变化主要集中在:①政府所处的社会环境将更加开放,并且将更为深刻地遭遇到互联网、大数据等方面的影响和冲击;②社会治理的方法将更加统一高效,大数据将在治理过程中发挥决定性作用,而政府权力将会进一步收回,交由社会组织配置;③社会环境的变化将更加全面和系统,政府将在更加民主、法制、开放的社会环境下进行治理。

互联网技术的发展突破了时间和空间的限制,催生了大数据的生成。大数据对社会治理发展趋势的影响主要集中在治理环境和治理方法这两个方面,并表现出以下几个特征:

其一,大数据使社会治理环境变得空前开放和自由,社会治理环境的改变要求政府必须树立开放的社会治理理念。首先,在大数据时代,人们查询数据的途径已经不再只依赖官方网站,这样就倒逼着政府必须实现真正的开放和透明。其次,在大数据时代,公民发表自己的观点和评论非常简单且易于搜集,过去带有较强政治性的参与逐渐演变成了一种普遍性的公民参与,这种参与会为政府的下一个决策进行引导。最后,大数据拓展了社会治理的范围,并使社会治理更为精准化。由于信息的双向交流,大众的广泛参与,社会管理模式从以往的方格化演变为网络化,从而使政策制定更为人性化。政府要掌握、整合和协同各种类型的基层数据,建立服务型政府。

其二,大数据有助于形成统一高效多样的社会治理方法,使社会管理领域的公共政策实现精细化和科学化。首先,大数据时代对政府理念的影响是包容,大数据里的数据类型非常多,而且来自方方面面,政府需要将这些数据整合起来,去包容和协同。其次,大数据时代最大的转变是放弃对因果关系的渴求,而关注相关关系。换句话说,现在只需知道“是什么”,而不需要知道“为什么”。再次,大数据时代似的政府决策更加科学和高效。大数据促使社会治理更加及时,因为大数据有助于政府实时甚至预先了解发生的问题,做到预测社会需求,预判社会问题,防患于未然。同时,大数据会实现社会治理的高效和节约,可以极大地节约相关部门和公民本人的时间及精力。大数据还促使社会治理方式的多样化,比如让更多人群进行自我管理的自组织模式。最后,在大数据时代下,社会治理将面临着更大的约束,尤其是社会治理现代化问题。为确保社会治理现代化,既要构建一个真正的电子政务平台和应用体系,又要应用社会治理的新模式――云治理。云治理只是一个手段,最终要走向全面治理和微治理。

三、大数据时代下的社会治理风险对策

在大数据时代,社会治理模式、治理方法都在发生改变,社??治理的主体也更为多元化,大数据在产生积极影响的同时,也面临一些挑战。首先是数据安全挑战。在大数据里,人们的活动都能被看到和记录,人们已经没有隐私了,因此信息的安全性和保密性非常重要。其次是大数据的技术性风险,这类风险不是人为可以控制的。政府应尽快适应大数据带来的新的治理环境,转变角色定位,制定有助于大数据发展的制度规则,引导其在社会治理过程中产生积极影响。

第一,建立统一的元数据标准体系。这是政府实现对大数据合理运用的基础。标准体系应包含大数据生成、发展及的数据标准格式,便于数据的无缝隙统筹整合,使原本散落在各部门的数据信息整合起来,打破“信息孤岛”状态。

第二,建立防范风险的制度。这是政府实现对大数据合理规制的保障。大数据时代下,挖掘商业价值和保护个人隐私的矛盾日益凸显,技术性风险也不再是人为可控的。因此,建立数据资源的应用规则,界定数据资源的归属,限制数据资源的使用范围,用制度将技术风险约束在一定范围内,确保信息的安全性和保密性。

第三,调整社会治理结构。这是政府适应大数据时代下社会治理环境的前提。大数据时代使社会治理主体更加多元化,各主体在共享最新数据的基础上,发挥各自的优势。政府可依托互联网技术,发展众包、众筹等方式的自我管理的自组织模式,参与公共服务;鼓励社会组织承接城市公共服务;引入第三方机构对社会服务方案进行设计与评估,凝聚大众智慧,形成内外结合、各主体协同治理的新格局,让政府的治理结构有效地嵌入到社会治理网格化结构中。

四、大数据时代下社会治理研究的趋势

在互联网、大数据、云计算的影响下,社会治理的环境发生了重大的改变。互联网技术和大数据的发展为社会发展带来便利的同时,也对传统的治理方式提出挑战。这些变化对社会组织的发展和社会治理理论的研究提供了一系列新的主题,构成了前所未有的研究机遇。

首先,在构建社会治理的新模式上,云治理应该是未来研究的一个方向。运用云治理的手段要弄清楚三个问题:一是要梳理云治理的概念体系,它的前提是什么、它成不成立;二是要分析云治理的价值选择,它是否真正符合人们的价值理念,是否符合现在社会发展、社会需要的方向;三是要研究云治理的现实应用,它能在哪些方面应用,怎么应用。

数据治理范文5

【关键词】大数据 互联网 社会研究方法 社会治理模式

【中图分类号】D035 【文献标识码】A

互联网革命引发的社会研究方法革命和社会治理思维变革

社会解释与社会治理实践是社会治理的两个密不可分的重要方面。正确的社会解释是有效社会治理的必要条件和理论基础,而社会治理则是社会解释所产生的现实成果。社会解释的任务需要通过社会研究来完成,它的使命是发现和认识社会运行的本质与规律,并在此基础上总结以往社会治理的经验与教训,为当下的社会治理提供有效的理论指导与最佳的方法及路径选择。

然而,我们不得不承认,与对自然界和物质世界的研究相比,我们人类对自身行为与社会运行规律的研究,总体上说还处于比较低的水平。这是因为,人类社会是一个复杂的巨型系统,它比世界上任何其他系统都更加复杂和迷离,其规律也难以完全为社会所知晓和掌握。

同时,社会科学研究方法带有明显的时代特征,它受到一定社会主导性思维方式和科学技术水平的影响。从前工业社会、工业社会、后工业社会,再到当代的所谓信息社会或大数据社会,社会科学研究方法在不断更新和发展,研究范式不断更新,研究技术手段不断进步。但是,我们不难发现,大数据时代与以往最大区别在于,人类社会被计算机和互联网纳入到了一个具有无限空间和行为可能性的体系之中,任何人离开这个体系都将无法生存。处于这个体系中的人与组织,最重要的生存和发展技能是信息处理能力。对此,人类社会已经形成了高度一致的共识,这就是“社会的信息处理范式”(information processing paradigm of society)。在已经形成“信息处理社会范式”的大数据时代,社会科学研究最有效、最符合时代要求的范式只能是“社会科学的计算范式”(computational paradigm of social science)。于是,计算社会科学(computional socail science)与计算社会学(computional sociology)应运而生。

2014年8月,美国社会学界举办了“新计算社会学研讨会(New computational sociology conference)”,与会者来自哈佛、MIT、斯坦福等名校。这次学术会议的一个显著特点是跨学科的学术研讨,既有社会学、经济学、政治学、心理学等社会科学的专家,也有来自计算机科学、生命科学、信息科学等学科的学者,谷歌(Google)和脸书(Facebook)的技术专家也参加了这次会议。

“新计算社会学”在社会学研究的各个方面、各个环节进行了全面创新,除了大数据的获取与分析之外,还在质性研究与定量研究的融合、互联网社会实验、计算机社会模拟、新型社会计算工具的研发等方面展开探索。

“新计算社会学”试图创造性地运用互联网和大数据所提供的新方法、新技术、新工具,克服既有社会学研究的局限,以达到对人类行为与社会运行规律的真实认知与科学解释。

大数据带来的不仅仅是研究方法的革命,更是对社会治理思维的冲击,就如我们不能把数学仅仅看成一个计算工具,而应认识到它是一种思维方式―通过把握事物的量的关系来认识事物的本质和联系;同样,我们不能仅仅把互联网和大数据看作是一个新工具,仅仅是对传统研究方法和测量方法的突破,而更应该意识到它将带给我们的是一种新的思维方法。

让数据成为知识

尽管互联网与大数据的作用如此之大,但使其真正发挥效力却绝非易事。大数据真正“落地”必须具备三个条件,一是数据准备;二是“硬实力”,即计算能力强大的服务器集群;三是“软实力”,即先进、高效的大数据处理技术。

互联网、移动互联网、物联网已经生成了海量数据,并且还在加速增长之中,数据准备已经不是问题。我国政府正积极推动云计算平台的建设,许多企业正在就此展开战略布局,云计算技术可以充分调动互联网上的计算机资源,使普通用户能够以相对低廉的价格获得强大的计算能力,对于用户来说,分析、处理大数据的计算机资源已经初步具备,并且将越来越强大和完善,就目前情况而言,硬件资源的能力也已经不是问题。

大数据运用的短板是“软实力”,我们首先遇到的难题是数据的挖掘(Data mining)。互联网上生成的大数据是“自然数据”,它不会按照研究者的意愿而有序、有条理、有逻辑地排列。它是海量的、模糊的、随机的、有噪声的。要运用大数据,必须先使数据成为知识,否则这些数据就与一堆垃圾无异;对海量数据的处理自然不是人能够完成的,必须借助计算机高速、强大的运算能力,也就是借助于计算机数据挖掘。

数据挖掘是通过分析,从海量数据中寻找其规律,设计适合的计算机算法,从而自动搜索隐藏于其中的有价值的、潜在有用的信息和知识的过程,是数据库知识发现(Knowledge-Discovery in Databases)中的一个步骤。在大数据时代,数据挖掘是最关键的工作。

由于问题不同,所需数据也就不同,而不同的数据有不同的种类和结构,必须根据具体的情况来设计计算机算法。例如:互联网舆情挖掘,以微博、博客、论坛等为挖掘对象,主要是通过文本分析、自然语言理解等技术来搜集、分析数据;而在电子商务中,则以电商交易平台中的浏览、交易等行为踪迹为主要挖掘对象。前者是对某一政策的社会反应进行调查,后者是对人们的购物行为进行分析。

当前数据挖掘应用主要集中在电信、零售、银行、电力、医药等方面,虽然看似广泛,但实际上还远远没有普及。在社会研究和治理方面,需要挖掘的大多数都是非结构性数据,其难度很大,以美国为代表的西方国家一直在大力开发这类挖掘工具,我国的这项工作起步不久,亟待深入和提高。

政府机构、一般企业、社会团体和个人用户大多不具备从大数据中发现知识的专业技能,要使大数据真正服务于社会,这是必须解决的难题。我们对此必须高度重视,否则很可能会出现这样一种情况―各种数据已经可以有偿或无偿地获取,大大小小的云计算平台已经星罗棋布,但是用户却不知道如何利用这些条件获取自己想要的东西。目前的情况是:数据量在高速增长之中,云计算平台正在紧锣密鼓地建设,而另外一个条件的准备却行动缓慢,即将成为发展的瓶颈。三者的发展已经不平衡,很可能造成资源的闲置和浪费。

互联网对社会生态的改变和对社会治理模式的冲击

互联网使信息的传递彻底突破了空间限制,不仅传播信息的速度快,并且可传播信息量越来越大,传递的成本还越来越低廉,此外,互联网的信息传播模式越来越表现出实时互动性的优势:传统的公众信息传播媒体(如报纸、广播、电视等)很多是单向的,只能是一方向另一方传递信息,另一方被动接受,而互联网具有信息交互性。

由于互联网的这些特点和优势,它正在改变社会生态,这主要表现在以下几个方面:一是人类社会从信息匮乏转变为信息爆炸;二是信息垄断正在被打破,互联网的存在使人为的信息封闭越来越困难,甚至在很多情况下成为不可能,三是人类社会的整体性正在加强,互联网把世界连成了一体,对任何一个局部来说,它与整体和其他局部的联系越来越密切,已经无法排除其他局部对自身的影响;四是“蚁聚效应”,互联网使普通人获得了更多的参与公共事务的机会,个人力量因“网民聚合”而增强。以往,单个普通人的言论和行为对社会的影响一般是微不足道的,现在却可能通过“网民聚合”发挥出过去不敢想象的力量;五是“蝶翅效应”,在互联网上,一件局部的微不足道的小事可能成为公众事件,一则利用公众心理精心编造的谣言可能引发一轮汹涌的舆情;六是“众筹效应”,通过互联网,政府、社会组织甚至一个普通人都可能调动社会力量,获得社会的某种支持和帮助。

互联网对社会生态的改变,在很多方面给我们带来了发展的机遇。在政治领域,互联网和大数据正在改变传统的政治生态,“网络政治”已经显出雏形;互联网带来了公众监督力的提升,这对社会治理有不可低估的积极意义,公众监督能力如果得到充分发挥,可以在很大程度上分担政府自身监督的任务,克服自身监督的不足之处。同时,大数据可以使政府变得更有智慧,通过数据的分析,能够使政府有一双“慧眼”,准确地认识社会问题;利用互联网这一高速信息传播平台,可以使公共管理信息的、传播更为及时、高效;互联网的交互性也使政府能够快速获悉民众对政策的反应,民意、民情调查的准确性可以大大提高。政府利用互联网的“众筹效应”,可以集思广益,择善而从。

在经济领域,互联网和大数据已经成为一种强大的经济资源,并且催生出新的经济形态。从经济学的观点看:降低交易成本的行为将提升竞争力,亦即高交易成本的营销模式将被低交易成本的营销模式所取代,在过去的10年中,电子商务的出现和发展印证了这一原理。互联网和大数据帮助企业更为科学、更为高效的分析市场、汇集资源、制定计划,改变原有的营销模式,其中尤为受到企业的重视的是预测市场需求和降低交易成本。

在教育领域,人们对“云课堂”已经不再陌生,“云上课题”更为充分地发挥了有限的教育资源的作用,并使适配式教育成为可能。

在医疗领域,从疾病预防、疫情监测到药品管理、医务监督,从医疗专家系统到线上预诊服务,互联网和大数据已经取得了丰硕成果,并且其应用面还在持续扩大。互联网和大数据技术不仅帮助我们降低医疗成本,提高医疗效率;并且还有望在治理医疗腐败、缓解医患纠纷这些棘手而又迫切需要解决的问题上大有作为。

当然,任何新生事物的到来,在带给人类美好的馈赠的同时,也会不同程度地带来麻烦。互联网和大数据一方面为我们提供了以前不可能具有的条件和能力,另一方面也给我们带来了前所未有的问题。传统的社会治理思维已经难以适应互联网带来的迅速而剧烈的变化,因此必须在很多方面及时作出调整。当前最迫在眉睫的主要有数据安全问题和网络污染问题。

一是数据安全。与互联网和大数据如影随形而至的是数据安全问题,一些数据(个人隐私数据、关系国家安全的数据等)如果被恶意利用,将会对社会产生不同程度的危害,严重的甚至会危及国家安全,这是必须予以高度重视的问题。涂子沛在《大数据》一书中曾提及美国警察滥用个人隐私数据的真实事例:

密歇根州的一些警察,利用警务数据库“猎艳”:他们在街上邂逅漂亮的女性之后,就跟踪她们,记下她们的车牌号码,然后通过查询数据库,获得该女性的住址等个人信息,再人为制造进一步接触的机会。此外,还有警察利用数据库查询政治对手和上司的信息,对相关人员实施威胁。在2001年前后的5年间,涉嫌滥用警务数据库的警察共有90名之多。特拉华州还有政府官员将公民的个人信息泄露、出卖给赌博公司,帮助他们追债、开发新的顾客。

1995年,欧盟颁布《关于涉及个人数据处理的个人保护以及此类数据自由流动的指令》,2014年,欧洲法院裁定普通用户的个人隐私拥有“被遗忘权”,要求谷歌公司按照当事人的要求删除涉及个人隐私的数据。

据刚刚出现的数据交易业称,我国数据的获取在一定程度上还处于“法无禁止皆可为”的状态。虽然这有助于推动互联网和大数据的发展,但其中潜藏着巨大的隐患。我们应该意识到问题的严重性和紧迫性,对数据获取和使用的权限应进行全面深入地研究,制定、完善相关的法律法规,尽早将数据获取和使用纳入正常、良性的运行轨道。

数据安全不仅关系到个人隐私、企业商业机密,还可能直接影响国家安全。一些看似寻常的数据,如果由专业人员进行汇集分析,可以获得一些极为重要的情报。因此,一些公司的“过度追踪行为”引起了各界高度关注。

2014年,我国成立“中央网络安全和信息化领导小组”,这表明我国政府深刻意识到互联网发展对国家、安全、发展利益提出的挑战,深刻意识到数据安全对于国家安全的重要性,已经把数据安全提升至了国家安全的战略高度。

二是网络污染。由于互联网强大的传播能力,不可避免地出现了信息污染,大量虚假信息泛滥成灾,治理、控制网络污染成为信息管理的新难题。

互联网上的言论是复杂多样的,既有民意的期盼,也有不负责任的流言;既有真知灼见,也有无稽之谈;既有对现实问题理性冷静的思考,也有非理性的情绪发泄。这些言论会不同程度地对公众产生积极或消极的影响。此外,某些境外势力把互联网作为谋求其文化霸权的工具,有组织、有策划地“引导舆论”,欺骗公众,以达到某种政治目的,试图破坏我国的社会稳定。因此,互联网也是意识形态、价值观念交锋的战场,我们对此必须有高度的警觉,要充分认识、研究互联网舆论战场的规律,沉着应战。

面对互联网带来的这一挑战,政府方面应先准确辨别言论的性质和动机,然后根据具体的情况积极应对。各级官员应不断从互联网上倾听公众的声音,推动社会治理的进步,凡事先行一步,临变快速反应,避免在“倒逼”下被动应付。近些年来的一些网络事件表明,大多数严重后果是因反应不及时和应对失误所造成。

数据治理范文6

数据治理和传统信息处理模式的根本区别

传统信息处理模式几乎完全依赖人类的现有经验进行信息处理,对于人类经验并没有覆盖的领域,就只能利用穷举的方法来进行处理。而穷举的方法,只适用于条件简单的小范围领域,例如下象棋,棋盘很小,棋子的可选落点很有限,因此能够使用穷举来完成。而对于围棋这种19X19的自由落点,其走法的穷举将超越整个宇宙的质子总数。因此,传统的信息处理无法应对这种应用,直到机器学习成熟,才能够实现击败人类冠军的AlphaGo而机器学习,则是数据治理中的一个重要环节,机器击败了人类冠军,其实是数据治理对于依赖人类经验的信息处理模式的超越和替代。因此,我们可以明显的看出,数据治理和传统信息处理模式的根本区别:

传统信息处理:依赖人类现有经验并进行有限演化,形成信息处理逻辑并通过编程实现输入和输出。

数据治理:仅仅依赖数据本身,通过数据本身的特征,自适应的演化处理逻辑,自适应的实现输入和输出(输入输出也是数据处理逻辑之一)。

这两种模式的直接结果就是:传统信息处理只能在人现有的经验基础上做得更快更准确;数据治理则可以向人提供全新的“经验”。

旅游领域中的人工智能探索

在旅游领域,存在着海量的数据,这些数据多数是人工录入,处理逻辑多数是统计和简单分析,这种级别的信息处理仅仅能应对简单事件。而游客、管理人员、从业人员的近乎开放型的咨询和事务办理,则是一种可能性远远超过围棋数量的大自由维度信息处理。因此,旅游行业的咨询、非常规事务办理始终无法脱离人的主观处理。而人主观处理的最大问题就是,因为责任心不同、经验不同、工作态度不同,其处理结果天差地别。

基于上述考量,浙江省旅游信息中心有限公司对浙江省旅游数据的综合管理和应用制定了高起点高标准的要求,从建立之初就要求是在真正的数据治理体系之上,以便人工智能应用能够快速落地,服务全省旅游管理者、从业者和游客。在考察了国内众多人工智能领域公司之后,选择了厦门杜若科技公司的研发团队对浙江省旅游度假区信息的数据治理进行试点。厦门杜若的研发总监唐娜博士(曾是大数据和人工智能领域公认的世界级公司的首席技术经理)和她的团队已经初步形成并发展了完全自主知识产权的基于人工智能的数据治理产品线,覆盖了数据治理全生命周期的所有必要环。该公司目前已经申请数据治理体系相关发明专利58项,已获得授权24项,实审中26项,申请实用新型专利37项,获得授权26项。浙江省旅游信息中心对浙江省旅游数据治理的试点首先从《浙江省旅游度假区信息管理系统》入手,将系统中结构化的数据,以无障碍大数据采集的技术实现解构,形成自由格式的大数据,在这些数据基础上,通过开放式的训练,完成初步数据治理。

治理的初步结果可实现:形成基于自然语言的数据管理,对于《浙江省旅游度假区信息管理系统》中有记录的所有数据,各级管理人员均可以自然语言对话的方式进行任意查询(界面类似微信的一问一答),数据治理系统会根据各级人员的权限和身份,以及过往查询的历史和习惯进行针对性的回答。简单地说,就让人工智能系统认识你,并且记住你的各种习惯和特点,针对和你交流的全部经历来回答你的提问,并且会将它与所有人交流的经验也作为数据进行治理,从而,使用它的人群越大、人群种类越复杂,它就越聪明,就像人的阅历越丰富,交流的时候沟通越畅通。

同时,逐步形成自学习的数据治理模式,对于《浙江省旅游度假区信息管理系统》中的所有数据,任何人除了查询之外的应用模式,可以用文字以自然语言对话的方式“教会”人工智能系统,例如对哪几个指标进行怎样的加工处理和比对,某些指标达到多少时应当做什么样的事情来主动应对等等。随着系统学习的应用模式越来越多,系统将可以逐步区分《浙江省旅游度假区信息管理系统》中记录的哪些数据存在不合理(例如假数据),哪些景区或者度假区有多大的概率出现什么样的事件等等。