大数据论文范例6篇

前言:中文期刊网精心挑选了大数据论文范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

大数据论文

大数据论文范文1

在桥梁工程中,数据按时间上的划分可以分为两类,静态数据与动态数据。静态数据主要指桥梁的相关信息资料库与科学实验产生的数据。信息资料库是一种相对静态数据,因为这些数据资源每过一段时间将更新一次。各国家和各地方政府部门基本建立了桥梁工程资料库及相关系统,列举出主要国家和地方政府的桥梁管理系统,包括建成时间、系统功能、与建设部门等。除国家政府部门外,各科研单位也在完善各自的桥梁统计分析系统,系统中主要包括桥梁的桥型、跨径、材料、建成时间等基本信息,还包括桥梁的病害、桥梁状况评定等相关内容。桥梁的科学试验数据主要来源于各大高校和科研单位科学研究中的模型试验、振动台试验、风动实验、桥梁的荷载试验等产生的数据。这类数据的有效分析处理形成各类科学研究成果,但是此类数据的开放程度低,造成数据资源的极大浪费。桥梁的动态数据主要来自于桥梁的施工监控和成桥运营阶段健康监测系统,此类数据由安装在桥梁上的实时监测传感器获得,包括位移传感器、速度传感器、加速度传感器、应变计、温度计、风速仪、GPS等。统计了国内部分桥梁健康监测系统的传感器数量以及安装时间。各类传感器配以相关的采集系统来获得数据信息,再通过相关软件分析、处理,从而掌握桥梁的实时健康状况,对桥梁的状态进行评估与预测。整个桥梁健康监测体系。

2开发桥梁工程领域大数据资源意义

利用桥梁的静态数据库,可以了解桥梁的基本信息,为全国的桥梁统计、普查与管理提供信息资源。科研数据的开放有助于学术界的交流、创新,取得更为丰富的科研成果。桥梁动态数据包括施工监控数据与成桥运营阶段的监测数据,充分利用与挖掘大数据资源,可以提高桥梁的施工质量、加快施工进度,提前预测和解决施工过程中可能出现的问题,减少质量事故和经济损失。成桥运营阶段的监测数据主要为桥梁的健康状况评估提供依据,掌握桥梁所处的状态,分析、处理数据资源,提高预测、分析、解决问题的能力。可为同类桥梁的施工管理与养护等,提供宝贵经验。同时大数据资源的开放、共享,有助于节约国家资金和社会资源。

3存在问题及解决方法

(1)最先遇到的也是最棘手的问题是数据的去冗、去噪,从海量数据中挖掘大数据资源价值。目前,所列一座特大桥上各类传感器每天采集的数据达到几个GB到几十GB,甚至上百GB,如此海量的数据如何去处理,有效剔除无用的信息,找寻剩余有用的信息,从而产生新的价值、新的资源。这也是在大数据时代有效利用大数据资源要解决的首要问题。解决这一问题的主要途径是编译相关的去冗、去噪的智能分析软件,同时可以利用云计算、云分析、云管理等方法来提高解决这一问题的效率,使大数据变为有用数据,做到真正智能化分析。

(2)现在各政府部门和科研单位,都在做自己的桥梁信息库以及监测研发数据库等,而且大多数数据库都是相类似、重复的。这样造成资源的极大浪费,包括劳动力、资金等。解决这一问题的有效途径是加强政府部门、科研单位内部以及之间的相互合作,开放和共享数据资源,这也是大数据时代的必然趋势。各部门和科研单位可以有步骤、分阶段地开放共享各自所拥有的数据资源,不论是采用付费或免费的方式。

(3)由于大数据具有“4V”等特点,在大数据研究的初期阶段,大数据的价值还未充分体现时,要储存、分析、利用大数据资源,需有软件、硬件等基础设施的投入,国家和科研单位应提供专项资金的支持,同时国家可制定相关鼓励支持政策。

(4)在大数据时代成熟以后,应建立相关法规,规范和保护数据的开发利用,制订相关统一标准,提高数据的使用效率。

4结语

大数据论文范文2

1.大数据的背景与特点

(1)信息规模大。大数据的发展是与互联网息息相关的,互联网技术的时时更新与不断发展,无疑产生了海量数据。毫不夸张地说,无时无刻不在产生新的数据。常规数据的存储单位一般为GB或TB,而大数据的单位往往是PB、EB甚至ZB,可见大数据的数据量之大之多。(2)数据的多样性。以前的数据大都是结构化的数据,现在由于信息的采集、加工与传输技术的不断发展,尤其是在互联网络上,产生各种非结构化的数据,代表性的非结构化数据包括音频、视频、传感数据,互联网上的以博客、微博为代表的文本数据等,使得数据的具体形态呈现多样性。(3)复杂关联性。在当今互联网的时代,产生的各种各样的联系,比如在电子商务网站上购物,曾经搜索过的关键词会成为电商网站制定个性化推荐、进行精准营销的最主要依据,个人在不同的社交网站上所提供的个人信息,以及在电商网站购物所留的具体信息都可以转成为有效的商业信息。这就表明了数据之间联系的紧密与密度,也说明了数据间的关联复杂性。(4)价值密度低。当然,海量的数据并不意味着海量的价值,不可能所有的信息都具有价值,如一些冗余信息。需要利用数据挖掘技术,对海量信息进行有效地提取与挖掘,找到具有价值的数据,并将其运用到商业活动中。

2.大数据时代第三方物流企业CRM面临的挑战

在了解了大数据的特征之后,我们便对大数据有了一个清晰的认识。那么在这个以数据为中心的大时代背景下,对第三方物流企业,对现在逐步将客户升级为企业核心竞争力、强调以客户为中心的第三方物流企业CRM带来了什么样的机遇与挑战,值得我们深思。CRM既是一种管理理念,也是一种应用软件,更是一种管理模式。客户一直都是企业非常重视的资源,而且对客户的重视早已从交易进行中扩展为注重潜在客户(即交易尚未发生时)、重视售后管理(即交易发生后),即在整个过程中都强调客户的地位和重要性。当今充满信息的时代,人们更加重视客户的管理,由此可以看出,客户的概念已经发生很大的变化。客户概念的泛化,无疑使客户需求变得具有多样性、多重性和差异性。在这个数据高速增长、信息高度发达的年代,无疑数据是驱动物流企业发展的动力。那么面对海量数据,低密度的价值数据,物流企业的数据“短板”,与客户信息、客户需求之间的矛盾与差距,使得物流企业在大数据时代进行客户关系管理时面临严峻的挑战,主要体现在以下几个方面:(1)数据不足与客户流失控制与预测不足之间的矛盾。客户流失一直以来就是企业面临的重大考验,而如何能够有效的控制与预测客户的流失也一直是长期讨论的热点。针对客户流失的控制与预测,传统的方法是建立在收集客户信息、资料的基础上,对客户的满意度进行分析。而往往这些数据是非常具有局限性的,仅仅是来自第三方物流企业自身积累的客户服务信息,而且在分析时并没有突出分析客户的忠诚度。而现如今客户的需求多种多样,且时时变化,客户的很多信息大多体现在社交网站或商务网站,而且信息的价值密度又比较低,造成物流企业不能很好的去收集、分析客户的信息,去有针对性的满足客户需要,去提高客户的忠诚度。因此,只能用相对少且相对固定的数据制定客户流失控制策略,或进行客户需求预测及市场预测,这些做法往往效果不理想。(2)数据更新不足与客户聚类以及个性化服务不足的矛盾。对客户数据进行聚类分析,是第三方物流企业进行客户关系管理很重要的一个应用方面。第三方物流企业的市场管理、销售服务等都与客户关系管理密切相关,都是强调以客户为中心。而根据数据对不同的客户群体进行聚类分析能够做到有针对性的进行管理,在降低客户关系管理成本的同时,也能够有效的制定实施营销策略。而对于物流行业这样一个数据驱动型的物流企业,数据的更新可以说是至关重要,要求及时将新的信息反馈给管理部门。而普遍的结构化数据,或已有的数据库数据信息相对陈旧,脱离客户不断变化的需求,这必然导致据此制定的各项CRM策略缺少有效性,甚至是营销策略的失误。(3)数据类型单一与关联性分析不足的矛盾。大量单一的客户结构化数据对已有客户的需求分析具有一定作用,然后对潜在客户或提高客户忠诚度上的作用不是很大。当前信息时代,除了传统的结构化数据,可以通过各项技术获得更多的半结构化的如网页、文本等数据,及一些非机构化数据,这些数据往往和客户的已有信息相关联,这些数据的收集与分析,能够为发展潜在客户提供基础。当前第三方物流企业大部分依旧依赖于结构化数据,数据类型比较单一,不能及时了解客户的进一步需求或与当前需求相关的产品或服务,造成对潜在市场的忽略。(4)客户需求变化与CRM模式滞后之间的矛盾。许多第三方物流企业对CRM的认识还停留在传统的与客户互动及管理方式上,虽然认识到了客户的重要性,但是在具体客户关系实施管理上,还存在很多问题,与信息时代的要求严重脱节。同时,在海量数据到来之时,又显得力不从心,无法挖掘出有效的价值信息。这种“迟钝”导致客户需求得不到最大满足,对第三方物流企业而言,面对残酷的市场竞争,时刻把握客户的需求,更好地为客户服务显得尤为重要。反之,则会导致被潜在客户所忽视,被老客户所抛弃,被客户抛弃意味着企业被市场淘汰。

二、大数据在第三方物流企业CRM中的应用

1.大数据下第三方物流企业CRM框架设计

在将大数据技术应用在第三方物流企业CRM的过程中,在整个CRM框架设计中都要明确体现出整个CRM的工作都是围绕客户进行的。各种商业目标定义的来源是客户,数据挖掘与分析的数据来源也是客户,最后具体的商业应用也是作用于客户。同时,数据的正确获取,数据的有效预处理,数据的合理存储,采用优秀的数据处理技术进行数据处理,以及优秀数据挖掘方法和技术的选择与应用,这些工作都离不开信息技术。包括大规模并行处理数据库、数据挖掘、互联网技术、分布式文件系统和可扩展的存储系统等。该模型以客户信息为主线,将第三方物流企业的客户关系管理分为三个层次:客户信息收集层、客户信息分析层、信息输出———客户服务与支持层,在整个过程中都离不开网络技术、数据挖掘等技术层面的支持。具体说,在将大数据应用于第三方物流企业CRM中时,第一步需要通过大数据获取技术得到足够多的各种类型的数据,主要包括从客户和市场等企业的外部环境,以及公司销售记录等内部渠道,收集各种客户信息和市场信息,形成大数据集;第二步需要应用包括数据仓库、数据挖掘和商业智能等技术手段对获取的大数据集进行计算、汇总,通过“聚类分析”、“关联分析”、“数据融合”,实现对客户的个性化分析、竞争情报分析、市场需要变动和产品扩展分析及共性分析,得到应用型数据,这样做的目的主要解决传统CRM中个性化服务不足、市场拓展、市场趋势预测不足的问题;第三步针对第二步的客户分析,围绕这个“中心”,把这些信息输出给客户或企业内部用来制定各种决策及提供服务支持,形成可行性报告,应用于服务管理、市场管理、销售管理及物流企业管理。通过整个CRM系统,不仅成功的对客户信息进行收集、分析、输出,同时将客户各种背景数据和动态数据收集整合在一起,同时将运营数据和外来市场数据经过整合、变换载进数据仓库。不仅重视怎样从技术上实现对大数据应用的过程,并且着重强调的是解决传统CRM的弊端,将大数据时代物流企业CRM所面临的问题在整个流程中进行解决。

2.大数据背景下第三方物流企业CRM应解决的问题

大数据论文范文3

近年来,随着互联网技术的发展,大数据越来越受到关注,其应用逐步渗透至多个行业,开启了全新的数据时代。数据是征信业务开展的基础资料,征信活动主要是围绕数据进行采集、整理、保存、加工,并最终向信息使用者提供。大数据不仅为征信业发展提供了极为丰富的数据信息资源,也改变了征信产品设计和生产理念,成为了未来征信业发展最重要的基石。我国征信业发展尚处于起步阶段,在大数据时代存在征信法律制度和业务规则不够完善、征信机构数据处理能力有待提高等问题。未来征信业面临的机遇和挑战并存,研究大数据时代征信业的发展具有重要意义。

大数据时代征信业面临的机遇和挑战

目前,对大数据无公认的定义,一般认为大数据是指所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为服务于经营决策的资讯。大数据的出现,使征信业发展面临的外部环境发生了巨大的变化。

(一)大数据时代征信业面临的机遇。

1.优化征信市场的格局。

随着征信机构市场化运营机制的确立,将会有更多信息资源优势的企业借助互联网、大数据等信息技术的创新进步,从征信业薄弱环节切入,通过服务创新或产品创新打破原有的征信市场格局。一是电商企业将组建征信机构。以阿里巴巴为例,其利用淘宝、天猫、支付宝平台上的行为数据和信用情况,建立成了涵盖数十万企业的数据库,具备了开展网络征信服务的基础和实力。二是金融机构建立征信机构。例如平安集团拟整合网贷信息、银行信贷信息、车辆违章信息等,建立金融数据挖掘中介机构。三是新型征信机构应运而生。一些大数据公司依靠技术手段,以电子商务、社交网络为平台,采集信息,提供信用信息服务,可能成为新型的征信机构。

2.推动征信业的转型升级。

大数据给征信业带来转型升级的历史机遇,未来的征信业将以智能数据分析系统为平台,利用大数据挖掘技术,支持征信业发展创新。大数据支持征信业升级和转型主要体现在二个方面。一方面大数据促成征信业建立全新的风险控制体制,向有效监管转型。大数据技术对客户信用信息进行深度挖掘,实时监控,防范潜在的信用风险。另一方面大数据支持征信机构向精细化管理转变。大数据的核心优势在于信息挖掘,精细化管理的首要条件是充分信息化,包括业务信息化和管理信息化。

3.促进征信业差异化竞争。

征信机构通过采用不同的数据来源,不同的数据处理方式,针对不同的客户,开发出不同的产品,满足不同层次客户的市场需求,实现差异化竞争。例如,金融机构对征信服务的需求将从单个借款主体的信用报告,扩展到运用信用信息拓展网络影响和金融服务渠道。P2P网络借贷、电商金融等业态需要借助信用信息共享防范风险,降低交易成本。

4.拓展征信数据来源。

大数据使征信数据来源呈现多元化、多层化和非结构化的特点,更加全面和真实地反映信息主体的信用情况。征信机构从在政府部门、金融机构等实体机构中采集信息,转向从互联网等虚拟世界中获取信息。在数据采集的广度和深度上,征信数据量将激增,采集包括证券数据、保险数据、商业信用数据、消费交易数据和公共事业缴费数据等,全面地覆盖与信息主体相关的各项因素。

(二)大数据时代征信业面临的挑战。

1.现有征信业务规则与大数据时代不匹配。我国有关征信业的法律法规的规制对象主要是传统金融领域,《征信业管理条例》及其配套制度初步构建了我国征信业的法律法规框架,但是《征信业管理条例》是否满足大数据时代征信业务的规则要求,尚未得到市场验证。目前,缺少对大数据时代征信活动的规范,如有关大数据采集、整理、保存、加工和处理的制度要求。因此,还需要进一步细化和完善征信业务规则,以更好促进大数据时代征信市场的发展。

2.征信业监管技术和水平需改进。大数据时代给征信业发展带来深刻影响,同时也对征信业监管提出了更高的要求。要适应大数据时代的征信监管需求,征信监管水平要能跟上大数据征信的发展水平,监管政策要符合大数据的基本规律,监管人员要具有适应大数据的知识和能力。在行业自律监管方面,我国行业监管尚未发育成熟,行业标准尚未统一,行业规范以及行业职业道德等内容尚未完善。

3.信息安全和隐私保护形势严峻。随着数据的进一步集中和数据量的急剧增长,对海量数据进行安全防护变得更加困难,数据的分布式处理也加大了数据泄露的风险,隐私保护和数据安全成为制约大数据发展的瓶颈。大数据时代下的征信业同时具有了大数据和征信两个特性,对隐私保护和数据安全的要求更高。

4.数据处理能力亟待提高。如何有效处理大数据,是大数据发挥作用的重要环节。益百利等大型征信机构在数据处理方面已经采取多层次数据挖掘等先进技术,利用私有云平台,对系统中海量数据进行处理和研发,减少主观判断,提高风险预测的准确性。但是目前我国征信机构发展起步较晚,缺少对数据处理的核心技术,导致数据分析结果不能够准确的识别个体或组织的行为。

5.硬件基础设施需要全面升级。过去征信机构存储征信数据主要是在本地建立数据库,大数据时代随着数据量呈几何级数的增加,征信机构硬件技术的发展已经跟不上数据容量的增长速度,数据存储面临较大压力。

大数据时代征信业发展的措施与建议

随着大数据时代的到来,未来征信业发展要从制度设计、技术进步、信息共享、监督管理、隐私保护等方面不断创新,促进征信业在大数据背景下的跨越式发展。

(一)建立符合大数据的征信法律制度和业务规则体系。现有的征信法律体系都是基于传统数据模式下制定的,难以满足大数据等新技术条件下征信业发展的制度需求。在征信业务开展过程中,大数据的收集使用可能涉及国家信息安全、企业商业秘密、公民隐私等,为了给大数据条件下征信业发展提供制度保障,需要从征信立法层面完善信息安全和数据管理的法律制度,明确大数据背景下数据采集、整理、加工、分析、使用的规则,确保大数据时代征信业发展有法可依。

(二)加强征信产品创新。随着可获得的数据量呈几何倍数的增加,征信机构通过深度挖掘和使用这些数据,就可以极大地拓展征信产品的种类,不仅能够提供信用报告查询等基础服务和产品,还可以提供其他综合性产品,满足社会各界的需求。从征信产品的满足层次高低的不同,可以分为宏观、中观和微观的征信产品。宏观层面,征信机构通过大数据分析可以对系统性、全局性的风险信息进行预测。中观层面,征信机构的海量数据包含大量时效性和政策含义都很强的信息,可以灵活多样地进行多维度组合分析。把这些信息整理和挖掘出来,建立对应的指数体系,有助于行业监管。微观层面,在信用主体(包括企业和个人)同意的前提下,征信机构可以提供每一个信用主体的信用报告、信用评分、身份验证、欺诈检测、风险预警、关联分析等多种数据服务。

(三)提高大数据技术处理能力。大数据价值的完整体现需要多种技术的协同。数据抽取与集成、数据分析以及数据解释,是大数据时代征信数据处理的三个重要环节,在数据处理过程中搜索引擎、云计算、数据挖掘等新技术使用必不可少。因此,征信机构要加大数据处理分析专业人才队伍的培养,同时要引进大数据处理的专业方法和工具,建立前瞻性的征信业务分析模型,更好的把握、预测市场和信息主体的行为。

(四)健全大数据信息共享机制。完善的大数据标准体系是推进数据共建共享的前提。目前,我国来自各行业、各渠道的数据标准存在差异,成为阻碍数据开放和共享的关键瓶颈。建议尽快统一标准和格式,以便进行规范化的数据融合,提升大数据的整合能力,打破资源部门间的信息孤岛,从而完善信息共享机制。

大数据论文范文4

流量业务是电信运营商收入增长最大的驱动力,但当前的困境在于,流量收入增长无法补偿流量成本,形成所谓的剪刀差;更长远来看,随着流量渗透率的提升,流量收入增长将不可避免地放缓,在价格竞争作用下,流量收入出现下降也是可能的。与此同时,关于大数据的讨论在技术、应用和模式等多个层面展开,已被认为代表着时展的方向。OTT们正在积极主动地利用这一趋势改变自身经营模式、指导业务布局和演进方向。反之,尽管坐拥丰厚的大数据资产,电信运营商对于大数据的战略价值一直处于朴素而将信将疑的状态,缺乏对大数据经营模式的基本理解和全盘考虑。如果能够揭示大数据经营和流量经营之间的内在联系,对求解流量经营困境和认识大数据经营模式都大有裨益。

(二)当前流量经营的价值困境

流量是当今数字世界运转的基础。“客观属性”是对“流量”这一认识客体固有属性的客观描述,不因经营主体和经营方式而异。流量属性包括以下方面:1)流量的规模性,指流量可用同一量纲进行规模比较,比如联通单用户流量规模要高于移动,百度流量规模要高于google中国,基于中国移动网络发生的流量规模要高于基于百度服务发生的流量规模;2)流量的层次性,指流量与用户真实行为(主体)的接近程度。流量蕴含着反映主体行为的信息,但程度有所不同。比如淘宝网所承载的流量直接反应用户的网购行为,而电信网所承载的流量只是经过IP协议封装的比特流,前者显然更接近用户真实行为因而被称为表层流量,后者则被称为底层流量;3)流量的异质性,指流量对用户消费目的(客体)的涵盖范围。流量蕴含着反映客观世界的信息,但范围有所不同。比如文本、话音、图片、音乐、视频等不同类型之间,垂直应用与平台式应用等不同类型之间,社交类、娱乐类与生产类应用等不同业务类型之间,其流量映射客观世界的能力就各有差异和侧重;4)流量的不可分性,虽然底层流量和表层流量在概念上区分了,但在实体上是紧密依赖的,是同一事物在不同经营层面上的不同投影。比如,淘宝的表层流量离不开运营商底层流量的依托,运营商底层流量也离不开淘宝等表层流量的呈现,同时,淘宝可推知用户使用了多少底层流量,运营商也可部分解析出用户的购物行为。

可见,流量是一个充满想象空间的市场,而电信运营商似乎占据有利地位。综合流量的层次性和异质性,流量被赋予了主体行为和客体存在在信息层面上统一投影的属性,是信息社会不断流动的血液,具备极大的社会价值和经济价值。从流量的不可分割性来看,上层服务提供商与基础运营商之间的相互依赖、相互制约将是长期的基本格局。从流量的规模性来看,至少在本地市场,由于基础设施市场集中度高,电信运营商很容易就可获得超过任何单一玩家(如apple和facebook)的规模优势。

但现实情况中,流量规模的暴涨对电信运营商是一把双刃剑,情况不容乐观。流量在呈现客观属性的同时,在特定的经营主体及经营方式下,还会表现出影响甚至决定经营绩效的经营特征。本文认为,固然客观属性有利于电信运营商开展新一轮价值创造,但在当前经营模式下,流量应有的价值并未得到充分挖掘,无法支撑电信运营商的可持续发展。

当前的流量经营模式是,通过提供同质化的、以M为价值衡量单位的流量产品来满足用户的接入需求,然后通过向用户收取按照使用量计算的费用来补偿网络成本、运维成本和营销成本。在这种模式体现出三大属性:一是面向手段性需求。用户向运营商购买流量不是为了流量本身,而是为了流量所承载的个性化互联网应用。流量仅仅是服务于互联网消费的手段,因此,与面向目的性需求的互联网服务提供商争夺用户界面时,电信运营商天然地处于劣势;二是无直接网络效应,电信运营商无法将网络效应内化从而无法实现业务的边际效应递增。流量用户之间并未像话音用户之间和短信用户之间那样构成彼此连接的网络,用户之间的网络是通过业务构成的,而业务网却控制在OTT手中。换言之,网络效应主要存在于OTT业务层,而非管道层。因此,随着使用OTT业务的用户越来越多,以及用户使用OTT的业务次数越来越多,OTT业务的边际效用递增,但电信运营商流量的边际效用基本持平;三是边际成本下降有限,面对指数级增长的流量需求,运营商不断追加投资扩容、升级只能勉强跟上。上期投资刚进入边际成本下降阶段新的投资又追加进来,下降趋势被中止。在投资压力下,设备商又勾画了美妙的技术前景,许诺平均成本将极大地降低,勾引运营商全面投资新技术。这样多次循环和叠加,在相当长一段时间内,运营商都处于初始成本投资阶段,流量边际成本下降的周期被压缩到很短。反观OTT,一旦业务上线,在运营成本增长与业务量增长相比可忽略不计的前提下,业务边际成本很快就会下降到接近于0。某种程度上,信息产品边际成本为0规则的成立,是建立在电信运营商的牺牲之上的。

图OTT业务与电信运营商流量业务的边际效用/成本对比

电信业本是新经济的鼻祖,网络效应理论就是70年代从对话音网络的研究中发展起来的。然而,在当前经营模式下,运营商的流量业务失去了网络效应、边际成本趋于0、边际效用递增等信息产品的新经济特征,用工业经济时代的经营模式去与新经济时代的经营模式争夺价值,注定是落于新型竞争对手的。这是仅在流量规模上做文章,没有深入挖掘流量价值形成的后果,运营商由此陷入流量价值困境。

(三)大数据经营破解价值困境

大数据的定义众说纷纭,从技术特征上它通常具备数据量大(volume)、数据类型多(variety)和数据处理和响应速度快(velocity)的特征,麦肯锡将大数据定义为超过了常规数据库软件所能搜集/存储/管理和分析的规模的数据集。大数据概念具有深刻的IT烙印,正如“流量”概念具有深刻的电信烙印。通信与计算是信息的不同处理环节,在ICT端到端融合的背景下,流量和大数据完全可以统一在“信息”概念下,是信息全生命周期不同阶段的称谓。流量有表层底层之分,数据也有信息、知识、智慧之谓,流量经营和大数据经营均可理解为信息经营。

然而,仅仅揭示大数据本身的属性是远远不够的,如果脱离了正确的经营模式,一切价值都是虚妄。在这方面,电子科技大学周涛教授的观点很有价值。他认为,大数据1.0是利用内部数据解决内部问题,大数据2.0是利用内部数据去解决外部问题,或利用外部数据解决内部问题,大数据3.0意味着大数据进入了一个以共享交易为特征的时代,出现了大数据公共平台运营商(以下简称大数据运营商)。从1.0到3.0,大数据的工具属性逐步减弱,目的属性逐步增强,直至“大数据”像货币一样在全社会范围被收集、交换、处理、传输和应用,使得大数据可以真正成为时代的标签。在这个意义上,大数据之“大”,就是不断增强数据的透明性、不断扩大数据的共享范围、不断提升数据的流动性,在更大范围内解决信息不对称以创造更大的价值。否则,无论数据多丰富,技术多先进,都较过去无本质突破,大数据之“大”盛名难副。这个过程,是大数据经营环境不断完善和经营模式不断演进的过程。

大数据经营模式严格来说是指大数据运营商的经营模式。大数据运营商采取双边平台模式,一方面向消费者提供普遍服务,另一方面向企业客户提供以大数据为中心的服务。可以形象地将这种经营模式比喻为“数据银行”。1)大数据运营商自身掌握独特而雄厚的数据资产,这往往是一个通过提供消费者服务集腋成裘的过程,正如银行通过吸纳个人存款掌握雄厚的现金等资产;2)这些数据的使用权和支配权归大数据运营商但所有权属于消费者,正如银行可以自行决定吸纳的存款如何使用,但储户拥有随时要求提现的权力;3)大数据运营商以免费或部分免费提供服务为代价,换取消费者在使用该服务时产生大数据的支配权,正如银行承诺利息收益换取现金存入或委托理财,并默认获得资金支配权;4)这些大数据被用到千百万家企业的生产服务流程中,为大数据运营商的企业客户创造价值,为大数据运营商赚取收益,正如银行吸纳的存款被贷给各行各业的企业,融入经济生活的角角落落。为了进一步理解该模式,下面描述一些细节:

细节一:场景举例。风险控制是保险公司商业模式的核心环节,如果能够更准确地获知投保客户的风险系数,保险公司就可能设计更有竞争力的保险险种和更丰厚的收益。比如车险,如果能对某潜在客户的出行和驾驶行为数据如车速、车程、违规记录等进行分析,保险公司就能更精确地推知该用户在投保期内出现安全事故的概率,从而制定更为有利的保费和理赔政策,比如避免对高危客户(通过各种指标定义)保费过低或保额过高,而对“安全系数”较高的客户则可以在常规保费基础上打折以提升产品的吸引力。同样,对于疾病险,如果能够对潜在客户每天身体健康指标如血压、心跳、卡路里消耗、睡眠时间等,保险公司就能识别优质客户并针对性地设计相关疾病险种。在这个简单的例子里,大数据产生于用户使用的车联网、移动健康等服务,大数据运营商需要向用户提供这些服务,并承诺他们的个人数据不会被滥用。对于保险公司或其他中小型企业客户,大数据运营商提供的核心产品是数据,但更可提供大数据基础设施租用、承担大数据分析任务甚至基于分析结果的营销执行等附加服务。

细节二:如何规避隐私争议。个人数据的隐私问题是大数据商业价值受到质疑的主因。实际上,这个问题可以从理念上和模式上给予回答。理念上,隐私问题自人类社会形成之初就存在,用户心中总是存在一架权衡隐私顾虑和业务价值的天平。当前的隐私争议不在于隐私被使用了,而在于被滥用了,没为用户带来便利/效率/等正面价值甚至反而带来负面价值。因隐私顾虑而扼杀业务创新只会在竞争中被淘汰,将注意力集中到利用个人数据创造更智能的业务,使用户心中的天平偏向业务价值,这才是解决之道。模式上,大数据运营商扮演的是银行角色,受消费者委托管理数据,基于数据所有者与数据使用者之间的契约关系执行数据开放动作,具体由双边平台的双方自愿谈判商定。比如,保险公司若需要使用个人数据可向个人提供保费折扣,达成协议后大数据运营商则执行这一契约,按照协议开放指定数据,并全程监督数据使用。上述过程并不涉及隐私侵犯。对于那些无需识别个人身份的大数据应用,交易成本可以更低,正如银行没有必要向每个储户说明他/她的存款被用于哪一笔放贷或投资,而只需履行利息承诺即可。

细节三:如何获得网络效应。在上述经营模式下,大数据运营商将获得网络效应,这种效应源于该平台上各行各业的企业。与话音业务类似,企业使用该平台提供的数据的同时,也在为该平台增加更多的数据资产。比如,“用户A在facebook上的Like行为记录”这一数据,若被WSJ网站使用,除了为WSJ产生“内容精准推荐”的价值外,用户A对该内容的浏览行为和评论(如果有)也会被平台记录,从而提升原数据质量(如置信度评价)、丰富了关于用户A的数据,其他企业将可从该平台获取更多价值。这样,企业围绕平台构成了大数据共享网络。大数据平台成为网络效应的受益者。于此同时,企业客户在使用大数据产品时也具有边际效用递增的特征,数据用得越多,数据的价值就越大。可见,大数据经营完全符合新经济规则。数据不因使用而损耗,且随着使用次数增多价值反而变大,边际成本趋于0,边际效用递增,大数据的价值与数据节点及数据使用者节点的平方成正比。

细节四:如何将流量转化为大数据资产。针对流量业务,一方面优化现有面向消费客户的经营模式,另一方面从流量中提取大数据资产,作为构建面向企业客户大数据经营模式的基础,两者交叉补贴,平摊成本。用户在消耗流量的同时,也在为大数据经营添砖加瓦。一个基础设施,两个经营模式,这是成本收益困境的基本解题思路。对流量经营而言,智能管道存在的价值是调控和配置管道资源,但智能调控和配置的前提是对调控对象的深度识别和解析,而这正好就是从流量提取大数据的过程。因此,智能管道将成为电信运营商获取大数据的重要来源。大数据的另外两个重要来源是BSS和各种信息类业务的后台数据。不同域数据之间的混搭会取得1+1》2的效果。

(四)大数据平台运营商的演化

在未来实体世界与数字世界无缝整合的世界,高速流动的信息将充当不可或缺的纽带。谁能掌控两个世界相互耦合的界面,谁就将成为下一轮破坏性创新周期中最大的赢家,而大数据平台就是这样的关键环节。当前虽然总体上处于大数据1.0阶段,但基于数据重要性被不断认知、传统企业拥抱数字化商业模式热情高涨等事实,大数据领域正孕育着一个前景广阔、异彩纷呈的大市场。

未来的大数据运营商绝不仅仅包括现在的电信运营商,互联网巨头如facebook、google和阿里巴巴等也将沿着这一方向演进。阿里巴巴提出的“电商、金融、数据”三步战略就是明证。阿里巴巴和新浪微博、高德地图等之间的资本联姻,也是走在数据布局的路上。平台会扩张,生态会成长,当时代被烙上大数据的印记,围绕大数据公共平台运营商成长起来的大生态注定会成为信息文明的基石。从平台演进的角度,本文认为大数据经营的成熟将经历消费平台、垂直平台和公用平台三个阶段,简要描述如下:

第一阶段,竞争者们借助消费平台海量用户数据的原始积累取得了大数据平台之争的入场券。比如阿里巴巴的淘宝、腾讯的微信、facebook以及电信运营商的流量,都是典型的消费平台。各类消费平台有层次和领域的区别,渗透争夺十分激烈,但就数据储备而言都具备了进阶的资格。同时,OTT玩家普遍发育了后向广告模式,与电信运营商的流量前向收费模式相比,收入规模小但利润率高。

第二阶段,基于用户积累向垂直行业扩张或者某个特定的环节延展。这个阶段,消费平台依然非常重要,但随着数字世界与实体世界的整合,固守数字世界很快遇到增长极限,因而越来越多的资源将投入面向线下传统行业的拓展。垂直行业方面,包括金融业(互联网金融、移动支付等)、健康业(移动健康、移动医疗等)、汽车业(智能汽车、车联网等)。特定环节方面,包括营销(广告),CRM(如微信公众账号、淘宝卖家服务、FacebookConnect等)、产品设计(如天猫和华为定制手机合作等)。毫不意外,扩张的行业B2C特征较明显,延展的环节则以营销环节为出发点,而电信运营商通常以行业扩张为主,OTT以环节延展为主。总体而言,这些面向各垂直行业和特定环节的服务都以相对独立的小平台形式存在,每个垂直平台的经营模式各不相同,大数据资产进一步积累,但以信息为中心的经营模式仍未确立。从进阶第三阶段的角度考虑,衡量第二阶段经营成败的标准有两个:其一是是否与政府和传统企业建立了全面的信任关系;其二是是否掌握了大部分行业都需要的20%的关键信息。

第三阶段,面向全体社会成员的大数据公共平台出现。大数据在企业生产和消费者生活各环节的价值被充分认识,垂直行业内部的信息链在第二阶段被打通之后,进入跨行业信息共享阶段,大数据时代来临。在前文提到车联网信息、个人健康信息和保险公司的共享是这一阶段的典型案例,而车联网、移动健康领域的数据布局和与保险公司信任合作关系的建立,则已在第二阶段完成。值得强调的是,消费者的作用非常重要,因为各行业间打破信息隔阂唯一动力就来自于它们具有共同的用户。这一阶段,数据透明/共享/流动的范围、网络效应的范围、创造价值的范围达到了新的高峰。

上述三个阶段所描述的经营模式是叠加而非替代关系。从大数据的角度看,第一阶段着眼于积累原始资本,第二阶段注重数据的垂直投资布局和精耕细作,第三阶段注重跨行业数据的共享运营。但从经营视角来看,最终大数据运营商将具有三种核心业务、三种盈利来源,比如阿里巴巴的三步走战略,并不是金融代替了电商,数据代替了金融,而是按照这个路径最终形成三足鼎立的多元共生业务组合。

(五)对电信运营商的建议

既不甘于管道的低利润率,又无法适应OTT基于速度和创意的竞争规则,电信运营商一直在寻找位于管道业务和OTT业务之间的黄金地带。本文给出的答案就是大数据经营。大数据经营与传统通信经营在业务属性和经营模式上具有内在延续性。传统通信业务通过将个人连成通信网络解决个人与个人之间的信息不对称,大数据经营通过将企业连成大数据网络解决行业与行业之间的信息不对称,这个方向符合信息社会的演进脉络。通过选择正确的模式,大数据经营完全可以和传统通信业务一样具备网络效应等新经济特征,从而带领运营商走出当前流量经营模式的价值困境。

对电信运营商而言,大数据的战略地位应从内部运营工具提升到“新大陆”,移动互联网业务则从“新大陆”降低到撬动新大陆的“杠杆”。如果目标和OTT一样都是大数据,而获取大数据的手段并非仅自身运营OTT业务一途,电信运营商何必一定要吊死在这棵树上呢?调整心态后再参与OTT竞争,也许更从容不迫。因此,电信运营商无需过于纠结为何不具备互联网基因,而应立即与那些OTT站在同一起跑线上一道发力培养大数据基因,构建大数据经营模式。大数据目前还处于非常早期的阶段,大数据竞争最终将是资源密集型的,电信运营商在这个战场上的位势要比在OTT战场上好得多,至少暂时如此。比如,腾讯有微信和QQ,阿里有淘宝和支付宝,电信运营商有流量。关于下一步的布局,有如下几点建议:

1)信息基础设施的整合、开放与融合。最宝贵的资源不是网络、不是IT,而是信息。用全局眼光建立统一的、公司级的技术架构、功能架构和数据架构,将企业内部的各种资源包括网络资源、计算资源、应用和内容资源甚至物理设施资源纳入资源池,在此基础上构建资源管理、业务执行与管理、客户和商务管理等应用平台。最为关键的是,这些应用平台必须共享一个中央用户数据库。要实现这一目标,最大的阻碍是传统电信运营商的组织架构。Vodafone的做法是设立首席信息&技术官职位将CTO管理网络的职责和CIO管理IT的职责整合起来,BT的做法是成立Technology,Service&Operations事业部负责网络和IT的规划、部署和运营,事业部CEO亦为BT集团CIO,对各大前台业务单元的CIO具有直线职能权。

大数据论文范文5

1.进行销售的精准策划当前数字出版企业的竞争十分激烈,推出新的产品会有一定的风险。数字出版生产商必须在推出产品前建立一定的品牌形象,以此来减少产品的风险,增加产品的市场竞争力。在大数据的背景下,数据具有很强的经济价值。理论指出,行动是一个人的意愿决定的,这个意愿是个人对社会行为的态度和社会反映。传统的营销方式仅仅关注消费者的话语表达,而从话语中不能深层次观察出受众的心理。利用大数据预测用户行为时,要详细了解消费者对事物的态度和消费意愿,关注消费者的心理诉求。对消费者进行数据分析,整合一定的碎片信息,通过相关计算得出消费者对消费物的态度。和传统的抽样调查相比,数字出版企业利用大数据能够十分准确地把握消费者的具体组成和各个阶段的心理需要,并重新调整经营手段,以此来阶段化调整数字出版各个阶段中的内容比重,针对性地提供服务,增加消费者的粘合度。《卫报》是英国第二大日报,是业界使用新技术的重要先锋,其网站设置了专门的数据频道。其总经理发表了《数字新闻读者的“大数据”蕴藏巨大价值》,认为“大数据”可应用在媒体行业中,消费者的“大数据”隐藏很大的价值,不少数据能够吸引受众,并为内容商带来利益。

2.针对消费者个性需要推出产品个性化贯穿于整个信息化过程中,大数据能够将数据推向一个个性化方向,“这种个性化是基于系统通过分析读者阅读行为、喜好,从而获得对用户需求的感知。每个读者获得专属于自己的书,就是这种个性化服务的一种典型体现。在技术意义上,这种模式是能够成为现实的。”针对消费者的个性化需求推出产品,消费者肯定会购买,当消费者对满足个性化的产品满意时,数字出版的内容也能实现其价值,整个企业能获得一定的进步。消费者接触各种营销推广信息时,消费者的情感态度、认知行为会发生一定的变化,对于这种变化,传统的小规模范围内的问卷调查无法获得准确的信息,根本做不到监测全部,大数据背景下的网络平台将发挥出巨大的作用。淘宝每天会遇到几亿用户,每个用户具有不同的爱好与特征,淘宝将消费者的信息搜集起来,进行大数据分析,根据消费者的个人需要再去投放最合适的个性化产品广告,从而达到淘宝销售传播的效果最大化。建设个性化的数字出版平台能够把消费者和出版的企业联系起来,这点在当今大数据时代具有很重要的意义:数字出版的个性化平台要和各种终端(手机、IPad)、社交媒体(微信、微博、论坛)进行无缝连接,促使消费者得到快捷的阅读和便利的分享体验。数字出版内容的个性化定制购买与在线支付紧密联系在一起,这样,消费者就能轻而易举地购买产品。个性化数字平台和数据分析商进行链接,实现消费者的体验需求。例如,对于收费电子书,可以提供部分章节让读者进行阅读,这些电子书能够在被阅读时随时评论和分享。当读者在阅读时,平台能够及时收集到数据,关注到读者的静态与动态,读者的年龄、性别、收入、学历、地点、工作、读完免费部分会不会购买后继章节、读者一般在一页上停留的时间长短等信息全部被搜集起来,通过综合信息来分析和判断用户的经验。对于具有语音交互功能的数字出版App,数字出版商可以联合智能手机、IPad等阅读端的触摸屏、麦克风来监测用户的使用时间和场景,利用监测数据来评定这个App的质量。

3.优化研发生产整体平台在现代数字出版企业管理过程中,数字出版产品自开始研发阶段,就由RDM(ResearchDevelop-mentManagement研发管理系统)进行管理,生产过程一般由ERP(EnterpriseResourcePlanning企业资源计划系统)和数字化制作工具管理,供应链由SCM(Supplychainmanagement供应链管理)进行管理。如果使用系统对整个产品研发生产整体流程进行分析,就类似于将整个研发生产的整体流程进行扩大分析,并抽取精华进行观察,这对优化整体流程,提高产品的质量与生产效率具有很大的意义。产品研发过程中,可以实时利用大数据一起来建设协同编纂平台,在这个平台当中,作者、生产商、编辑、校对、平台商等相关工作人员可以一起进行协同编纂,并进行协同,形成新的BPP(BusinessProcessPlatform企业业务流程平台)。在这个协同编纂平台中,作者、生产商、编辑、校对、平台商等相关工作人员在工作过程中产生大量的非结构化数据。利用大数据对这些非结构化数据进行分析,往往能发现文本中的常见错误、制作中的瓶颈、工作人员能力的欠缺等,相关工作人员从而可以在后继的工作过程中拾遗补缺,调整工作方法,采取措施进行应对。当今诸多消费者不愿付费阅读的问题也可能会被较好地解决。鉴于协同编纂的兴起,数字出版企业就能根据目标消费者阅读需求来开发数字产品,注意产品的设计者、生产商、编辑、校对、平台商等每个环节工作人员与消费者之间的互动情感,对消费者的反馈信息进行开发,反思协同编纂中哪些工作环节导致消费者付费意愿不高,促使开发消费者付费心理的问题在根本上得到重视,这样,消费者就会拥有付费的意愿。

4.国有数字出版媒体利用大数据做出表率我国的国有数字出版单位属于“事业性质,企业管理”,同样也受到大数据的影响。国有数字出版单位生产力的未来提升,必然和大数据的获取、释放紧密相关。西方的媒体、政府、公民三者实行“媒体-政府-公民”三足鼎力趋势,三者之间保持相对独立,媒体得不到政府的资金或数据支持。我国的国有数字出版单位来源于国有传统媒体,充当着党和政府的喉舌,比其他商业媒体容易获得大数据。国有数字出版单位在不违背保密原则的前提下,应该尽可能和政府保持沟通,获得一个议题的全部数据,分析相关性,并最后释放到产品生产,这样就能在和他国媒体、其他商业媒体的竞争中保持自身的优势。国有数字出版单位对数据的获取和释放有着一定的依赖度:国有数字出版单位依赖政府收集数据的程度,国有数字出版单位依赖政府释放大数据的程度。大数据时代,国有数字出版单位的力量想壮大,数据权限的获取和释放程度是很重要的方面,国有数字出版单位在优先利用大数据将自身产品做大做强时,也就为其他商业媒体做出了表率,提示了一定的经营路径。

二、未来大数据技术在数字出版中存在的缺陷与挑战

1.部以XML格式输出———该问题成为当前大数据技术中的重要难题。依托大数据,从庞大的非结构化数据中来揭示新的意义和关系,并实现精准生产和精准营销是当下数字出版面临大数据而努力的方向。只有完善的XML格式输出技术,未来的数字出版才能做到聚类分析、聚类融合、网络分析、数据集成、可视化分析等。

2.收集渠道闭塞搜集各种信息来完成大数据采集是数字出版未来的趋势,但目前的数字出版信息搜集仍存在一些缺点:数字出版产品在整个研发、生产、销售过程中还没有彻底完成信息化经营,整体搜集难度显得较大;数字出版的云存储平台根本不具备海量存储功能;数字出版中的内容商、平台商还没有完全转换成数据提供商,因此,他们无法及时获取数据;当前的数字出版产品无法记录消费者使用过程中的痕迹,因此即使数字出版中的内容商、平台商变成数据提供商,也无法记录数据。

3.高端数据分析人才极其匮乏对大数据进行分析,熟练运用Hadoop、MapRe-duce、分布式文件系统、并行计算框架等技术的人才十分缺乏,而很多高校的计算机和出版专业也没有专设数据分析研究方向来培养学生,这也直接导致数字出版领域的高端数据人才匮乏不堪。

大数据论文范文6

个性化教学就是尊重学生个性的教学,必须根据每个学生的个性、兴趣、特长、需要进行施教,亦即学生需要什么,教师便授予什么,学生完全是一种自主性的学习。个性化教学也就是孔子所倡导的“因材施教”。那么,在大数据时代的今天,作为教师如何实施个性化教学,从而实现因材施教呢?

1.利用大数据的规模性了解学生差异。

每个学生都是不同的个体,有着鲜明的个性,因此,作为教师,首先要做的就是深入了解学生,这样的教学才有针对性。大数据的特征之一就是规模性,规模性指的是巨大的数据量以及数据规模的完整性。因而,教师完全可以凭借数据库中巨大、完整的数据了解学生诸如家庭背景、努力程度、学习态度、智力水平、认知水平等数据。教师只有真正了解了学生的发展情况,才能制定合适的学习计划,学生才会对学习产生兴趣,才会进步。

2.利用大数据的高速性营造和谐氛围。

美国心理学家罗杰斯曾说过:“成功的教学依赖于一种真诚的尊重和信任的师生关系,依赖于一种和谐安全的课堂氛围。”课堂上,让思维的火花翻新,让智慧的结晶生辉,让课堂百花齐放,形成师生互相尊重与信任的氛围,这应该是最理想的课堂状态。大数据的特征之二就是高速性,高速性指的是数据流和大数据的移动性,现实中则体现在对“实时性”的需求上,即能在第一时间抓住重要事件的发生信息。课堂上,教师可以利用大数据的这一特征,时时关注学生多样性学习动态,包括学生不同的表达方式、不同的解题思路、不同的探究结果,对有独到见解的要实时鼓励,对有误解偏差的要实时纠正,对有需要完善的要实时补充,如此,学生才能积极主动、充满自信地学习。

3.利用大数据的多样性选择学习方式。

个性化教学的落脚点是实现个性化的学习,教师应鼓励学生选择自己喜欢的学习方式。学习方式是学习者一贯表现出来的具有个性特点的学习策略、学习倾向的总和。选择自己喜欢或习惯的学习方式,对学习者而言能达到事半功倍的效果。大数据的多样性,指的是有多种途径来源的关系型和非关系型数据。互联网时代,各种设备通过网络连成一个整体,这意味着数据的种类变得繁多,除了简单的文本信息外,还可以对传感器数据、音频、视频、日志文件进行点击,获取可用的信息。这个时候,教师鼓励学生选择自己喜欢的方式,自己感兴趣的数据,个人或小组均可,开始或自主或合作的探究学习,完成学习目标,提高综合学习能力。

4.利用大数据的价值性落下点“睛”之笔。

任何学生的学习活动终究离不开教师的点拨与引导,唯有这样,方能醍醐灌顶,学有大成。互联网女皇marrymeeker在2012年论及互联网发展趋势中,用生动的图像来描述大数据的价值性:一幅是整整齐齐的稻草堆,另一幅是稻草堆中一根缝衣针的特写。寓意是通过大数据的帮助,可以在稻草堆中找到你所需要的东西,哪怕是一根小小的缝衣针,这就是大数据的价值性。那么,在课堂上,教师可以利用大数据的价值性,呈现出不同层次的难点予以解决,对不同层次的学生状况予以评价、对不同层次的学习能力予以拓展。

二、个性化教学应注意的几个问题

1.忌从数据化回到数字化。

数据化和数字化的区别在于,通过数据我们可以了解并理解一个学生,而通过数字我们只能看到一个学生的表象,这对学生的发展是绝对没有好处的。我们不得不承认在实施素质教育的今天,仍有一部分教师注重应试教育,看分识人,唯分对人,不习惯、也不喜欢看数据评价,这便与大数据时代下个性化教学相悖了。

2.个性化教学不是对传统教学的全盘否定。

上一篇董事长总结

下一篇售前演讲稿