前言:中文期刊网精心挑选了计算机数据报告范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机数据报告范文1
大数据背景下的机器算法
专业
计算机科学与技术
学生姓名
杨宇潇
学号
181719251864
一、 选题的背景、研究现状与意义
为什么大数据分析很重要?大数据分析可帮助组织利用其数据并使用它来识别新的机会。反过来,这将导致更明智的业务移动,更有效的运营,更高的利润和更快乐的客户。
在许多早期的互联网和技术公司的支持下,大数据在2000年代初的数据热潮期间出现。有史以来第一次,软件和硬件功能是消费者产生的大量非结构化信息。搜索引擎,移动设备和工业机械等新技术可提供公司可以处理并持续增长的数据。随着可以收集的天文数据数量的增长,很明显,传统数据技术(例如数据仓库和关系数据库)不适合与大量非结构化数据一起使用。 Apache软件基金会启动了第一个大数据创新项目。最重要的贡献来自Google,Yahoo,Facebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是复杂数据准备和ETL的旗舰,可以为许多数据存储或分析环境提供信息以进行深入分析。 Apache Spark(由加州大学伯克利分校开发)通常用于大容量计算任务。这些任务通常是批处理ETL和ML工作负载,但与Apache Kafka等技术结合使用。
随着数据呈指数级增长,企业必须不断扩展其基础架构以最大化其数据的经济价值。在大数据的早期(大约2008年),Hadoop被大公司首次认可时,维护有用的生产系统非常昂贵且效率低下。要使用大数据,您还需要适当的人员和软件技能,以及用于处理数据和查询速度的硬件。协调所有内容同时运行是一项艰巨的任务,许多大数据项目都将失败。如今,云计算已成为市场瞬息万变的趋势。因为各种规模的公司都可以通过单击几下立即访问复杂的基础架构和技术。在这里,云提供了强大的基础架构,使企业能够胜过现有系统。
二、 拟研究的主要内容(提纲)和预期目标
随着行业中数据量的爆炸性增长,大数据的概念越来越受到关注。 由于大数据的大,复杂和快速变化的性质,许多用于小数据的传统机器学习算法不再适用于大数据环境中的应用程序问题。 因此,在大数据环境下研究机器学习算法已成为学术界和业界的普遍关注。 本文主要讨论和总结用于处理大数据的机器学习算法的研究现状。 另外,由于并行处理是处理大数据的主要方法,因此我们介绍了一些并行算法,介绍了大数据环境中机器学习研究所面临的问题,最后介绍了机器学习的研究趋势,我们的目标就是研究数据量大的情况下算法和模型的关系,同时也会探讨大部分细分行业数据量不大不小的情况下算法的关系。
三、 拟采用的研究方法(思路、技术路线、可行性分析论证等)
1.视觉分析。大数据分析用户包括大数据分析专业人士和一般用户,但是大数据分析的最基本要求是视觉分析。视觉分析直观地介绍了大数据的特征,并像阅读照片的读者一样容易接受。 2.数据挖掘算法。大数据分析的理论中心是数据挖掘算法。不同的数据挖掘算法依赖于不同的数据类型和格式来更科学地表征数据本身。由于它们被全世界的统计学家所公认,因此各种统计方法(称为真值)可以深入到数据中并挖掘公认的值。另一方面是这些数据挖掘算法可以更快地处理大数据。如果该算法需要花费几年时间才能得出结论,那么大数据的价值是未知的。 3.预测分析。大数据分析的最后一个应用领域是预测分析,发现大数据功能,科学地建立模型以及通过模型吸收新数据以预测未来数据。 4.语义引擎。非结构化数据的多样化为数据分析提出了新的挑战。您需要一套工具来分析和调整数据。语义引擎必须设计有足够的人工智能,以主动从数据中提取信息。 5.数据质量和数据管理。大数据分析是数据质量和数据管理的组成部分。高质量的数据和有效的数据管理确保了分析结果在学术研究和商业应用中的可靠性和价值。大数据分析的基础是前五个方面。当然,如果您更深入地研究大数据分析,则还有更多特征,更深入,更专业的大数据分析方法。
四、 论文(设计)的工作进度安排
2020.03.18-2020.03.20 明确论文内容,进行相关论文资料的查找与翻译。2020.04.04-2020.04.27:撰写开题报告 。
2020.04.28-2020.04.30 :设计实验。
2020.05.01-2020.05.07 :开展实验。
2020.05.08-2020.05.15 :准备中期检查。
2020.05.16-2020.05.23:根据中期检查的问题,进一步完善实验2020.05.24-2020.05.28 :完成论文初稿。
2020.05.29-2020.06.26 :论文修改完善。
五、 参考文献(不少于5篇)
1 . 王伟,王珊,杜小勇,覃雄派,王会举.大数据分析——rdbms与mapreduce的竞争与共生 .计算机光盘软件与应用,2012.被引量:273.
2 . 喻国明. 大数据分析下的中国社会舆情:总体态势与结构性特征——基于百度热搜词(2009—2 012)的舆情模型构建.中国人民大学学报,2013.被引量:9. 3 . 李广建,化柏林.大数据分析与情报分析关系辨析.中国图书馆学报,2014.被引量:16.
4 . 王智,于戈,郭朝鹏,张一川,宋杰.大数据分析的分布式molap技术 .软件学报,2014.被引量:6.
5 . 王德文,孙志伟.电力用户侧大数据分析与并行负荷预测 .中国电机工程学报,2015.被引量:19.
6 . 江秀臣,杜修明,严英杰,盛戈皞,陈玉峰 ,郭志红.基于大数据分析的输变电设备状态数据异常检测方法 .中国电机工程学报,2015.被引量:8.
7 . 喻国明. 呼唤“社会最大公约数”:2012年社会舆情运行态势研究——基于百度热搜词的大 数据分析.编辑之友,2013.被引量:4.
六、指导教师意见
签字: 年 月 日
七、学院院长意见及签字
计算机数据报告范文2
按照高职教育“以就业为导向,以服务为宗旨”的目标,高职院校培养的学生除了具有良好的职业道德和职业素质之外,还应当具有熟练的职业技能【1】,因此,“修德、强技”是高职院校的教育教学核心内容。而高职院校计算机网络课程的教学更应以实践应用为主,着重培养学生动手解决实际问题的能力。
一、现状分析
1、采用的教材理论性过强,学生无法接受。
据调查,当前很多高职院校的计算机网络课程直接采用本科类的教材,这些教材理论性过强,感知性差,高职类学生难于接受,也不利于教学的开展。
2、实验室设备不足,不够专业。
不少学校都是使用普通的计算机机房进行网络实验,采用仿真软件进行模拟,至使所进行的实验脱离实物。也有不少学校有些网络实验室,有交换机、路由器等设备,但设备过于单一,学生无法进行深层次的试验;又或设备数量过少,在实验的课堂里,也无法做到全部学生都亲自进行一次实验。这样,学生的学习积极性不可能高,也没有什么学习效果。
3、选择的实验内容即简单,又陈旧。
实验内容选用操作系统windows 2000 的安装与配置、ftp站点的访问、internet的访问、下载工具的应用、文件的收发及电子邮箱的应用等。这些内容大部计算机类的学生都已经熟悉,而且也能比较好地应用本文由收集整理,完全没有体现计算机网络课程的专业性,课程结束后,学生感觉没有学到什么内容。
4、理论教学与实验教学关联性差,学生不易接受。
很多教师网络课程的教学过程中,引入过多的网络原理和各种协议,学生在学习的过程中常常感觉到抽象,经常会陷入困乏的状态,对于意志力比较低的学生,就会放弃学习了。
5、实验指导教材较少,可操作性差。
当前,大部分学校采用的计算机网络实验指导性教材主要是编程实验,如网络通信程序设计、网络协议编程实验等,实验内容与其它的计算机课程重复,网络专业课程实验可操作性差。
二、高职类计算机网络课程应采用的内容介绍
高职类院校《计算机网络》课程的教学对象主要是计算机通信类和应用类的学生,因此,该课程应是这类学生的主修专业课,所采用的教学内容应具有专业性,更应具有专业实用性,因此,所采用的教学和实验内容应具有以下几方面的内容。
1、计算机网络体系结构及网络参考模型;
2、综合布线原理及局域网的组建;
3、网络互连技术及ip地址的应用;
4、网络协议的应用及网络设备的管理;
5、网络应用系统的搭建方法及管理;
6、计算机网络安全及发展趋势。
以上教学内容即符合计算机网络的教学,又能体现当前高职类学生网络技术的应用要求,学生易于接受,可操作性极强。笔者曾多次在茂名职业技术学院计算机通信班中采用过这些内容作为《计算机网络课程》的教学,均收到了预期的效果。
三、网络实验室的组建
组建一个功能实用,操作性强的网络实验室,是开展好网络实验课程的前提。对于高职类院校,网络实验室组建后必须发挥其实用性、可操作性,能满足基本的网络搭建、网络维护、网络管理及应用的实验即可。笔者根据高职类学生的学习需求,提出高职类计算机网络实验室组建的具体要求,如:
(一)网络实验室实验功能需求:
1 、局域网组建(双绞线的制作、linux 或windows 2003 server或windows 2008 server的安装与管理);
2 、交换机、路由器的调试(以华为、思科为主);
3 、网络协议应用(包括ip 地址规划及相关协议、tcp/udp数据通信与传送、应用层协议应用等);
4 、网络安全管理(防火墙、snmp协议与网络管理);
5 、web站点、ftp站点的配置等网络应用服务;
6 、网络综合布线的设计与分析。
(二)实验室空间及设备需求:
1 、可同时容纳40名学生进行实验,150平方米比较合适。
2 、实验室主要设备列表
序号 设备名称 数量 备注
1 服务器 1 ibm system x3650 m4(7915i21) 以上配置
2 服务器 1 ibm system x3100 m4(2582i18)以上配置
3 服务器 2 ibm system x3250 m4(2583i15)以上配置
4 工作站 40 酷睿i5 3.2ghz/独显/4g/19lcd以上配置
5 交换机 1 思科ws-c3750x-24t-s 以上配置
6 交换机 2 h3c s5120-28p-si 以上配置
7 光纤模块 4 h3c s3600 以太网交换机sfp 模块
8 路由器 2 思科3945/k9 以上配置
9 无线路由器 2 思科精睿wrvs4400n 以上配置
10 桌/椅 45 学生上课使用
3 、实验室主要耗材列表
序号 设备名称 数量 备注
1 仪器柜 1 存放网络耗材及相关工具
2 压线钳 12 制作各种水晶头
3 测线器 6 检查网络的导通情况
4 万用表 2 检查电压、电流值的大小
5 水晶头 5 5盒rj45接口水晶头
6 网络 2 超五类非屏蔽双绞线(可使用废弃网线)
7 十字螺丝刀 10 安装设备使用
8 线槽 备有3种类型以上
(三)引入仿真软件进行教学
计算机网络课程引入仿真软件进行实验教学,将大大地解决了硬件设备投入不足、学生受实验的时间和空间限制等问题。是欠发达地区高职院校真实网络实验室的补充,也极大地提高了学生的动手能力、分析能力和解决实际网络问题的能力。
当前,学校采用较多的计算机网络仿真软件主要有cisco packet tracer、gns3这些价格低廉、使用效果较好的软件。另外,商业软件opnet也是一款较好的仿真软件,但价格比较贵,一般不建议学校购买。学校选用cisco packet tracer免费软件,学生可以安装在自己的pc机上,即可将网络实验室搬到自己的宿舍,也可搬回自己的家。这样,能更好更快地解决学生开展网络实验的环境问题。
cisco packet tracer辅助学习工具是由cisco公司,主要包括(1)支持多协议模型;(2)支持大量的设备仿真模型;(3)支持逻辑空间和物理空间的设计模式;(4)可视化的数据报表示工具;(5)数据报传输采用实时模式和仿真模式,使用用户能对抽象的数据的传送具体化。可通过拖曳方法直接建立网络拓扑、允许学生实现ios子集的配置、查看数据包的处理过程等,为初学计算机网络课程的学生去设计、配置、排除网络故障提供模拟的网络环境。【2】
按以上要求组建计算机网络实验室,符合高职类院校的教学要求,学生也易于开展相关的课程实验。
四、高职类计算机网络课程实验教学内容的设计
1、从数据通信认识计算机网络
计算机网络是由不同通信媒体连接的、物理上互相分开的多台计算机组成的、将所要传输的数据划分成不同长度的分组进行传输和处理的系统 。【3】主要的教学材料有双绞线、光轴电缆、光纤和无线路由器。其中主要介绍双绞线的特性和制作方法,如568a、568b的制线标准及连接设备的要求。最后,使用交换机及所制作的双绞线,将若干台计算机从物理上连接起来,最终实现简单的局域网组建实验。共使用6个学时完成以上2个实验的内容。
2、从局域网的参考模型理解网络数据的传输及osi参考模型
局域网的体系结构由物理层、介质访问控制层和逻辑链路控制层组成;该体系结构属于osi参考模型的物理层和数据链路层。选用的教学内容主要有osi参考模型flash动画、网络数据传输flash动画、网卡、3台计算机(安装有windwos 2003 服务器操作系统以上版本)、交换机。学生可通过模拟动画,感性认识计算机数据在网络中的工作过程,通过对计算机通协议的安装与调试,实现网络互连。共使用8个学时完成以上4个实验的内容。
3、虚拟局域网的构建技术及网络设备的管理
虚拟局域网的构建技术主要是对交换机的应用,即需要充分理解交换机的虚连接和转发功能。实验的要求主要是实现网络数据的存储转发、切入法、改进型切入法及vlan虚拟工作组的应用。选择的主要教学材料有交换机(如两层、三层的交换机)、交换机命令列表、路由器、ip地址分配器、数据包转发过程flash动画。学生通过学习交换机的有关命令的使用方法,进入交换机内部,实现对ip地址的规划、虚拟局域网的构建,并实现对各种网络连接设备进行远程的管理。共使用12个学时完成以上4个实验的内容。
4、网络应用系统的搭建方法及管理
主要是ftp协议、iis的安装。选用的教学材料有3台计算机(安装有服务器操作系统的计算机,如unix、windows等)。主要实现动态网页服务、数据库安装及内容管理系统(cms)应用、网络应用层协议分析和验证等。共使用6个学时完成以上2个实验的内容。
五、学生实验报告及实验效果评价
学生认真撰写实验报告,是学习效果的最好评价。一份完整的网络实验学习报告完全能反映出学生是否真的掌握了该实验,那么,该实验报告应包括以下几方面的内容:1)实验材料准备;2)实验过程运用的方法;3)实验过程记录;4)实验结果分析;5)实验过程中遇到的问题以及对问题的解答;6)实验总结及评价。
计算机数据报告范文3
关键词:数据中心;远程监控;GTK+;邮件报警
DOIDOI:10.11907/rjdk.161685
中图分类号:TP391
文献标识码:A文章编号文章编号:16727800(2016)009014003
作者简介作者简介:黄京莲(1964-),女,北京人,北京外国语大学计算机系讲师,研究方向为网络空间信息处理。
0引言
计算机数据中心在整个计算机网络中扮演着越来越重要的角色,为网络数据共享提供了极大便利。在计算机网络日益发展,信息数据量不断膨胀的今天,数据中心作为数据网络中的重要一环,已成为整个计算机网络体系中不可缺少的一部分。数据中心成为数据聚集中心的同时,也成为了风险的聚集中心。服务器处于24小时工作状态,一旦数据中心出现问题,势必影响计算机系统的运行,轻则造成数据传输滞后,系统运行缓慢,导致用户体验受损,重则可能对数据存储以及系统运行的安全性和可靠性造成威胁,带来严重后果。因此,对于数据中心的监控系统进行研究和开发,有着重要意义。数据中心的监控主要包括两大部分:一部分涉及对机房环境的监控,包括电源、设备、消防、保安、机房温度、电压、漏水检测等;另一部分涉及对服务器运行状态的监控,包括服务器的CPU负载、内存利用率等方面。这两部分的监控密切相关,环境的变化,尤其是温度和湿度的变化会导致服务器工作情况的改变,而服务器的负担过重可能导致服务器温度升高,从而引起机房环境的变化。
数据中心的监控需要针对不同设备,采用多套复杂的监控系统协调工作,密切配合。由于数据中心监控中最重要的部分是对服务器系统的监控,引入服务器自动监控和报警机制,有助于减轻机房管理人员的劳动强度,对监控数据进行分类和整理,并加以存档和分析,有助于观测数据中心的服务器在一天之中负载情况的变化,找出峰时和谷时,有针对性地采取预防性措施,在服务器负担较重的高峰时段通过增开服务器的方式减轻服务器负担,并增加监控内容和频率,减小宕机风险;而在服务器负担较轻的时段能够充分利用空闲资源。
本文选择可移植性的Bash Shell语言和C语言,并基于 GNOME 桌面系统的底层 GTK+机制实现GUI图形用户界面,利用Gnuplot作为绘图工具包,实现远程监控和图像化的数据分析,实现了对计算机CPU基本信息、CPU使用率、内存使用率、CPU负载情况等服务器运行状况的远程监控,并实现了自动检测。同时,该系统还能够利用LINUX的cron服务,对服务器运行状况进行监控记录,并通过日志绘制统计图等来显示服务器的运行状况。在开启自动监视后,脚本通过Unix/Linux的mail/mailx命令发送警报信息,还可将系统数据统计图发送到指定收件人作为存档依据。
1监控系统结构
1.1系统结构
系统主要分为被监控端服务器和监控端主机两部分。被监控端服务器安装有监控系统所需的源代码,同时有cron进程定时运行监控脚本收集数据以供作图分析。被监控端服务器和监控端主机均运行Linux系统。由监控端主机远程登录到被监控端服务器运行程序,通过对显示的控制,以及SSH的X选项,实现远程显示服务器端应用程序图形界面。该图形界面可直接在监控端弹出窗口,显示监视数据。同时,对于未安装图形界面的服务器,可以采用运行监控系统的shell脚本版本,在命令行下完成操作。对于数据的分析可以由shell版本生成数据表格(html形式)和图片分析发送至用户指定邮箱,同样能够实现图形化的显示。
1.2监控内容
系统所完成的主要任务是对数据中心的服务器运行状态进行监控。对于服务器运行状况最为直观的监控方式就是对服务器的各项性能数据进行监控,因此监控的主要内容有:CPU 基本信息、磁盘分区使用情况、CPU负载、CPU使用率、内存使用情况。同时,为实现无人值守,要求服务器能够自动对各项数据进行监控并在超过预设的警报值时自动报警。因此,本系统中还涉及如下功能:自动进行磁盘分区检查并发送警报邮件;自动进行CPU负载检查并发送警报邮件;自动进行内存使用情况检查并发送警报邮件。
为便于对数据进行更为直观的统计和观测,在图形界面中,还有实时统计图表查看和历史统计图表查看的功能。在shell脚本中,由于考虑到非图形界面无法显示图形的功能,此功能被发送图表报告取代,用户可以通过打开自己的邮箱查看附件观测数据统计情况。在本系统中预设了3种模式的系统报告可发送:①实时系统情况报告。该报告将生成一份文本文档,显示系统当前情况;②系统运行统计数据报告。该报告为表格形式的HTML文件,能够显示当日至此的统计数据。同时,通过选择日期,也可以发送历史某日统计数据。
系统运行统计图表报告为统计图形式,是由运行统计数据绘制成的4张图表。该图表同样可以通过日期的选择,发送历史某日的统计图。系统功能如图1所示。
1.3监控数据采集
Linux/Unix操作系统中常用的数据采集方式主要有shell命令采集方式,/proc伪文件系统和LKM可加载内核模块采集方式。Linux/Unix操作系统都提供类shell命令查看系统信息的方式,对于用户而言,只需输入相应的shell命令即可查看相关的系统信息。这一方法简单易用,且由于是Linux/Unix操作系统自带的功能,因而并不存在不兼容的问题。事实上,目前多数监控系统都采用此类方法获取监控信息。在Linux操作系统中,可以使用ps命令显示当前系统进程的列表,free显示物理内存和交换区的总量以及已使用的、空闲的、共享的、被缓存的内存数量等。实际使用中,通常需要首先通过Linux命令读取数据,然后利用shell的管道和重定向的方式将数据输入文件或取出,再进行下一步的分析处理。
proc (process information pseudo file system,进程信息伪文件系统)文件系统之所以被称为伪文件系统,是因为它是一个虚拟的文件系统。它由Linux/Unix内核动态维护和更新。
与一般的文件系统不同,/proc伪文件系统并不存在于硬盘上,而是存在于内核核心态空间中,系统启动时,内核自动将该文件系统装载在/proc目录下。/proc伪文件系统中包含CPU信息、内核/系统使用信息、内核版本、网络状况、设备信息等大量信息,均以文件形式存储,并通过内核对其进行更新以确保实效性。由于只需通过文件读取的方式获得,从/proc伪文件系统获取系统运行数据方便快捷且效率较高。本文采用了/proc伪文件系统的采集方法,并对采集信息加以整理分类。CPU基本信息可由/proc/cpuinfo文件获得,其中包括CPU的供应商、频率、模型等静态信息,如图2所示。processor:该条目是这一逻辑处理器的唯一标识;physical id:每个物理封装的唯一标识,其数量代表物理CPU的数量;core id:每个内核的唯一标识符,其数量代表内核的个数;siblings:位于同一个物理封装中的逻辑处理器的数量;cpu cores 同一物理封装中的内核数量;vendor id:生产商名,对于英特尔的处理器而言,vendor id中的字符串是GenuineIntel。
2监控系统实现
在shell脚本中,可以通过grep+关键词的方式,找到关键词所在行,再通过排除重复、统计行数,或是截取关键内容等方法获得所需的相关数据。获取CPU数目的关键代码如下:
cpu_num=`cat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -l`
从cpuinfo中找出与physical id有关的内容,排重后计算行数,以获得物理CPU的数目。计算CPU负载情况时,使用的主要是uptime命令。对计算CPU负载而言,有用的数据是load average后的数值。这3个数据分别代表的意思是1分钟、5分钟、15分钟内系统的平均负荷。当CPU完全空闲时,平均负荷为0,当CPU工作量饱和时,平均负荷为1(单个CPU的情况)。在n个CPU 情况下当CPU完全空闲时,平均负荷为0,当CPU工作量饱和时,平均负荷为n。当平均负荷超过n时,说明CPU负载过大,不能及时处理所有工作。"load average"的值越低,说明负载越小,系统负荷越轻。在设计监控数值时,可以将平均CPU负载的警报值设置在0.8n左右,具体情况可以依照用户的自主设定来选择。
"load average"一共有3个值:1分钟系统负荷、5分钟系统负荷、15分钟系统负荷,计算时值的选取必须仔细研究。如果仅有1分钟的系统负荷大于n,其它两个时间段都小于n,可见问题并不突出,只是暂时现象,但如果15分钟内的平均系统负荷始终大于n,则表明问题并非暂时的,需要加以解决以降低系统负荷。因此,本设计中采取15分钟的系统平均负荷作为监控数据。
实现这一功能的主要bash脚本如下:
load_15min=`uptime| cut -d , -f 5`
load_avg=`echo "scale=0;($load_15min*100)/$total_core"|bc -l`
WARNING=80
full=0
if [[ "$load_avg" -gt "$WARNING" ]]; then
full=1
echo -e "033[31;1mYOUR CPU is overload!033[0m"
fi
if [[ "$full" -eq 0 ]]; then
echo -e "033[35;1mYour CPU LOAD is under control!033[0m"
fi
其它系统信息采集方法基本类似,如采用shell命令采集磁盘分区。在终端下输入指令:df Ch时得到磁盘空间使用率信息:在监控程序中首先利用管道将df Ck 命令的输出转变为grep命令的输入,并通过grep命令取出/dev相关的行。此后分别取出文件系统,使用率和峰值所在项数据。通过数组存储。内存使用率计算主要依靠/proc伪文件系统中的/proc/meminfo。计算内存使用率主要需要获取的内容是MemTotal和空闲内存的数量。磁盘分区使用量和内存使用量监控的总体实现方法相似,都通过运行脚本获得使用量数据后导入C语言程序中所定义的变量,由此再转换为可显示的数据。
自动检查的实现方法主要是在后台运行程序,通过加入循环,并在每次循环时加入一定间隔时间的方式(如sleep 20)来控制脚本运行,达到自动检查的目的。
3结语
数据中心监控问题日益引起重视,服务器监控为其中最重要的内容之一。本文针对LINUX或其它类UNIX系统,对服务器监控的内容和实现方法进行研究,并给出具体的设计实现方案。文中以Linux操作系统为开发平台,使用Apache服务器软件提供相应的服务支持。对于监控内容的确定,主要从实际需求与可实现性的角度出发。可供监控的内容主要有CPU信息、CPU负载、内存使用率、磁盘分区使用状况、CPU温度、CPU电压等。由于温度和电压等部分需要通过加载外部组件等方式来获取,难以直接通过shell命令采集或是/proc伪文件系统获取的方式来取得,故并未在本文设计中体现。因此,本文监控的主要内容为CPU信息、CPU负载、CPU利用率、内存使用率、磁盘分区使用状况,并对相关信息进行了整理和加工。通过命令和/proc伪文件系统,读取系统文件,从文件中筛选可用信息,并通过对信息加以整理、分类、计算,并采用重新写成文件或输出到屏幕的方式,显示相关信息。具体工作包括:读取归纳CPU基本信息、计算CPU负载情况、计算CPU使用率、计算内存使用率、设计自动检查、撰写邮件脚本、设计用户自主设置内容并完成内容的实时读取、存储、更新。
参考文献参考文献:
[1]WALKER,RAY.Examining load average[J].Linux Journal,2006(5):152.
[2]SMITH,CURTIS,DAVID HENRY.Highperformance linux cluster monitoring using java[C].Proceedings of the 3rd Linux Cluster International Conference,2002.
计算机数据报告范文4
关键词:SOCKS;NAT;P2P;STUN;穿透
中图分类号:TP393.03
IP网络地址是整个互联网的基础,目前大多数网络设备使用的都是IPv4地址。IPv4地址提出的时候没有想到互联网发展如此之快:根据2012年的思科报告,全球有23亿互联网用户,到2017年,全球将会有约36亿互联网用户。到2017年,将会有超过190亿全球网络联接(固定/移动个人设备、M2M联接等)。现在IPv4的地址已经不够这些设备使用了,为了解决这个问题,IETF提供了NAT[1][2]方案,这个方案使用NAT将网络分为外网和私网,每个私网都可以重用,这个方案大大缓解了IPv4地址匮乏的问题。但是这个方案导致了一个问题,对于想对外提供服务的NAT私网内的用户而言,这个功能会受到限制,最主要的原因是NAT外的用户不能直接访问到NAT内私网中的计算机数据。这种情况导致了互联网上P2P互相访问的困难。不过目前还有很多应用需要这种服务器式的被动访问,比如SOCKS4/5[3][4]协议,这个是最为知名的一种协议,通过这个协议服务,能够透明地中转服务器和客户端之间的数据。然而NAT的引入导致在NAT后面的用户无法对外提供SOCKS4/5服务。本文试图使用穿透NAT的P2P技术,使在NAT内的SOCKS4/5服务也能提供给外部机器使用,真正实现对于互联网的任何一个用户都能够直接访问。
1 穿透NAT的协议
为了解决引入NAT设备后网络互联出现的问题,有大量协议被发明和使用,比如MIDCOM[5]、TURN[6]等,但是这些协议大都需要第三方介入,这会导致一些问题。如:中转第三方的带宽、处理能力以及实时性。这随着NAT后面节点的增多,数据量的增长以及对于实时性的严格要求等,这些协议处理都存在问题。我们希望两个机器能够实现真正沟通,而不是通过中继的方式。UPNP和STUN这两个协议能够实现这种真正直接的沟通。
1.1 UPNP[7]
UPNP(Universal Plug and Play)是由UPnP Forum推广的一套网络协议。该协议的目标是使家庭网络和公司网络中的各种设备能够相互无缝连接,并简化相关网络的实现。UPnP通过定义和基于开放、遵循因特网通讯网协议标准的UPnP设备控制协议来实现这一目标。任何设备都能自动加入一个网络,获取自己的IP地址,宣布自己的名字,根据请求检查自身功能并且检测出其它设备和它们的功能。支持UPnP的设备允许UPnP数据包通过IGD协议在没有用户交互的情况下,无障碍的通过NAT。但是UPnP的缺点是:它要求所有网络中的设备都支持UPnP,即使单台设备不符合UPnP标准的,我们就无法实现一种P2P网络。
1.2 STUN [8][9]
STUN协议是一种轻量级的客户端-服务器模式的协议,它不需要任何管理员进行网络配置,就能发现它们和公网之间是否存在NAT,并确定NAT的类型。STUN协议目前仅仅支持使用UDP报文穿透Cone NAT[10]。此协议利用Cone NAT传输 UDP的原理进行穿透[11][12][13]:私网内某个机器通过Cone NAT发送UDP数据到外网某个机器,内部IP地址和端口的UDP数据经过Cone NAT被映射到一个外部地址,在某个时间段内这个内部IP地址和端口将被转换为固定外部IP地址和端口(这个过程将被Cone NAT记录,并且存储为一个Session)。此后,如果外部Session对应的机器发送UDP数据到这个Cone NAT,Cone NAT会把这个数据包转发到内部映射的这个地址上。目前IETF定义的STUN协议目前能够穿透Cone NAT,但是不能穿透Symmetric NAT。不过我们可以通过修改STUN协议来实现穿透Symmetric NAT的目的。[14][15][16]
2 SOCKS4/5协议
SOCKS协议是一种应用层次的协议,它提供一种通用方案,能为应用程序提供基于TCP和UDP数据报文的服务,但是它不能ICMP之类的底层通讯协议,SOCKS协议从概念上来讲是介于应用层和传输层之间的“中介层(shim-layer)”,SOCKS V4协议为HTTP、FTP、TELNET、WAI和GOPHER等基于TCP协议的客户/服务器程序提供了方案。新的SOCKS V5协议在SOCKS V4协议基础上作了进一步扩展,从而可以支持UDP协议,并对其框架规定作了扩展,以支持安全认证方案。同时它还采用地址解析方案以支持域名和IPV6地址。
SOCKS协议利用握手(negotiation),请求(Requests),应答(Replies)等过程完成对于上述协议的转发。一般而言SOCKS4/5服务器通常绑定在1080端口上。
3 NAT穿透SOCKS4/5协议实现
3.1 协议方案
如图1,为了实现双方都在NAT后的机器的SOCKS4/5之间的直接通信,我们需要一个双方都能访问的中间服务先把两边的机器关联起来。在公网上我们需要架设一个双方都能够联系的服务器,然后通过STUN协议帮助双方完成直接通信。一旦直接联系完成,我们就不再需要公网中间服务了,此后我们采用可靠的UDP传输协议完成SOCKS4/5客户端和服务器的直接数据传输。
此协议分为两个部分,首先是通过STUN协议完成NAT后两个机器的SOCKS4/5客户端关联器和SOCKS4/5服务器关联器的直接通信,然后使用可靠的UDP协议完成SOCKS4/5客户端服务器的数据通信。
3.2 建立直接通信
我们可以使用STUN协议来帮助双方都在NAT后的机器建立直接的通信。STUN协议通过一种叫做UDP hole punching的机制来实现这一目的。一旦完成这个操作,两个NAT设备后的机器就能够实现直接的网络通信而不再需要STUN服务器的介入了。
如图2显示SOCKS4/5客户端关联器和SOCKS4/5服务端关联器通过STUN协议帮助建立直接通信的过程。
(1)客户端关联器通过NAT A连接到服务器,服务端关联器通过NAT B连接到服务器,服务器记录客户端关联器和服务端关联器的外网地址和端口。
(2)服务器向客户端关联器发送服务端管理器的外网地址和端口消息,服务器向服务端关联器发送客户端关联器的外网地址和端口消息。
(3)客户端关联器向服务端关联器的外网地址和端口发送hole punching消息。虽然这个数据包在NAT B的时候会被阻止(非Full Cone NAT禁止没经过关联的外网IP直接访问内网),但是这个UDP数据包在经过NAT A的时候,会在NAT A上建立一个Session,这个Session记录了本地客户端关联器与服务端关联器外网地址的关联信息。
(4)服务端关联器发送回应消息到客户端关联器,NAT A由于有步骤3由hole punching消息建立的Session,NAT A将会把这个消息转发到客户端关联器,完成后双方建立直接的消息通信。
3.3 SOCKS4/5数据传输
由于STUN协议仅仅支持UDP的穿透,但是SOCKS4协议只支持TCP的连接,为了兼容SOCKS4/5协议,我们使用转发的机制来保证我们的程序能够完美匹配SOCKS4/5这两种协议。
如图3所示:
(1)SOCKS客户端关联器绑定本机端口1080。本地SOCKS客户端程序(如IE等程序)设置本地SOCKS为本地127.0.0.1080。SOCKS客户端按需要访问某个公网服务器或者远端对方的私网服务器。
(2)客户端关联器接收到SOCKS客户端发送过来的数据,不做任何改变,通过可靠的UDP(如UDT协议,此协议可以提供类似TCP的可靠数据传输)数据传输发送到已经建立的直接通信的服务端关联器。
(3)服务端关联器接收到可靠的UDP传输过来的数据,然后不做任何改变的将这个数据通过TCP转发到SOCKS4/5的真正服务器程序(127.0.0.1:1080)。
(4)SOCKS服务器连接实际需要访问的公网或者私网服务器(如需要访问的HTTP服务)。
4 实验测试
4.1 实验设备
系统硬件:三台PC,配置:CPU P6 3.40GHz 4GM 内存
NAT设备:两台NetGear WPN824路由器。
操作系统软件:Windows7。
4.2 实验效果
程序经过实际测试证明,支持NAT穿透的SOCKS协议完全可行。测试显示浏览器浏览网站与直接使用SOCKS协议连接的效率基本接近,但是由于中转过程的花费,浏览大型网站可能相对于直接SOCKS连接慢了5%,不过这个基本不会影响用户的感受。
5 结论
SOCKS协议是客户端/服务器模式,这种模式由于NAT的引入导致如果服务在NAT后面将会出现问题。本论文使用一种新的客户端-服务端关联器方法使得SOCKS协议能够支持NAT的穿透,这个使得SOCKS协议能够被大多数工作在NAT后的计算机使用。并且这种关联器方法与上层的协议没有任何直接关系,我们可以扩展此种协议,使得很多原来不支持NAT穿透的协议也能够被支持,比如:SMTP、POP3、IMAP、SNMP等。同样,这个方法也能支持我们定义新的协议,比如类似QQ一样即时P2P通讯协议。
参考文献:
[1]P Srisuresh, M Holdrege. IP network address translator (NAT)terminology and considerations.RFC 2663.August 1999.
[2]G Tsirtsis and P Srisuresh. Network address translation-protocol translation (NAT-PT).RFC 2766.February 2000.
[3]Ying-Da Lee, SOCKS: A protocol for TCP proxy across firewalls, http:///txt/socks4.protocol.
[4]M. Leech , M. Ganis, Y. Lee, R. Kuris, D. Koblas, L. Jones. SOCKS Protocol Version 5. RFC 1928.
[5]P Srisuresh, J Kuthan, J Rosenberg, A Molitor,A Rayhan. Middlebox communication architecture and framework.RFC 3303.August 2002.
[6]J. Rosenberg, C. Huitema, and R. Mahy. Traversal using relay NAT (TURN). Draft-rosenberg-midcom-turn-03, October 2003.
[7]UpnP Forum. Internet gateway device (IGD) standardized device control protocol. November 2001.
[8]J. Rosenberg, J. Weinberger, C. Huitema, R. Mahy.STUNSimple traversal of user datagram protocol(UDP)through network address translators (NATs).RFC 3489,2003.
[9]J Rosenberg, R Mahy, P Matthews, D Wing. Session traversal utilities for NAT (STUN). RFC 5389. 2008.
[10]C Jennings. NAT classification results using STUN. RFC 5389. October 2008.
[11]T. Hain. Architectural implications of NAT. RFC 2993. November 2000.
[12]D Senie. Network address translator (NAT)-friendly application design guidelines. RFC 3235. January 2002.
[13]Saikat Guha, Paul Francis. Simple traversal of UDP through NATs and TCP too (STUNT). http://nutss.gforge.cis.cornell.edu/stunt.php.
[14]Yuan Wei,Daisuke,et al. A new method for symmetric NAT traversal in UDP and TCP,APAN Network Research Workshop.11-18,August 2008.
[15]王勇,崔修涛,吕钊,李子成.基于探测对Symmetric NAT与端口受限NAT的穿透方案[J].计算机应用,2006,4(26).
[16]杨璐,沈悦,蒋蕾.一种TCP协议穿透Symmetric NAT方案[J].计算机工程与应用,2007,43(6).
计算机数据报告范文5
关键词:大数据 收视率 建构
随着互联网数字化及媒介融合进程的加快,中国电视行业已不可避免地进入了大数据时代。媒体机构、广告商、收视率调查机构意识到仅凭单纯的收视率数据难以全面、深入地把握和分析受众,“亟须引入新的监控视角和衡量标准来进行评估,综合考量观众对电视节目的真实关注情况和态度倾向,了解观众的个性化需求,以求深入、全面评估电视节目的影响力。”①
“大数据”概念、数据挖掘技术进入传统收视率调查系统,促使收视率调查方法、技术不断进步与革新,依托对大数据监测与整理,全面、客观、准确地呈现了全媒体环境下受众的收视行为。
传统收视率调查面临的挑战与质疑
收视率调查开始于20世纪30年代,经过几十年发展,在技术和数据处理上已较为成熟,被广泛运用于电视节目评估。但是,随着大数据时代的到来,传统的收视率及其调查方法,已不能反映受众真实、全面的收视行为,进而不能反映和评估出节目的真实价值,亟需创新和变革。
一、测量指标少,无法全面反映收视效果。收视率调查除了收视率一项指标外,还有开机率、占有率、达到率等指标,测量指标表面上很全面和多样,但是受众收视效果分为认知、心理、行为三个层面,收视率测量指标反映了第一个层面的效果,即多少人看了某节目、看了多长时间。受众收视心理效果或之后的行为效果,对视频的喜好态度和满意程度,收视率却反映不了。由此可见,传统的收视调查在指标样本设置上具有局限性,不能反映受众的态度和心理,无法准确评价节目的好坏优劣,影响收视率评价的科学性和合理性。
造成收视率测量指标较少的原因是多方面的,首先是收视率调查公司面临数据采集技术难题,数据收集和分析非常耗时耗力;其次,存储技术也限制了海量数据的收集;更深层次的原因是人们过于依赖小样本时代的随机抽样,对统计学的认识局限和思维误区,认为小数据时代的随机采取和相关指标能够代替大的样本获得信息,忽略大数据时代的来临和数据挖掘技术的巨大进步,错失一些原始数据背后的重要价值。
二、样本量较少,可信度低,易受污染。传统的收视率调查采用随机抽样来代替普查,我们不能否认其科学性和可行性,但是依赖绝对随机性,在现实环境下非常难以实现,国内收视率调查公司的调查点多分布在大中城市,偏远地区很少设有调查点,样本数量少。在地域辽阔、人口密集、城乡差异巨大的中国,这样的抽样方式不能反映全部受众的收视情况,不具备样本的代表性和可比性。传统收视率调查的日记法要求受众认真准确填写收视日记,但是有些受众在收看过程中没有按时、如实填写,而是事后追记甚至是一周一记录,导致日记法可信度较低。
在传统收视测量中,由于采集到的数据样本少,一旦有少量样本户受到干扰,就将直接影响整体的真实性和准确性。②有媒体曝光一些利益集团采用不正当手段,寻找和接近样本对象,以贿赂、收买等方式影响样本对象的收视行为,让其锁定收看某节目导致收视率数据虚假失实,影响收视率作为“行业货币”的信誉度和权威性。据索福瑞公司的总经理王兰柱介绍,索福瑞在每个大中城市会有300户的样本户,如果有人想通过非常手段来影响收视率,只需要影响6户样本户就有可能将收视率提高一个百分点,“而这一个点的改变,能给电视台、栏目带来近百万的经济收益。”③
三、播出终端多样化,无法开展跨平台测量。进入全媒体时代,受众的时间正被越来越多的媒介、频道、平台瓜分,受众群体因此变得越来越碎片化。受众拥有更多自主性和能动性,会根据自己的时间和喜好编辑个性化的收视节目单,彻底改变了按照电视台的节目时间表来收视的习惯。受众还可以先把喜欢的节目录下来,等方便的时候再收看,这种新技术还提供任意快转、停止、跳过不想看的部分等功能;通过平板电脑、手机等其他终端随时随地收看自己喜欢的电视节目的跨平台收视行为也逐渐成为一种普遍现象。网络的互动性让受众通过博客、微博、贴吧等网络自组织平台个人各种关于影视作品的信息、表达意见与看法。
在全媒体环境下,受众接触媒介行为更加复杂和多样,产生了海量数据,传统收视率调查技术如何对海量数据进行挖掘和分析,如何获取更加全面、精准的收视数据,这是新媒体环境下收视率调查系统面临的严峻压力与挑战。
大数据基础上收视率调查系统构建的可能
大数据带来的不仅是数据量几何级增长还有对分析数据方式、思维与意识的转变,《大数据时代》作者维克托提出了大数据时代处理数据时思维变革方式,即“不是随机样本而是全体数据;不是精确性而是混杂性;不是因果关系而是相关关系”,这些转变为我们认识和理解世界打开了一扇新的大门,赋予了传统收视率调查系统新的力量与可能。
一、测量指标的构建:多样性与标准性。在媒介融合大背景下,收视率调查系统将测量范围由传统的电视媒体扩展到互联网、手机等新媒体平台,通过大数据技术对受众观看视频行为、态度的统计与量化,以弥补传统收视率调查评估的不足。大数据不仅测量监测和分析受众观看视频的行为习惯,而且还将态度和情绪转变为一种可分析的形式,并构建起新的测量指标。
在大数据技术支持下,收视率调查公司可以多维度、综合性地测量网络用户收视行为,各种测量指标、内容则不断出现,试图重新构建一套适合在新媒体环境中电视节目评价标准体系。比如电视剧网络舆情反馈指数构建知名度、关注度、收视度、推荐度、满意度和集中度等六项指标,反映了电视剧在网络上被传统媒体报道数量、网民的评论数量、视频点击量和下载量,更试图测量观众深层次的情感层面。电视节目网络人气评估,建立在传统评估体系注重数量统计的基础上,展开全面的关注意见数据收集,进行更精确的指数计算,采取多维的交叉视角,涉及细化的、多维度的指标,并运用内容分析法和文本分析法等方法,对受众反馈进行深层次分析,通过对网络讨论的内容分析,实现对网民态度和观点的甄别分析。
任何一项指标都要满足客观性、全面性、科学性和可操作性。随着收视率调查公司和数据公司联手对用户收视数据不断挖掘和应用,一些测评数据指标让我们有更多机会全面认识受众的收视行为,但是大量的测评指标出现并没有经过市场和时间的科学检验,技术的不完善也会导致指标出现误差,有些调查公司为了私利也会出现数据和测量指明造假问题。如何在众多测量指标中,选择一些科学、实用被广泛认可与接受的测量指标,还需要市场和管理部门进一步发展、完善和规范。
二、调查市场的构建:一家独大与自由竞争。优势公司垄断调查市场现象普遍,但垄断并不能完全消除竞争,少数调查公司“一家独大”的局面正在遭到业界的“集体”抵制。随着大数据广泛运用以及巨大的潜力,互联网公司、影视制作公司与视频相关行业凭借着资源、资金、技术、人才的软硬件优势加入收视率调查行业,纷纷成立大数据研究中心和部门,抢占收视率调查市场。传统的数据服务公司也迅速转型和升级服务能力,成为互联网、数字电视领域的综合数据服务商,它们迅速掌握实时、海量数据的监测技术,借助以往数据分析模型构建的能力提升构建海量数据挖掘模型的能力,强化自身对海量数据的分析能力,生产和分发多种数据产品,服务业界。更有基于新的社交电视媒体的出现而专门从事社交电视评论信息采集、分析的数据服务公司。④
传统的收视率调查市场被垄断的局面将被打破,每个参与调查的公司与主体,都无法靠一己之力完成对受众认知、心理、行为等多种信息的收集、处理,各调查主体需要通力合作,发挥所长,在合作中竞争,在竞争中合作,共同提升收视率调查体系科学性和可靠性。例如,歌华有线公司与中国传媒大学、央视・索福瑞、尼尔森、秒针系统、新生代全景、中传瑞智等单位均开展了深度技术合作。
在大数据时代,数据作为一个资本与门槛,让越来越多主体参与到收视率调查体系中来,出现了数据存储公司、数据分析公司、数据咨询与服务公司,国内央视-索福瑞公司建立的“一个市场、一种货币”的收视率调查市场体系有望被打破,无论是原有的独家垄断和即将到来的自由竞争的收视率调查体系,都将面临数据报告客观、公正和透明的问题,这需要收视率调查市场建立有效的监督机制,维护良好的市场秩序。
三、测量技术的革新:自动化和人工操作。从收视率调查历史看,收视率测量技术随着时代的需求和科学的发展在不断演进。从早期的电话访问法、日记法、问卷调查法,再到后来的电子仪器法,每种测量方法都各有所长,测量技术的发展总体趋势是自动化和智能化程度越来越高,尽可能减少人为误差,对人工的依赖越来越来越少。
大数据专家预测,在海量数据面前,将来作出决策的将是机器而不是人类自己,单纯依靠人类判断力的时代将被计算机系统所改变甚至取代。收视率调查机构可充分运用计算机数据处理系统,计算和统计出各类视频节目收视率数据。数据挖掘一般要经历业务理解、数据理解、数据准备、建立模型、模型评估、模型等多个步骤。与一般的数据处理技术不同,大数据挖掘针对的是零散的信息――非结构化信息,如网络言论、图片和视频。同时,数据挖掘继承了传统定量研究方法的优势,共同监测受众在新媒体收视行为。例如,北京大学视听传播研究中心采用网络信息抓取加语义分析新技术,实现了节目调查范围的全域化和样本的海量化以及主观分析的软件化、数据化、自动化;以网民和微博用户的意见和评论为中心,实现了节目评估的客观化和市场化。⑤
在我们以大数据技术为收视率调查带来进步的同时,不要盲目陷入技术崇拜和技术依赖症,而忽略人的主观能动性对收视率评估的作用。目前,数据挖掘主要采用的方法如关联算法、聚类算法、机器学习算法等,能否将它们利用在新媒体收视体系的构建中,学界和业界需要开展更深入的研究。我国幅员辽阔、受众成分复杂,传统的以人工操作为主的日记法仍然具有一定的优势和作用,首先日记法费用低廉,无需装设仪器,所需费用较少;其次,许多传统电视受众为非网络用户,无法采集受众收视行为,只能靠日记法作为收视率调查体系必要补充。所以,在收视率调查体系中,为了适应市场变化、满足不同用户需求,调查机构需要采用多种技术测量手段,发挥其各种优势,取长补短,共同完成测量工作。
四、测量服务内容的构建:原有业务与增值服务。在传统收视率调查市场,收视率主要是用于视频节目的评估和广告商投放广告的参考。电视制作机构需要收视率了解受众需求和竞争对手情况,以此作为销售产品的重要依据;广告商需要根据收视率,对电视节目收视情况作出评价,选择性投放广告。
在大数据时代,海量数据催生了收视率调查体系全新的业务范畴,可以提供更多增值和个性化服务,为收视率调查市场构建了新的盈利模式。大数据分析的精确性让电视节目制作方实时、准确了解受众对节目的喜好,深入挖掘受众收视行为,可以随时调整节目策划、节目制作、节目设置与播出计划,提升节目品质和产品的核心竞争力。例如《中国好声音》根据网民互动信息制作了姐妹篇《酷我声音》;视频播出机构也可根据受众在观看过程中留下的播放痕迹和数据创造新价值,爱奇艺公司就推出“绿镜”视频编辑功能,综合分析用户海量视频观看数据,自动判断用户喜好,生成受众关注程度最高的“精华版”视频。
互联网视频公司也会依托大数据,采集和分析用户观看视频偏好,为用户提供智能与个性的视频观看服务指南。优酷土豆每月都将《中国网络视频指数》,根据海量的数据和专业分析,洞察用户行为,解读行业趋势。
目前,在营销广告服务领域,研究机构已推出“购买者收视行为研究”“目标消费者收视分析”等产品,深度分析视频受众消费信息、消费行为,建立完整的视频受众消费行为数据库,为广告评估提供多维分析工具,投放广告更为精准有效,避免了广告重复投放,为商品市场营销提供详细的策略。例如,央视-索福瑞媒介研究有限公司首次联手新浪微博以大数据为桥梁,推出微博收视指数为电视媒体从社会化传播的维度开展节目评估、营销传播,提供标准化分析工具。[本文系国家社科基金项目《基于风险社会视角下中国电视传播的响应机制与应对策略研究》(项目编号:14CXW01);重庆大学教学改革研究项目《基于大数据背景下新闻传播学专业硕士培养模式创新与实践改革研究》(项目编号:2014Y10)的阶段性成果]
(作者单位:重庆大学)
栏目责编:陈道生
注释:
①张树庭:《视网融合时代的电视节目评估》[M],北京:中国广播电视出版社,2012.17。
②何 蔚,吕 沁:《基于大数据理念的电视节目编排管理策略探索》,《电视研究》, 2014(6)。
③小老伍:《收视率造假涉巨大经济利益 霸主央视索福瑞受质疑》,《华夏时报》,2010-07-23。