前言:中文期刊网精心挑选了计算机大数据论文范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机大数据论文范文1
大数据背景下的机器算法
专业
计算机科学与技术
学生姓名
杨宇潇
学号
181719251864
一、 选题的背景、研究现状与意义
为什么大数据分析很重要?大数据分析可帮助组织利用其数据并使用它来识别新的机会。反过来,这将导致更明智的业务移动,更有效的运营,更高的利润和更快乐的客户。
在许多早期的互联网和技术公司的支持下,大数据在2000年代初的数据热潮期间出现。有史以来第一次,软件和硬件功能是消费者产生的大量非结构化信息。搜索引擎,移动设备和工业机械等新技术可提供公司可以处理并持续增长的数据。随着可以收集的天文数据数量的增长,很明显,传统数据技术(例如数据仓库和关系数据库)不适合与大量非结构化数据一起使用。 Apache软件基金会启动了第一个大数据创新项目。最重要的贡献来自Google,Yahoo,Facebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是复杂数据准备和ETL的旗舰,可以为许多数据存储或分析环境提供信息以进行深入分析。 Apache Spark(由加州大学伯克利分校开发)通常用于大容量计算任务。这些任务通常是批处理ETL和ML工作负载,但与Apache Kafka等技术结合使用。
随着数据呈指数级增长,企业必须不断扩展其基础架构以最大化其数据的经济价值。在大数据的早期(大约2008年),Hadoop被大公司首次认可时,维护有用的生产系统非常昂贵且效率低下。要使用大数据,您还需要适当的人员和软件技能,以及用于处理数据和查询速度的硬件。协调所有内容同时运行是一项艰巨的任务,许多大数据项目都将失败。如今,云计算已成为市场瞬息万变的趋势。因为各种规模的公司都可以通过单击几下立即访问复杂的基础架构和技术。在这里,云提供了强大的基础架构,使企业能够胜过现有系统。
二、 拟研究的主要内容(提纲)和预期目标
随着行业中数据量的爆炸性增长,大数据的概念越来越受到关注。 由于大数据的大,复杂和快速变化的性质,许多用于小数据的传统机器学习算法不再适用于大数据环境中的应用程序问题。 因此,在大数据环境下研究机器学习算法已成为学术界和业界的普遍关注。 本文主要讨论和总结用于处理大数据的机器学习算法的研究现状。 另外,由于并行处理是处理大数据的主要方法,因此我们介绍了一些并行算法,介绍了大数据环境中机器学习研究所面临的问题,最后介绍了机器学习的研究趋势,我们的目标就是研究数据量大的情况下算法和模型的关系,同时也会探讨大部分细分行业数据量不大不小的情况下算法的关系。
三、 拟采用的研究方法(思路、技术路线、可行性分析论证等)
1.视觉分析。大数据分析用户包括大数据分析专业人士和一般用户,但是大数据分析的最基本要求是视觉分析。视觉分析直观地介绍了大数据的特征,并像阅读照片的读者一样容易接受。 2.数据挖掘算法。大数据分析的理论中心是数据挖掘算法。不同的数据挖掘算法依赖于不同的数据类型和格式来更科学地表征数据本身。由于它们被全世界的统计学家所公认,因此各种统计方法(称为真值)可以深入到数据中并挖掘公认的值。另一方面是这些数据挖掘算法可以更快地处理大数据。如果该算法需要花费几年时间才能得出结论,那么大数据的价值是未知的。 3.预测分析。大数据分析的最后一个应用领域是预测分析,发现大数据功能,科学地建立模型以及通过模型吸收新数据以预测未来数据。 4.语义引擎。非结构化数据的多样化为数据分析提出了新的挑战。您需要一套工具来分析和调整数据。语义引擎必须设计有足够的人工智能,以主动从数据中提取信息。 5.数据质量和数据管理。大数据分析是数据质量和数据管理的组成部分。高质量的数据和有效的数据管理确保了分析结果在学术研究和商业应用中的可靠性和价值。大数据分析的基础是前五个方面。当然,如果您更深入地研究大数据分析,则还有更多特征,更深入,更专业的大数据分析方法。
四、 论文(设计)的工作进度安排
2020.03.18-2020.03.20 明确论文内容,进行相关论文资料的查找与翻译。2020.04.04-2020.04.27:撰写开题报告 。
2020.04.28-2020.04.30 :设计实验。
2020.05.01-2020.05.07 :开展实验。
2020.05.08-2020.05.15 :准备中期检查。
2020.05.16-2020.05.23:根据中期检查的问题,进一步完善实验2020.05.24-2020.05.28 :完成论文初稿。
2020.05.29-2020.06.26 :论文修改完善。
五、 参考文献(不少于5篇)
1 . 王伟,王珊,杜小勇,覃雄派,王会举.大数据分析——rdbms与mapreduce的竞争与共生 .计算机光盘软件与应用,2012.被引量:273.
2 . 喻国明. 大数据分析下的中国社会舆情:总体态势与结构性特征——基于百度热搜词(2009—2 012)的舆情模型构建.中国人民大学学报,2013.被引量:9. 3 . 李广建,化柏林.大数据分析与情报分析关系辨析.中国图书馆学报,2014.被引量:16.
4 . 王智,于戈,郭朝鹏,张一川,宋杰.大数据分析的分布式molap技术 .软件学报,2014.被引量:6.
5 . 王德文,孙志伟.电力用户侧大数据分析与并行负荷预测 .中国电机工程学报,2015.被引量:19.
6 . 江秀臣,杜修明,严英杰,盛戈皞,陈玉峰 ,郭志红.基于大数据分析的输变电设备状态数据异常检测方法 .中国电机工程学报,2015.被引量:8.
7 . 喻国明. 呼唤“社会最大公约数”:2012年社会舆情运行态势研究——基于百度热搜词的大 数据分析.编辑之友,2013.被引量:4.
六、指导教师意见
签字: 年 月 日
七、学院院长意见及签字
计算机大数据论文范文2
1、计算机人工智能识别技术应用瓶颈探析
2、计算机科学与技术的应用现状与未来趋势
3、计算机信息处理技术在大数据时代背景下的渗透
4、计算机基础课程应用教学思考和感悟
5、中职中药专业计算机应用基础教学改革实践
6、浅谈虚拟现实技术在中职计算机基础教学中应用的必要性
7、计算机图像处理技术在UI设计中的应用
8、计算机生成兵力行为建模发展现状
9、智慧档案馆计算机网络系统方案设计
10、浅谈如何提高计算机网络的安全稳定性
11、计算机应用技术与信息管理的整合探讨
12、计算机科学技术小组合作学习研究
13、计算机科学与技术有效教学策略研究 >>>>>计算机网络和系统病毒及其防范措施毕业论文
14、互联网+背景下高校计算机教学改革的认识
15、艺术类应用型本科高校"计算机基础"课程教学改革研究
16、计算机技术在石油工业中应用的实践与认识
17、计算机技术在电力系统自动化中的应用研究
18、微课在中职计算机基础教学中的应用探析
19、课程思政在计算机基础课程中的探索
20、计算机服务器虚拟化关键技术探析
21、计算机网络工程安全存在问题及其对策研究
22、人工智能在计算机网络技术中的运用
23、慕课在中职计算机应用基础教学中的运用
24、浅析如何提高高校计算机课程教学效率
25、项目教学在计算机基础实训课程中的应用分析
26、高职计算机网络教学中项目式教学的应用
27、计算机信息安全技术在校园网络的实践思考
28、大数据背景下的计算机网络安全现状及优化策略
29、基于计算机网络信息安全及防护对策简析
计算机大数据论文范文3
1计算机网络安全在大数据系统中应用的必要性
1.1大数据系统中网络问题层出不穷
大数据背景下,人们的工作、生活及学习模式发生了很大改变,但人们的网络安全意识有待提高。在人们迫切追求在网络环境中的便捷性体验时,只要忽视了网络安全隐患,就必然会导致大数据系统安全问题层出不穷。在计算机系统配置中,网络软件安全性整体偏低,导致人们的重要信息很容易受到攻击而导致泄露。黑客与病毒的入侵,也恶化了大数据系统中的网络环境。当软件和程序存有漏洞,就很容易遭到病毒入侵。一旦大数据系统网络监管力度不够,网络环境的安全性就更难以保障,导致大数据系统中网络问题接二连三地出现。
1.2计算机网络安全为大数据系统安全提供了无限可能
计算机网络安全,可有效保证大数据系统的稳定安全运行。大数据主要是信息技术下的一种产物,通过储存和处理信息,在大数据系统中俺找人的需求呈现信息,进而为个人与企业发展提供数据依据。在大数据系统中,信息数据是其运行的根本因素,同时信息安全也是计算机网络安全的主要内容,可以说,计算机网络安全是大数据系统安全运行的根基。对计算机用户来说,大数据通过收集个人信息并分析,依据人的喜好来推送相关的数据。一旦这些涉及用户隐私的数据被不法分子非法使用,必然会威胁到计算机用户的根本利益。对企业来说,通过收集企业各项数据并为企业发展提供数据支持,这些数据不免涉及企业的核心机密与市场竞争力,一旦这些数据泄密,必然会对企业造成致命性打击。所以,计算机网络安全,在很大程度上保证了大数据系统安全,对企业与计算机用户信息安全都有着全面保障作用。
2计算机网络安全在大数据系统中的具体应用及改进策略
2.1计算机网络安全在大数据系统中的具体应用
一般来说,计算机网络安全在大数据系统中的应用,应充分认识到大数据系统运行中面临的各种网络安全问题。从预防与解决网络安全问题的角度实现大数据系统的安全运行。确切来说,计算机网络安全在大数据系统中的具体应用,可从数据管理、数据分析、防火墙应用及区块链防篡改技术等说起。计算机网络安全在数据管理中的应用:计算机网络安全在数据管理中的应用,主要是确保数据的完整性与安全性,避免出现数据被黑客与病毒入侵而面临着各种威胁。如在大数据系统中对用户身份进行认证,其数据信息管理时,以设定好的网络ID为主,只要登录时进行网络ID认定,就能避免网络ID被不法分子登录,也杜绝了不法分子毁坏数据及盗取数据的行为。大数据系统中身份认证过程中,以密码和特殊口令的方式来认证,就大大地提高了数据管理的安全性。身份认证技术应用时,能对需要处理的信息加密,当信息一旦被盗用,也无法正确认证身份而使用信息。计算机网络安全在数据管理中的应用,只要面临着黑客攻击,就能全面分析黑客攻击的手段,并充分运用数据信息抵御黑客攻击,全面保护大数据系统中网络环境的安全。计算机网络安全在数据分析中的应用:计算机网络安全可用在数据分析中,用来保护大数据系统的安全性。数据分析通过运用统计手段整合和处理数据,进而提取到有效的数据,在分析和整理后得到相关的结论。大数据系统中,数据分析用以保证数据的安全和完整,并确保数据的可靠性。计算机网络安全技术在数据分析中的应用,在很大程度上提升了数据分析的效率与质量,额保证了数据的准确性。数据分析中应用计算机网络安全技术,应加强大数据系统中的网络安全监管,积极地运用数据挖掘安全技术,全面分析用户日常行为,及时地跟踪和警告可能产生安全风险的操作,并告知用户。防火墙技术、区块链防篡改技术在大数据系统中的应用:计算机网络安全技术在大数据系统中的应用,通过运用防火墙技术和区块链防篡改技术,提高大数据系统网络安全的强度。计算机网络安全的基本保障来源于防火墙技术,几乎每一台计算机都配备了防火墙。计算机网络安全在大数据系统中的应用,通过为计算机网络提供安全保护,把计算机和计算机外网分离开来,分别分析计算机外网传达到计算机本身的相关信息,只要鉴别并确认后,对其进行拦截或者是放行。防火墙技术用于大数据系统中,可起到对病毒隔绝作用。区块链防篡改技术的应用,通过在每个新区块上设置数据指纹,并让每一个区块之间形成一种链条结构,只要区块中的数据被篡改,就会导致下一区块的数据指纹变动,这就无法完成用户身份认证,进而确保数据信息的完整性与保密性。
2.2计算机网络安全在大数据系统中应用的改进策略
计算机网络安全在大数据系统中的应用,应全力解决大数据系统中面临的各种网络安全问题,实现大数据系统中的安全防控。具体来说,计算机网络安全在大数据系统中的应用,可从几点做起:提升网络安全防范意识:大数据环境下,人们使用计算机网络时,只要网络安全意识薄弱,就很容易处于不安全的网络环境中。尤其是青少年和中老年群体,计算机网络防范意识相对薄弱,很容易在网络环境中遇到信息泄密与信息被盗等问题。那么,要想确保大数据环境的安全有效,每个人都应增强自身网络安全意识。社会也要积极地宣传计算机网络安全知识的宣传,以宣传的方式帮助人们提升安全意识,并做好计算机网络防范工作。提倡青少年和中老年群体,在使用计算机网络时,尽可能地把密码设置得更复杂点,起到对计算机网络用户账号的保护作用。加强计算机网络安全人才培养工作,充分发挥出网络安全人才优势,做好网络安全建设,降低计算机网络安全风险率。加强病毒检测防御:在大数据环境下,对计算机安装先进的软件,实时监测计算机网络运行的安全性。如在计算机上安装防火墙和杀毒软件,定期监测和防范病毒,提升计算机网络的安全性,全面保障人们信息的安全。对重要信息进行密钥处理,即便信息被盗也会在没有密钥情况下无法打开。增强计算机网络监管力度:在网络环境中建立网络监管制度,用于提升网络环境的安全度,并尽可能地消除网络环境面临的安全隐患。以法律法规为依据,做好网络安全控制,定期优化和完善网络安全,确保大数据系统的安全运行。因此,计算机网络安全对大数据系统来说至关重要。在大数据系统中应用计算机网络安全技术,应格外重视计算机用户网络安全防范意识的培养,并做好病毒检测防御工作,加强计算机网络监管力度。
计算机大数据论文范文4
关键词:推荐系统;云计算;数据挖掘;个性化
中图分类号:TP393 文献标识码:A DOI:10,3969/J.issn.1003-6970.2013.03.001
本文著录格式:[1]郭平,刘波,沈岳,农业云大数据自组织推送关键技术综述[J].软件,2013,34(3):1-6
0 引言
随着物联网、云计算、下一代互联网等新一代信息技术的快速发展和信息内容的日益增长,“信息过载”问题愈来愈严重,推荐系统(recommender systems)被认为可以有效的缓解此难题,帮助用户从海量数据中发现感兴趣信息,满足个性化需求。
近年来,我国在农业个性化知识服务服务领域从本体论、语义网、知识工程角度开展了广泛的研究,成果主要体现在三个方面:以搜索引擎为代表的知识检索系统,需回答大量预设问题进行知识推理的专家系统,特定领域应用系统,它们在各自的场合都发挥了积极作用。然而知识检索系统不能满足用户个性化需求,专家系统的应用很难普及,特定领域应用开发成本高和重用难度大。物联网与数据挖掘云服务提供知识服务云实现物理世界的“感知控”,知识服务云的研究主要集中在制造和图书情报领域,云环境下的农业个性化知识服务的研究尚处于起步阶段,主要集中在服务模式的构建与展望。
本文是对科技部科技支撑课题“农村农业信息化关键技术集成与示范”(2011BAD21803)与“农村物联网综合信息服务科技工程”(2012BAD35800)研究成果的总结,也是对农业云推荐系统研究的升华。
1 农业云大数据自组织区域推送的提出
1.1 农业信息资源特点
我国自“十一五”时期以来,农业农村信息化发展取得了显著成效,主要表现在农业农村信息化基础设施不断完善、业务应用深入发展、物联网技术在农业中逐步推广应用等方面。从中央到省,市、县建立了“三农”综合信息服务平台,涉农企业、组织和科研院所也积极搭建了各具特色的农业信息服务平台,目前正向乡镇村发展。农村信息员队伍及以农业综合信息服务站和农业合作社为代表的农村信息服务机构发展迅速,“三电合一”、“农民信箱”、“农村热线”等信息服务模式应用深入。云计算利用海量的存储能力把农业信息资源形成高度集成和虚拟化的计算资源一“农业知识聚合云”,支持用户在任意位置、使用各种终端方便获取信息,但由于农业领域生态区域性和过程复杂性及农业区域发展不平衡和农民文化的多层次性也带来了“信息过载”、“资源隐晦”“资源迷向”等问题。
1.2 农业云环境下大数据自组织区域推送
物联网和云计算背后是大数据,在云计算模式下,用户不确定的、智能的交互,个性化需求更加多元化,信息交互行为更加频繁;在大量用户通过社会标注达成共识的过程中,逐渐形成不同社区,涌现出群体智能,形成“农业用户兴趣社交云”。利用云的海量存储、群体涌现智能、强大的计算能力和物联网感知控优势,可以提供面向用户复杂分析计算,实现业务重点由面向应用和资源的传统信息服务,转变为基于对海量农业知识进行动态划分,有目的、主动、定制、自组织推送给有需求的农业用户,为农业用户提供实时性、个性化知识服务,指导农业生产过程。
首先以Hadoop+MapReduce+HBaSe分布式框架为处理平台,对“农业用户兴趣社交云”,融合用户兴趣偏好和社交网络进行建模,将这些多元用户信息充分融入推送系统会更好产生推荐结果;将推荐对象“农业知识聚合云”按农业知识高维性、多样性、多层次性特征分类聚类为各种知识块静态和动态元数据;通过智能算法推荐和社会网络推荐为用户发现个性化内容;根据用户的地理位置、用户服务的评价以及云基础服务提供商信息将预测值最高的服务推送给用户实现与物理世界的互动(如图1)。
从以上分析可知,农业云大数据自组织区域推送的关键技术有用户兴趣模型、推荐对象模型,推荐算法、数据挖掘四个部分,以下分别对这几项技术进行论述。
1.2.1 用户兴趣模型
用户兴趣建模是个性化服务技术的基础和核心,包括数据收集、模型表示、模型学习与模型更新。用户兴趣建模的方法有很多,常用的有向量空间模型、神经网络、遗传算法、用户一项目评价矩阵、基于案例的表示、基于本体论的表示、基于加权关键词的表示,基于社会网络的表示等。几乎每种表示形式都是以一种私有形式进行知识表示,此外一些表示技术还依赖于模型学习,如广泛使用的基于向量空间模型的表示与TF-IDF学习技术联系在一起。表示形式的私有性和对学习技术的依赖性阻碍了用户模型在系统间的共享,这种共享对于减少用户建模工作量,提高推荐算法启动效率具有重要意义。因此开发独立于模型学习技术的通用用户模型表示技术是目前研究中热点,基于语义网和社交网络的用户模型在这方面表现了优势。
用户的兴趣或需求会随时间、情景发生变化,结合长期和短期兴趣及兴趣的变化用户兴趣建模的重点,目前的更新机制很难及时跟踪用户兴趣的变化,有更好的学习效率和动态变化适应能力的建模是未来的重要研究方向,国内外大量的文献对此展开了研究,遗忘函数、时间窗、用户兴趣的漂移特性等被提出。
在湖南农业云中,基于呼叫中心、互联网,手机报、手机短信,电视广播等用户在多应用系统中形成的兴趣偏好和社交网络特征,提出“农业用户兴趣社交云”建模思路:以图论模型表示用户“兴趣图”数据和“社交图”数据,根据经典的局域世界演化理论,综合考虑实际情况中用户之间的多重关系和关系的强弱程度,以用户之间相似度为节点连接概率因素,生成动态多维网络,进行用户数据的挖掘和更新;结合农业本体,在多维社交网络的基础上,将基于农业本体的区域用户兴趣融合在云计算平台上进行处理。
1.2.2 推荐对象模型
推荐本质上是将推荐对象的特征与用户的兴趣偏好进行推荐计算,所以推荐对象的描述和用户的描述密切相关。推荐系统应用不同领域,它推荐的对象也就各不相同,目前,湖南农业云主要是文本性数据;不同的对象,特征也不相同,目前没有一个统一的标准来进行统一描述,主要有基于内容、分类、聚类的方法。
基于内容的方法是从对象本身抽取信息表示对象,常见的是向量空间模型,使用最广泛的是加权关键词矢量方法进行特征选取,使用TFIDF计算每个特征的权值。向量空间模型对模型中的特征词进行权重估计(TF-IDF)过程中不考虑特征词之间的相关性,直接用特征词作为维度构建文档向量,降低了文档向量对文档概念表达的准确性以及对不同类型文档的区分能力。
基于分类的方法是把推荐对象放入不同类别,把同类文档推荐给对该类文档感兴趣的用户。主要有两种,一种是基于知识工程的方法,使专家的类别知识直接编码为分类规则,正确率和召回率高,但工作量大;近期研究最多的是另一种一机器学习,根据训练样本集建立分类器,方法有很多,常见的有概率分类、贝叶斯回归分析、决策树分类器、决策规则分类器、Rocchio分类器、神经网络分类器、支持向量机(SVM)、分类器融合、Boosting分类器、k最近邻方法(KNN)等。
研究文本聚类的最初目的是为了提高信息检索的查全率和查准率,近年来,文本聚类用于自动产生文本的多层次的类,并利用这些新生成的类对新文本进行效率较好的归类,已经提出了大量的文本聚类算法。传统的聚类算法在处理高维和海量文本时效率不很理想。针对这样的问题,将聚类分析与计算智能理论,并行计算、云计算等相结合,设计出高效的并行聚类算法,己经成为一个比较流行的研究思路。
在湖南农业知识云数据模型中,将能更好反映特征词相关性的超图模型引入,将文档中提取的特征项表示为图中节点,特征词条之间的关系构成图中边,用边上权值表示相关联特征项之间共现程度。通过对文本图模型K最近邻划分实现降维降噪的粗粒度数据切片;对切片后数据反映用户兴趣如地域、时间、诉求等多维度特征的智能聚类,实现细粒度的聚合与分割。
“农业知识聚合云”模型算法建立在基于MapReduce处理的大规模图上,得到各种知识块静态和动态元数据。
1.2.3 推荐算法
推荐算法是整个推荐系统中核心部分,大量的论文和著作都关注了这个方面。目前,基本包括以下几种:基于内容过滤推荐、协同过滤推荐、基于关联推荐、基于知识推荐、基于效用推荐、基于网络结构推荐、基于聚类推荐、基于社会网络分析推荐、混合型推荐等。通过对众多推荐算法进行比较分析,各种算法都有优缺点(如表1):
各种推荐方法都有各自的优缺点,在实际问题中采用多种策略进行混合推荐,主要有两种混合思路:推荐结果混合和推荐算法混合。目前大部分的推荐算法都是混合推荐算法,主要还是以协同理论为核心,再配合其他算法的优点或交叉学科的理论来改善推荐的质量。另外基于社会网络个性化推荐算法研究是一个趋势,基于社会网络的推荐是协同过滤的延伸,通过考察结点之间(用户和用户之间或产品之间)的相关性和结点之间的信任度可以获得比一般协同推荐更高推荐效果,如文献提出将社会网络关系结合到推荐算法中。纵观国内外在推荐算法上的研究,主要集中在基于用户显性评分数据的协同过滤算法上,对基于非显性评分行为数据场景下的研究却显得有点不足。目前在扩展性问题上学术研究不是很具有针对性,主要集中在通过各种交叉学科中的方法来对用户进行聚类或对行为数据进行降维、压缩等缩短推荐的项目集或减少计算量,从而提升算法的性能;有关基于云平台上的推荐算法研究目前主要集中于协同过滤算法MapReduce化。而实际应用中,己出现利用分布式集群解决算法扩展性方法,如Google News的推荐算法就是部署在分布式环境下,从而满足海量数据下的推荐服务。
根据农业云大数据自组织区域推送实际情况将推荐结果和推荐算法混合,提出“三层推荐”策略:在丰富的知识块云元数据基础上,将知识块属性和用户兴趣行为基于频繁模式的知识关联撮合推荐;通过复杂网络聚类算法识别一个用户多个社区兴趣,融合“兴趣图”和“社交图”协同过滤推荐,突破算法推荐的局限性,让用户信任的朋友圈子为其发现和推荐内容,取得社交推荐的时效性和算法推荐的长尾性之间的互补,从而针对每个社区成员提供精准个性化推荐;根据基础设施服务供应商、用户所在的地理位置以及用户对服务可用性评价值的相似性等,将大量用户云终端聚类为一定数量的社区,提高云端推送服务的有效性,最终形成通过大众参与,支持云间变换,集电信网、广播电视网、互联网合一的自组织区域推送,较有效地处理一般推荐算法中存在的稀疏性、冷启动以及大规模实时计算的问题。
1.2.4 云计算下个性化数据挖掘
数据挖掘采用了多种领域中的思想,包括来自统计学的抽样、估计、假设检验以及人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。随着数据挖掘的不断发展,也采用了包括最优化、进化计算、信息论、信号处理、可视化、信息检索、云计算、并行计算等技术。与传统的数据挖掘相比,云计算下的个性化数据挖掘的目标,就是通过云计算中心,向用户提供针对其即时演化需求的数据挖掘SaaS(Software as aService,软件即服务)服务,其基础问题主要为:对于用户不同的数据挖掘需求以及针对用户特点进行个性推荐的建模和表征;数据挖掘算法适应云计算的并行分布式化;使数据挖掘的结果和算法能够支持云间变换并形成一种面向用户、即时组合的、变粒度的云服务,其中数据挖掘的云服务化是研究的难点。
(1)云计算下个性推荐的建模和表征
云下的个性推荐建模和表征与传统上个性化推荐明显的不同在于海量异构大数据和用户间群体涌现的社交网络,它们本质上形成了多个顶点的大规模图。云计算可以为大规模个性化提供技术支撑,云服务本身也有大规模个性化定制应用需求,目前研究两者结合的文献还很少,张泽华从计算资源的角度基于复杂系统理论对云计算联盟体系结构进行建模,并基于蚁群优化算法和复杂系统理论进行了负载均衡研究;郭昱就有效处理客户需求信息该如何选择与分布云计算平台中的关键节点问题,提出了基于云计算的大规模定制客户需求模型。赵东杰对复杂网络、数据挖掘与群体智能有效结合进行了探索研究。农业云大数据自组织推送通过“农业知识聚合云”分解的静态、动态知识元数据和“农业用户兴趣社交云”形成的兴趣图、社交图基于用户行为和知识元数据的关联撮合,通过人工智能和社交圈子帮助用户发现内容,实现搜索和推荐的无缝结合,为智能个性化推荐实现“内容找人”愿景。
(2)算法并行分布式与高性能计算
对于大规模数据的处理,典型系统结构大致分为三类:基于MapReduce模型的分布式并行处理系统、基于BSP模型的分布式并行处理系统和分布式图数据库系统。数据挖掘算法现在的发展趋势是基于云计算的并行数据挖掘,它的同一个算法可以分布在多个节点上,多个算法之间是并行的,多个资源实行按需分配,而且分布式计算模型采用云计算模式,数据用DFS或者HBASE,编程模式采用MapReduce这种方式。Bhaduri等整理了一个十分详尽的并行数据挖掘算法文献目录,包含了关联规则学习、分类、聚类、流数据挖掘四大类分布式数据挖掘算法,同时还包括分布式系统、隐私保护等相关的研究工作。
2 基于云计算推荐系统研究的重点、难点与热点
2.1 云环境下用户偏好获取安全与可信问题
推荐系统中,用户数据集的数量和质量问题,影响用户模型的精确度、可用性,导致问题的根本原因在于用户对隐私和安全的考虑。而云环境下,数据的安全与隐私是用户非常关心的问题。既能得到准确用户信息而提高推荐系统性能,又能有效保护用户信息同时检测并能预防推荐攻击(一些不法的用户为了提高或降低某些对象的推荐概率,恶意捏造用户评分数据而达到目的)将是未来推荐系统的一个重要研究方向。
2.2 模型过拟合问题
过拟合现象是指系统推荐给用户的对象与用户刚刚看过的不是太相似或者太不相关。过拟合(过学习)的问题本质上来自于数据的不完备性,这在实际应用中是无法完全避免的。在于兴趣偏好获取方式或隐私等原因使用户没有对足够多类别的对象进行评价。目前解决的主要方法是引入随机性,使推荐算法收敛到全局最优或者逼近全局最优,关于既要保证推荐的多样性,又不能与用户看过的对象重复或毫不相关这一问题的研究是推荐系统研究的一个难点和重点。
2.3 稀疏性与冷启动问题
稀疏性和冷启动问题困扰推荐系统很长时间了,前者的解决办法主要过滤和降维。目前针对冷启动问题提出了一些解决方法,主要分为两大方面,一是直接利用传统协同过滤的评分数据结合特定的方法进行解决,二是新用户或新项目的内容属性信息与传统的协同过滤评分数据相结合的方法进行改善冷启动问题。稀疏性与冷启动问题一直是推荐系统研究的一个难点和重点。
2.4 数据挖掘的结果和算法智能服务化
将数据挖掘算法融入针对海量用户的使用记录和计算资源间协作进行优化组合,利用这些特性通过大众参与的交互作用,提高云间服务的智能性、有效性将是大数据时代推荐系统研究的一个制高点。将数据挖掘任务及其实现算法服务化,通过SaaS方式向云计算中心索取所需的相应的数据挖掘,这可能是目前突破数据挖掘专用软件使用门槛过高、普通大众难以触及、企业用户使用成本太大、挖掘算法和结果难以实时得到评价和相应修改等问题的最有希望的解决方案之一,也是数据挖掘走向互联网大众、走向实用化的重要的一步。
2.5 大数据处理与增量计算问题
目前对大数据的研究仍处于一个非常初步的阶段,半结构化和非结构化数据给传统的数据分析带来巨大挑战,尤其算法如何快速高效地处理推荐系统海量和稀疏的数据成为迫在眉睫的问题。当产生新的数据时,算法的结果不需要在整个数据集上重新进行计算,而只需考虑增量部分,对原有的结果进行微调,快速得到准确的新结果,是增量计算的理想状态。但一般而言,随着信息量的增多,算法的误差会累积变大,最终每过一段时间还是需要利用全局数据重新进行计算。一个特别困难的挑战是如何设计一种能够保证其误差不会累积的算法,也就是说其结果与利用全部数据重新计算的结果之间的差异不会单调上升,要达到这种程度,还有很长的路要走。
结束语:
随着新一代信息技术的快速发展和信息内容的日益增长,搭载在云计算平台的自组织区域推送具有它天然的优势:云的海量存储使得推荐系统能有效获取训练数据;云的分布式计算能力提供了较高的响应能力;海量用户的使用记录和计算资源问大众参与的交互涌现,最终形成自组织优化组合的智能个性化云推送。因此,农业云自组织区域推送具有重要的研究意义和广阔的应用前景,对云环境下其他领域的个性化推送应用具有借鉴意义,但目前存在大量问题需要进行深入细致的研究。
参考文献
[1]孟祥武,胡勋,王立才,张玉洁,移动推荐系统及其应用[J],软件学报,2013,24(1):91-108
[2]杨涛,基于本体的农业领域知识服务若干关键技术研究[D],上海:复旦大学计算机科学技术学院博士论文,2011,1-50
[3]杨晓蓉,分布式农业科技信息共享关键技术研究与应用[D],北京:中国农业科学院博士学位论文,2011,3-35
[4]赵春江,农业智能系统[M],北京:科学出版社,2009,1-210,
[5]何清,物联网与数据挖掘云服务[J],智能系统学报,2012,7(3):1-5,
[6]黄卫东,于瑞强,共享学习模式下知识服务云平台的构建研究[J],电信科学,2011,12:6-11
[7]丁静,杨善林,罗贺,丁帅,云计算环境下的数据挖掘服务模式[J],计算机科学,2012,39(6):217-219,237
[8]邓仲华,钱剑红,陆颖隽,国内图书情报领域云计算研究分析[J],信息资源管理学报,2012,2:10-16
[9]胡安瑞,张霖,陶飞,罗永亮,基于知识的云制造资源服务管理[J]同济大学学报(自然科学版),2012,40(7):1093-1101
[10]程功勋,刘丽兰,林智奇,俞涛,面向用户偏好的智能云服务平台研究[J],中国机械工程,2012,23(11):1318-1323,1336
[11]刘波,方逵,沈岳,可重构的农业知识服务模式研究[J]农机化研究,2011,36(11):66-70
[12]赵星,廖桂平,史晓慧,陈诚,李文圃,物联网与云计算环境下的农业信息服务模式构建[J],农机化研究,2012,4:142-147
[13]郭永田,中国农业农村信息化发展成效与展望[J],电子政务,2012,02-03:99-106
[14]李道亮,中国农业农村信息化发展报告(2011)[M],北京:电子工业出版,2012,87-150
[15]钱平,郑业鲁,农业木体论研究与应用[M],北京:中国农业科学技术出版社,2006,1-100
[16]吴丽花,刘鲁,个性化推荐系统用户建模技术综述[J],情报学报,2006,25(2):55-62
[17]李珊,个性化服务中用户兴趣建模与更新研究[J],情报学报,2010,29(1):67-71
[18]王国霞,刘贺平,个性化推荐系统综述[J],计算机工程与应用,2012,48(7):66-76
[19]王巧容,赵海燕,曹健,个性化服务中的用户建模技术[J],小型微型计算机系统,2011,32(1):39-46
软件杂志欢迎推荐投稿:http:///
[20]张华清,动态多维社会网络中个性化推荐方法研究[D],济南:山东师范大学硕士学位论文,2012,16-31
[21]丹,面向跨系统个性化服务的用户建模方法研究[J]_情报杂志,2012,31(6):156-161
[22]邓夏玮,基于社交网络的用户行为研究[D],北京:北京交通大学硕士学位论文,2012,4-43
[23]马尧,基于多维用户特征建模的个性化社交搜索引擎的设计与实现[D],广州:华南理工大学硕士学位论文,2012,12-55
[24]陈恩红,徐童,田继雷,杨禹,移动情景感知的个性化推荐技术[J],中国计算机学会通讯,2013,9(3):19-24
[25]Jong Hwa Kima,b,,Hyun JoonLeeb,Extraction of user profile based on workflow and information flow[J],Expert Systems with Applications,2012,39(5):5478-5487
[26]南智敏,钱松荣,引入漂移特性的用户兴趣模型优化研究[J],微型电脑应用,2012,28(3):30-32
[27]郭新明,弋改珍,混合模型的用户兴趣漂移算法[J],智能系统学报,2010,5(2):181-184
[28]程显毅,朱倩,文本挖掘原理[M],北京:科学出版社,2010,9-45 [29]李涛,推荐系统中若干关键问题研究[D],南京:南京航空航天大学博士学位论文,2009,31-80
[30]姜伦,模糊聚类算法及其在中文文本聚类中的研究与实现[D],哈尔滨:哈尔滨理工大学硕士学位论文,2010,18-48
[31]冯汝伟,谢强,丁秋林,基于文本聚类与分布式Lucene的知识检索[J],计算机应用,2013,33(1):186-188
[32]陶红,周永梅,高尚,一种基于语义相似度的群智能文本聚类的新方法[J]计算机应用研究,2012,29(2):482-532
[33]孟海东,刘小荣,基于聚类分析的图模型文档分类[J]计算机应用与软件,2012,29(1):117-174,229
[34]饶君,张仁波,东呈晓,吴斌,基于MapReduce的大规模图挖掘并行计算模型[J],应用科技,2012,39(3):56-60
[35]于戈,谷峪,鲍玉斌,王志刚,云计算环境下的大规模图数据处理技术[J],计算机学报,2011,34(10):1753-1767
[36]吕善国,吴效葵,曹义亲,基于网络结构的推荐算法[J]_实验室研究与探索,2012,31(7):278-280,368
[37]周佳,罗铁坚,一种基于内容关联的学术资源协同推荐算法[J],中国科学院研究生院学报,2013,30(1):117-123
[38]唐晓波,张昭,基于混合图的在线社交网络个性化推荐系统研究[J]情报理论与实践,2013,36(2):91-95
[39]王立才,孟祥武,张玉洁,上下文感知推荐系统[J],软件学报,2012,23(1):1-20
[40]刘建国,周涛,汪秉宏,个性化推荐系统的研究进展[J],自然科学通报,2009,19(1):1-15
[41]许海玲,吴潇,李晓东,阎保平,互联网推荐系统比较研究[J]软件学报,2009,20(2):350-362
[42]孙冬婷,何涛,张福海,推荐系统中的冷启动问题研究综述[J],计算机与现代化,2012,5:59-63
[43]张亮,基于聚类技术的推荐算法研究[D],成都:电子科技大学硕士学位论文,2012,7-18
[44]Liu, F.,Lee, H.J. Use of social network information to enhance collaborative filterinperformance.Expert[J] Systems with Applications. 2010, 37(7):4772-4778.
[45]Jiang, J., Lu, J., Zhang, G., Long, G. Scaling- Up Item-Based CollaborativeFiltering Recommendation Algorithm Based on Hadoop[C].2011 IEEE World Congress onServices.IEEE[A]. 2011, 490-497.
[46]周源,基于云计算的推荐算法研究[D],成都:电子科技大学硕士学位论文,2012,26-64
[47]吕雪骥,基于云计算平台的智能推荐系统研究[D],合肥:安徽大学硕士学位论文,2012,25-43
[48]刘晨,改进的聚类挖掘算法对网络自助出版“长尾”文本的推荐应用[D],上海:复旦大学硕士学位论文,2011,10-19
[49]陈桂生,张海粟,刘玉超,云计算下的个性化数据挖掘服务[EB/OL],[2011-2-28]中国人工智能学会通讯,http://www,/contents/50/119,html
[50]张泽华,云计算联盟建模及实现的关键技术研究[D],昆明:云南大学博士学位论文,2012,26-114
[51]郭昱,吴清烈,基于云计算的大规模定制客户需求响应模型及其节点的选择与分布[J],系统工程理论与实践,2011,31(增刊2):1-6
[52]赵东杰,张海粟,韩言妮,杨海涛,何宇,基于网络化数据挖掘的群体智能研究方法[C],Proceedings of 2010 The 3rdInternational Conference on Computational Intelligence andIndustrial Application(Volume 9).IEEE[A].2010,239-243.
[53]AnandRajaraman,Jeffrey David Ullman著,王斌译,互联网大规模数据挖掘与分布式处理[M],北京:人民邮电出版社,2012,1-253
[54]Bhaduri K, Das K, Liu Kun, et al. Distributed data mining bibliography[EB/OL]. [2011-01-03]. http:// cs. umbc. edu/~hillol/DDMBIB/
[55]杨健,汪海航,王剑,俞定国,云计算安全问题研究综述[J],小型微型计算机系统,2012,33(3):472-479
计算机大数据论文范文5
统计与大数据系按照教务处“2021届毕业生实习及毕业论文(设计)相关事宜通知”,结合2018级人才培养方案,制定2021届学生毕业论文(设计)指导方案,具体内容包括以下6部分:
一、2021届毕业论文指导教师分配表(详见附件1)
二、 毕业论文写作与指导的具体安排
论文辅导时间:2020年10月1日至2021年4月1日
具体安排:
工作安排
具体内容
具体要求
截止时间
选题
确定论文题目
根据自己的专业、结合实习情况,以项目为基础选择论文题目,并经指导教师审核通过。
2021年1月1日
提纲
构思论文结构、拟订论文提纲
结合企业实践内容确定论文结构列出提纲。
2021年2月1日
写作与批改
初稿
按照论文提纲撰写初稿,主动与论文指导老师联系审核与批改。
2021年3月1日
二稿
按照论文指导老师的要求反复修改、完善、补充。
2021年4月1日
定稿
达到论文基本要求,定稿电子版发给论文指导老师。
2021年4月10日
交稿
打印提交
双面打印,毕业返校时以班级为单位提交。
2021年6月
三、 指导教师联系方式
姓名
职称
邮箱
电话
方党生
副教授
2541790217@qq.com
2541790217
15136166829
杨冬梅
讲师
339097597@qq.com
339097597
18625779090
李春花
讲师
19772728@qq.com
19772728
18638793098
魏瑶
讲师
43665723@qq.com
43665723
15838313791
马杰
高级讲师
Hnhymj@126.com
13838067063
杜旭阳
助理讲师
604696049@qq.com
604696049
17396370961
高艳云
副教授
37742562@qq.com
37742562
13939020929
钱钰
讲师
397019111@qq.com
397019111
15093132377
梁慧丹
助理讲师
1620280267@qq.com
1620280267
15188395423
秦航琪
助理讲师
1191084277@qq.com
1191084277
15670930099
范迪
助理讲师
1261810070@qq.com
1261810070
18339270887
四、毕业论文参考题目
大数据技术及应用专业
1) 大数据时代下的网络信息安全
2) 大数据对市场调查技术与研究方法的影响
3) 大数据环境下社会舆情分析方法研究
4) 大数据在房屋租赁的应用
5) 大数据在互联网金融领域的应用
6) 大数据在电子商务下的应用
7) 大数据时代下线上餐饮变革
8) 大数据在养殖业中的应用
9) 大数据对商业模式影响
10) 大数据在智能交通中的应用
11) 基于大数据小微金融
12) 大数据在农副产品中的应用
13) 大数据在用户行为分析中的应用
14) 基于大数据的会员价值分析
15) 大数据对教育模式的影响
物联网应用技术专业
1)物联网技术在蔬菜大棚中的应用
2)物联网技术对智能家居的应用
3) 物联网技术对智能物流监管的应用
4) 物联网技术在企业的应用
5) 计算机物联网技术带来的影响
6) 物联网技术在校园安全的应用
7) 浅谈物联网技术的应用与发展
8) 物联网技术在企业的应用
9) 计算机物联网技术在各个行业的应用
10) 物联网技术在食品安全追溯方面的应用
11)物联网技术在楼宇智能化系统的应用
12)物联网技术在智能停车场系统的应用
13)物联网技术在安保行业的应用
14)物联网技术在智能交通行业的应用
15)基于物联网技术的校园宿舍安防系统的设计与实现
信息统计与分析专业
1) 某企业竞争力调查分析
2) 浅谈企业统计数据质量
3) 人口素质与经济增长的关系研究
4) 地区竞争力初步分析
5) 农业结构调整与粮食安全保证问题研究
6) 我国中小企业发展现状与对策
7) 对某市房地产开发的市场分析
8) 消费者购买动机调查分析
9) 某产品市场需求调查
10) 某产品销售预测
11) 某产品销售统计分析
12) 某产品竞争力分析
13) 产业结构变动分析
14) 大数据发展对统计工作的影响分析
15) 郑州租房状况分析
五、毕业论文(设计)格式规范要求(详见附件2)
六、毕业论文(设计)格式模板(详见附件3)
附件1:2021届毕业论文指导教师分配表
附件2
河南信息统计职业学院
毕业论文格式及规范要求
河南信息统计职业学院毕业论文(设计)统一的规格要求如下:
(一)开本
A4白纸(210mm×297mm)
(二)装订
长边左侧装订
(三)全文编置
1.页码
全文页码自正文起编列,正文与附录可连续编码。页码以阿拉伯数字左右加圆点标示,置页边下脚中间。
2.边距
正文至附录的文字版面规范为:天头25mm;地脚25mm;左边距30mm;右边距25mm。上述边距的允许误差均为±1mm。
3.行字间距
正文至附录的行字间距按5mm设置;字间距为1mm,或由Word自动默认。
(四)编排构成
1.前置部分
(1)封面设置
第一排:“河南信息统计职业学院”,华文行楷一号字,居中排列,第一排前空两行(三号字);
第二排:“毕业论文(设计)”,黑体一号字,居中排列;
第三排:“ 级 专业 班”, 黑体三号字,居中排列,横线空格处填写相应内容,填写内容使用宋体三号字,与第二排空二行(三号字);
第四排:“题目 ” 黑体三号字,居中排列,“题目”两字中间留两个汉字的空位,横线空格处填写相应内容,填写内容使用宋体三号字,与第三排空六行(三号字);
第五排:“姓名 学号 ”, 黑体三号字,居中排列,“姓名“两字中间留两个汉字的空位,横线空格处填写相应内容,填写内容使用宋体三号字;
第六排:“指导教师 职称 ”, 黑体三号字,居中排列,横线空格处填写相应内容,填写内容使用宋体三号字;
第七排:“系别 ” 黑体三号字,居中排列,横线空格处填写相应内容,填写内容使用宋体三号字,与第六排空两行(三号字)。
第八排:“ 年 月 日” 黑体三号字,居中排列,横线空格处填写相应内容,填写内容使用宋体三号字,与第七排空两行(三号字)。
(2)声明
本人必须声明所呈交的论文是学生本人在导师的指导下独立完成的。除了文别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果。要求学生本人签名。
(3)内容提要
第二页为内容提要。内容提要是对全文基本观点的集中提炼和说明。提要中应阐明本论文(设计)要解决的主要问题及其依据,并指出创新之处。内容提要以300-500字为宜。其中“内容提要”为黑体三号字,每字间空一格,居中排列。“内容提要”下空一行编排具体内容,具体内容按照中文文章格式排列,使用宋体四号字。
(3)关键词
关键词是揭示文献主体信息的词汇。关键词在内容提要之后空一行设置。其中“关键词”三字用黑体三号字与“内容提要”对应居中排列,而后另起行设置关键词3-5个,用宋体四号字。各词汇间不用标点符号分隔,空一格汉字字符。
(4)目录页
“目录”二字用三号加黑宋居中排列,字间空三格;“目录”下空一行排全文的主要标题,用四号仿宋体。对目录中的每一个标题都要标注页码。
2.正文部分
一部完整的毕业论文(设计)正文部分一般应由以下要素构成:论文正文文字;结论;注释;参考文献。
(1)正文文字
论文(设计)的正文文字在署名后空一行排列,用四号仿宋字体打印。
(2)结论
毕业设计的体会和总结;该设计的结论、优点及有待探讨的问题。
(3)注释
注释是用于对文内某一特定内容作必要的解释或文字说明。注释的内容置于与当前页主题文字的分线以下,以带圆圈的阿拉伯数字标示,左空二格排列,用小五号宋体字。
(4)参考文献
参考文献是作者著文时研究和参阅的相关资料。“参考文献”四个字用三号黑体字左顶格标示。参考文献的内容置于主体文字之后空一行排列,其顺序与主体文字中的序号编排相对应,以带方括号的阿拉伯数字左顶格用五号宋体字排出全部内容。参考文献要列出书名,作者姓名、出版社及出版日期、并标明序号。在论文中引用所列的参考文献时,只要在方括号内注明所列文献的序号即可。
(5)毕业论文(设计)正文部分3000~5000字。
附件3
河南信息统计职业学院
毕业论文(设计)
级 专业 班
题 目
姓 名 学号
指导教师 职称
系 别
20 年 月 日
声 明
本人郑重声明所呈交的论文(设计)是我个人在导师的指导下独立完成的。除了文别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果。
论文作者签名:
20 年 月
日
内 容 提 要
××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
关键词 :××××× ××××× ××××× ×××××
目 录 1 前言 1
1.1 1
1.2 1
1.3 4
1.4 4
2 5
2.1 5
2.2 5
2.2.1 5
2.2.2 6
2.3 7
3 8
3.1 9
3.2 10
4 11
4.1 12
4.1.1 13
4.1.2 14
4.1.3 15
4.1.4 18
4.1.5 20
5 结论 22
5.1 结论 23
5.2 问题与不足 26
5.3 未来展望 27
参考文献 28
1 ×××××××××××××××× 1.1 ×××××××××× ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
1.2 ×××××××××××××××× 1.2.1 ×××××××× ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
参考文献 [1] 江正荣编.地基与基础施工手册.北京:中国建筑工业出版社,1997
[2] 高大钊主编.土力学与基础工程.北京:中国建筑工业出版社,1998
………………………………………………………………………………………………………………………………………………………………………………
[8] 赵玉良.房屋地基基础变形事故原因分析及处理.河北建筑工程学院学报,2007,25(2)
[9] 袁迎曙,贾福萍,蔡跃. 锈蚀钢筋混凝土梁的结构性能退化模型[J].土木工程学报,2001,(3)
[10] A. Castel, R. Francois, G.Arliguie. Mechanical Behavior of Reinforced Concrete Beams-Part 2: Bond andNotch Effects[J]. Materials and Structures. 2000, (3)
…………………………………………………………………………………………………………………………………………………………………………………………
[12] 中华人民共和国国家标准.建筑地基基础设计规范(GB50007-2002)
[13] 中华人民共和国国家标准.建筑边坡工程技术规范(GB50330-2002).
论文(设计)指导评语
建议论文成绩 指导教师
20 年 月 日
论文(设计)答辩评语
论文成绩 答辩组组长
20 年 月 日
答 辩 组 成 员
姓 名
性别
年龄
职称
工作单位
计算机大数据论文范文6
关键词:计算机网络专业;毕业综合实践;教学改革
1 高职信息化教学改革概述
随着云计算技术的深入应用,大数据产品已深入我国高职院校的信息化教学改革中。如开展精品在线课程、提升微课的教学质量、在线教学培训与学习,一定程度上提升了高职院校教学管理与教学设计能力。作为计算机网络技术专业,如何通过大数据时代背景为课程提升有益价值,在高职院校信息专业的就业质量、专业对口率方面起到优化和辅助作用,是当前浙江省各高校的毕业综合实践的教学改革重点之一[1]。
信息专业的毕业综合实践课程主要包括:校外实习阶段和校内毕业论文答辩阶段,其中校外实习阶段的教学工作主要包括学生实习基地走访调研、实习周记批复。这一课程的主要特点包括:开课周期长,课程规模较课堂教学大,教学管理系统工作负担重,课程考核复杂度高。同时,学生学习和实习压力较大。
大数据作为一种覆盖广、规模宏大、能够实现实时获取、存储、管理、分析等方面功能的数据集合,其主要意义在于专业化处理教学实践相关的数据[2]。以互联网+为背景,根据大数据相关结果,可以较快地获取多届毕业生的毕业实习情况、存储应届毕业生实习相关数据、管理应届毕业生的毕业论文(设计)和实习周记等、通过多届毕业生的毕业跟踪调查报告分析人才培养方案的可行性并加以丰富和调整。以嘉兴职业技术学院为例,从浙江省2012―2014年的高院校的毕业就业率相关数据结果看,就业率和专业对口率呈现递增趋势,但是专业对口率数据连续在40%以下;在就业率方面,截至2014年计算机网络技术专业出现了下滑趋势,图像处理专业和电子商务专业呈现略微上调趋势,软件技术专业呈现持平;在专业对口率方面,4个子专业表现不甚明显;在实践教学满意度方面,截至2014年实践教学满意度普遍呈现出先下降后上升的趋势,这主要源于在2014年信息专业通过改革毕业综合实践教学模式后的首轮效果。
2 毕业综合实践课程现状
2.1 高就业率低专业对口率
随着信息技术的在我国各高校的深入应用,各高职院校均开设了信息相关专业。信息专业毕业生的就业情况良好,但是专业对口的却很少。结果如表1所示。
从有关部门的调查结果可知,信息专业人才的需求量非常大,包括网络招聘、社会招聘、校园招聘,虽然信息专业毕业生的就业情况较其他传统行业有明显的优势,但是专业对口率增长仍然不明显[4]。通过为期3年的实习调研走访和多处室研讨,分析学生高就业率和低专业对口率的主要原因大致上源于:
(1)学生择业观的改变,当代高职毕业学生大多为独生子女,异地求学的学生大多数选择毕业后返城求职,一定程度冲击了专业对口率[5]。
(2)随着信息化在各行各业的参与度的提升,跨学科、多学科交叉职位也随之增加,跨学科职位让毕业生萌生“跳槽式”求职岗位[6]。
(3)学生热衷于短期利益,热门职业的高薪、好待遇、门槛低和对口专业的低薪、门槛高都是影响因素。如当前房产销售行业月薪较其他行业员工为2~5倍,这对于毕业生而言,更具吸引力。
2.2 校企合作基地偏少
由于学院属于市属高职院校,学生毕业综合实践实习基地以浙江省为主,其中校企合作基地大多为嘉兴市本级企业。当前信息专业的校企合作基地数量约为200家,但实际上在学生毕业综合实践课程中承担联合项目的数量不足一半。通过连续3年的走访和调研,从合作基地反馈的信息中主要有3种情况:
(1)实习生较独立求职者来说,工作态度仍然保留在校学习的被动状态;且学生实际技能操作经验和工作能力往往难以胜任当前项目需求。
(2)实习生在前期的顶岗实习中表现不佳,工作进度方面存在散漫状态,且学习热情不高。
(3)信息专业学生对于出差性强的工作有抵触情绪,本土企业大多数情况无法给予实习生期待的实习经费,外地企业(如上海、苏州等地)在校企合作范围之外,但往往这些沿海地区的信息技术产业发展较本土更适合学生就业与职业规划发展。
然而,在实习基地也存在实习生源不足或者生源过剩,学生在实习基地无事可做或者实习基地给予的学生实习比例远远低于学院指标等现象。
2.3 专业核心课程内容滞后
不难看出,不管在网络招聘还是校园招聘中,对于信息专业的人才需求总是供不应求。但是往往毕业生求职时,难以与对口专业签约,主要原因是企业需要的人才专业里无法满足,这一现象在当前各高职院校普遍存在。随着大数据时代的来临,信息化技术不断地革新,也需要信息专业核心课程的不断革新。学生在校学习期间,一方面不仅要学习专业课程也要完成各类创新性实践类的课外活动,一方面校内核心课程、专业课程学习的内容与职业需求存在一定的滞后性。文献[2]指出,部分高职院校针对此类问题,改革人才培养方案已系统地完成专业核心课程的教学,却导致了学生基础知识不牢,基础的技能操作太生疏,这在一定程度上会导致学生难以胜任专业对口的职位。
3 大数据背景下毕业综合实践课程改革的必要性
毕业综合实践课程作为衔接学生在校学习和社会就业的主要课程,在毕业生就业质量方面具有关键性作用[7]。为了科学而稳定地提升信息专业中各子专业的就业质量、专业对口率以及实践课程的满意度,教师上好毕业综合实践课程、学生利用好毕业综合实践课程是高职院校毕业综合实践的必要条件。
以往的岗前综合实训效果不明显情况,增加岗前综合实训的完整度、严谨性,提升岗前综合实训的有效性,做好学生毕业综合实践中毕业生的技能知识基础,以增强学生实习时的专业对口率,一定程度上提升就业质量,决定了信息专业的毕业综合实践课程的执行性。
4 毕业综合实践课程教学改革
针对当前信息专业学生高就业率低专业对口率的情况,信息专业的毕业综合实践课程教学改革从以下几个方面展开:从教师的教学模式出发,驱动教师队伍建设,推进毕业综合实践课程的改革和发展;从课程考核方式改革切入,缓解学生实习期间的压力和教师以及管理系统的工作负担,“以学生为主,从学生出发”。
4.1 教学模式改革
为了更好地开展毕业综合实践课程以缓解现状,提升信息专业毕业生的就业率和专业对口率以及保证实践教学的满意度,改革主要从以下几点展开:
(1)在教学期初,通过案例教学、MOOC、翻转课堂等教学方法展开毕业综合实践的前期指导教学,使学生在开始实习之前就对实习流程有一个深入的认识、对毕业流程有一个清晰的了解过程。
(2)专人专带:由传统的一个老师辅导教学几个学生分散式或者分组式完成实习过程,改革为特派一个专任教师深入实习基地走访和监督学生实习状况,并通过实习基地的走访和调研获取当前企业所需人才的标准和要求。通过总结和分析,给予专任教师一定启迪和启发,推动下一轮专业核心课程的改革和创新。
(3)学生集中半集中式实习:以校企合作基地为主要实习基地,便于集中式管理,确保学生实习安全和校企合作的顺利开展;对于有特殊情况或者特别要求的学生采取半集中式管理和实习方针,尊重学生的自主选择和就业态度。以上所有实习基地都要以学生能够在专业对口的岗位为主要依据。
(4)指导教师深入企业和实习基地,走访和调研学生实习现状。一方面更加清晰地了解企业对实习生的实习评价,一方面提升专业教师团队对社会用功的需求的了解程度,同时,教师也能切身了解学生在实习期间的实习状况和毕业论文的完成状态。
4.2 课程考核方式改革
(1)以一定考核标准为课程合格指标,强制性管理实习阶段学生的实习工作,防止学生频繁调换工作岗位、,一定程度上提升学院就业声誉、学生就业质量。
(2)对校企合作基地的要求和考核制定明确的考核指标,如:每年学院的订单班、联合培养班、校企短期合作和长期合作、高校联盟、职教集团等成员单位,每年的学生实习的比例标准是否能够满足,校企合作基地是否能够按照学院的标准完成人才培养和企业项目的实际交接。
(3)分层次教学,针对专业技能知识较差的一批学生展开合作企业的集中式教学、专业技能培训课程;针对专升本学生提供专业理论知识的教学辅导,待考试结束后,督促其继续完成毕业综合实践课程。
综合而言,不仅从16次周记中检查学生实习状况,更要从实际的走访调研中企业指导老师处、专任教师处了解学生实习的实际情况,通过学生毕业论文综合质量等评价学生实习效果。
4.3 重视科研工作和师资队伍建设
专业教师的职业技能培训和专业技能培训以及实验设备的更新,都是提升R悼纬探萄能力所具备的条件。专业核心课程的教学是毕业综合实践顺利展开的基石,学生学好了,才能在实习中有信心,继而展现专业技能,为校争光。
然而,教师队伍的建设决定了专业核心课程的进展效果。针对专业核心课程的滞后性,从师资培养和科研工作的视角展开。高职院校的信息专业教师要参与到信息专业的科学研究以及相关教学研究活动总,积极参与到信息技术的科学研究和深入探索,同时研究工作要能接轨计算机网络、软件技术和计算机应用等方面的发展步伐。在科研中提升知识学习能力和更新知识库和资源库,利用新的科研知识和技能改革教学方法和教学手段,让学生在学习过程中由浅入深,技能操作方面实时掌握社会职位的操作要点,为毕业实习工作打下扎实基础。
4.4 校企合作基地配置
根据社会用工需求,在师资力量充足的情况下,增加校企合作基地数量,为学生实习寻找更多的社会实践机会。深入开展“现代学徒制”和“厂中校”的合作模式,让学生在前期校外实训和顶岗实习期间,就有机会深入企业了解和学习技能操作知识,为踏上社会工作岗位做好准备,减少在对口专业上就业的压迫感和迷茫感,一定程度上提升专业对口率。