前言:中文期刊网精心挑选了人工智能医疗应用的重要案例范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
人工智能医疗应用的重要案例范文1
关键词:数据科学;通识教育;大数据教育;教学实践
0 引言
近年来,在大数据的深刻影响和社会各领域对数据专业人才的强烈需求下,国内外各高校的数据教育兴起,一些高校成立了专门的数据研究院,开设数据科学硕士和博士课程。尽管在高校开展数据教育的迫切性得到了重视,但是从结果来看,高校所培养的数据科学专门人才在数量上仍然无法满足社会的需求。
通过调研世界范围内相关高校的数据教育开展情况,我们发现,国外知名大学的数据教育开始得较早,采取的方式主要有数据科学通识教育和数据科学专业教育两种;而国内高校数据教育起步较晚,数据科学的通识性体现得不明显,主要培养对象还是相关专业的研究生。对比这两种数据教育模式可知,在数据教育过程中,不仅需要专业教育,也需要通识教育服务于跨学科和交叉学科的发展,这样才有利于复合型人才的培养,以应对“互联网+”和大数据时代数据人才匮乏的窘境。
1 数据科学教育的发展现状
数据技术的不断发展和人们对数据价值的逐渐认同也推动了一个新的职业――数据科学家的诞生。微软、谷歌、亚马逊、Facebook、LinkedIn等数据驱动的公司这几年纷纷向数据科学家们抛出橄榄枝,并且薪酬不菲。大数据同时也带领人们重新认识了数据科学这一学科,数据科学不限于计算机和统计学的交叉,更不是它们的专利,在社会生活中的方方面面都有用武之地。纽约大学数据科学中心Vasant Dhar教授对数据科学是这样定义的:“数据科学旨在研究可普及的数据知识提取”。数据科学教人们如何从数据的世界里发现知识、挖掘财富、获得信息。数据思维和数据技术将成为学生未来学习、科研和职业发展的另一主要技能。
1.1 国内外数据科学在线课程现状
在高等教育数据科学课程的开设方面,美国约翰霍普金斯大学、伊利诺伊大学香槟分校、加州大学伯克利分校等国外知名高校率先开展了行之有效的实践,见表1。
在调研了Coursera、edX和Udacity三大MOOC平台上的数据科学相关课程之后,不难发现一些现象:
(1)几乎所有的数据教育课程都没有限制学习者的专业,无论是人文社科类还是理工科的学生,只要具备课程的先修知识和对数据科学的兴趣,都可以进行数据科学相关课程的学习。这是美国通识教育的体现,也说明数据科学可以作为面向交叉学科的课程来开展。
(2)课程的重点内容主要包括统计学、大数据、数据分析、项目实践等,反映出数据科学培养目标不仅包括数学、统计和编程知识的学习,还需要案例实践的训练和业务洞察力的培养。
(3)国内大学的数据科学课程寥寥无几,除表1中的复旦大学和香港理工大学之外,仅南京大学开设了“用Python玩转数据”课程,台湾大学开设了“机器学习基础”“人工智能”等基础课程,大数据教育相对落后。
(4)数据科学的先修知识主要包括程序设计、统计学、数据库基础等。其中程序设计并不要求精通某一门编程语言,因为对于从事数据科学的人才来说,泛型编程技巧比专长于特定编程语言更加重要。
(5)Python和R是目前在数据科学领域比较流行的编程语言,相对其他语言来说移植性较强,更容易学习,也更适合编程初学者学习。
1.2 国内外高校数据科学教育现状
美国很多高校都已开设数据科学和大数据的硕士课程,并且毕业生可以有机会进入IBM、亚马逊、英特尔等企业工作,获得高达十几万美元的年薪。加州大学伯克利分校、哥伦比亚大学从2011年起开设数据科学课程,并在之后的几年都设立了“数据科学”硕士和博士学位或者项目认证;伊利诺伊大学香槟分校和芝加哥大学则从假期培训课程起步。这种情况并不局限于世界顶尖大学,全美排名100名左右的北卡罗来纳州立大学,在2007年引入了学制为10个月的分析学硕士课程,其毕业生的就业薪资不菲。
在我国,北京航空航天大学于2012年设立了大数据工程硕士学位,2015年又携手浙江大学、复旦大学等7所高校和阿里云公司开设了“云计算与数据科学”专业。华东师范大学于2013年成立数据科学与工程研究院,致力于培养未来的数据人才。清华大学于2014年成立数据科学研究院,与信息、经管等学院展开合作推出大数据硕士学位项目,不仅公开对外招生,也欢迎本校研究生选修。教育部公布的2015年教育部直属高校新增审批专业名单中,北京大学、对外经贸大学、中南大学新增了“数据科学与大数据技术”本科专业。云南大学2016年也成立了大数据研究院,将培养大数据方向的博士和硕士生。
根据调研结果可以看到,世界顶尖大学的数据教育不但开始得较早,教育方式也具有层次性。一类是开展数据科学通识教育,面向全校各专业本科生和研究生,先修知识仅为数学、统计和入门级别编程。另外一类是数据科学专业学位教育,面向计算机、统计等相关专业学生,其中以硕士博士培养为主。后者的先修知识要求很高,并且在培养过程中以实践技能为中心,往往采用校企联合或校际联合的培养方式,目标是为社会培养专业型数据人才。与之相比,国内高校的数据教育开展时间不长,尤其在通识教育和交叉学科发展方面经验不足,多数的数据科学课程都是面向专业教育的。
2 数据科学课程建设的必要性
数据科学虽然看似是被大数据的浪潮“炒”热的,其实不然。数据科学有着广阔的研究领域和旺盛的生命力,具备独特的结构和内涵。将数据科学作为一个学科是很有必要的,它培养的是数据思维和数据技术兼备的数据科学家、首席数据官、数据工程师等复合型人才。在专业技术方面,一个合格的数据科学家不仅需要掌握数学、统计学知识和编程能力,并且还要掌握机器学习、数据挖掘和数据可视化技能。在通用技能方面,他们要具备敏锐的业务洞察力和丰富的实践经验,从大量杂乱无章的数据中发现知识的踪迹,找到相关关系,破解数据的价值。同时,沟通表达能力也是其必需的技能。数据专业人员应该了解非技术人员的实际需求,在获得数据分析结果之后,用图形或语言正确地传达数据内涵,帮助非技术人员充分理解这些数据的意义。由此可见,数据科学家是需要学习多门专业知识的高端复合型人才,不仅需要具备科学家的严谨和创造力,还要具备较强的沟通表达能力。
集众多能力于一身的优秀数据科学家不是一朝一夕可以“炼成”的,对未来数据专业人才的培养应该从高校数据教育抓起,打破学科固有的壁垒,为学生营造多学科交叉、融合的学习环境。高校数据科学通识教育的开展是充分必要的,具体体现在3个方面:
1)满足社会需求,适应时展。
2011年麦肯锡曾这样预测:“到2018年,仅美国就将面临140000~190000的资深数据分析人才和150万了解如何应用大数据分析结果做出有效决策的管理者的短缺”。无论是金融业、工业、制造业还是服务业,大数据时代稀缺的就是能从数据的整个生命周期来理解数据含义的专业数据科学家。高校作为培养人才的机构,应该顺应时展的趋势,以建设一流大学为目标,积极开展数据科学通识教育和交叉学科改革,组建跨学科的科研教学团队。这样一来,学科之间的壁垒被打破,学生们除了学习数据技术以外,还能够开阔视野,提前接触各个领域的业务知识,非计算机专业的学生也能有机会学习数据挖掘等大数据技术,有利于复合型数据人才的培养。
2)实施大数据人才战略,驱动资源平台的建设。
2015年,党的十八届五中全会提出要实施“国家大数据战略”,标志着大数据战略正式上升为国家战略。结合国家的人才强国战略来思考,各高校应当树立起强烈的大数据人才培养意识,加强高校与企业、高校与高校之间的合作关系,通过举办大数据竞赛、合作办学等方式,建设数据教育资源平台。2015年,EMC与上海交大合作举办了“EMC杯上海交大智慧校园数据分析大赛”,赛题分为校园餐饮消费分析和校园无线网络流量分析,赛前为参赛者组织数据科学课程培训。此次大赛不仅促成上海交大对校园卡消费数据和网络流量数据的开放,也为参赛者提供了一个数据分析的实战机会。百度、阿里、天猫等都与高校合作举办过类似活动,而很多比赛的金奖获奖团队的大部分成员都不是计算机或者统计专业的学生。这说明,数据科学教育并不应该局限在少数的相关专业,数据科学通识教育可以激发各专业学生的学习兴趣,真正地支持国家的大数据战略和人才强国战略。
3)培养学生的数据思维和创新能力。
对于数据科学家来说,在实际的工作过程中,数据技术只是解决问题的一种手段,真正起驱动作用的还是他们的数据思维和创新能力。数据思维需要在长时间与数据密切接触的氛围里形成,一切分析结论、决策和预测都来源于真实的数据和缜密的逻辑判断,而不是凭空猜想。学生通过在大学里学习数学、统计学和计算机能够有效地培养数据思维,而这些课程都包括在目前国内外高校的通识教育之中。跨学科进行的数据通识教育还可以促进不同学科之间的了解、碰撞和协作。有时,数据科学家不仅需要具备优秀的专业技术,还要具备特定领域的业务知识和面对数据的灵感和直觉,这就是数据科学家的创新能力。学校里的跨学科交流开阔了学生的视野,他们未来就有能力根据一条条数据分析结果,提出富有创造力的解决方案。
3 面向通识教育的数据科学课程教学实践
为了适应国家经济社会发展的重大战略和人才培养需求,吉林大学自2014年起积极构思具有层次性的数据教育方案。2015年,计算机科学与技术学院面向计算机专业本科生和软件学院研究生开展了“大数据技术与应用”课程。同年,公共计算机教学与研究中心为经济学院和金融学院本科生开设了“数据科学与大数据分析”课程。这些教学实践分别针对专业教育和通识教育两个层次设计,分本科生和研究生两类教学对象,讲授了大数据时代对于获取、处理和展示传统数据以外的“数量大”“速度快”和“非结构化”数据的新方法与新技术,培养学生的计算思维、数据思维和互联网思维,使他们准备好迎接“互联网+”时代的新机遇与新挑战。
3.1 课程的具体目标
以为经管、金融类本科生设计的“数据科学与大数据分析”课程为例,它的主要授课对象是大学高年级非计算机专业学生,希望通过一系列的课程研究和改革,结合实际案例和实践教学的方式,将数据教育植入现有的计算机基础教育中。在这门通识教育类课程中,要着重为学生讲授数据科学和大数据技术在科学研究、互联网、金融、社会、医疗、商业和政治等多领域中的方法、工具和应用案例,培养学生解决实际问题的能力。
该课程的目标主要包括如下3个大的方面:
1)培养数据思维能力。
课程主要通过真实的数据项目实践来培养学生的数据思维和项目分析能力。数据项目通常有其使命与目标,须与业务需求保持一致。学生通过调研和分析,总结出具有关键意义的数据需求,了解什么样的业务问题可以转化成数据问题,什么样的数据是可以进行计算的,面对结构化、半结构化以及非结构化的数据,该选取什么样的模型和工具进行计算。最终,当获得数据分析结果后,学生还要结合专业领域的知识,思考如何把数据解决方案转化为可执行的业务解决方案,让决策者更清晰地阅读数据,这同样是本课程的关键教学环节。
2)提升技术应用能力。
该课程致力于提高学生的高级计算机应用能力。当然,学习之前需要有一定的互联网、统计学、数据库等背景知识。大数据涉及的不仅是数据分析,还包括数据挖掘、商务智能和新的技术与新的思维方式,而这样的技术和思维方式,不仅可以提升学生的计算机技术应用能力,也将提升他们的专业能力和管理能力,甚至创新能力。
3)新的技术发展应用。
该课程综合全面地介绍大数据背景下新的技术体系。现有的计算机基础课程、互联网金融课程或电子商务课程在介绍大数据时,都是“普及性”和“杂志性”的介绍方法,该课程则不然,它通过案例教学让学生在真实场景下应用大数据技术并解决实际问题,最后通过企业提供的真实数据,让学生分组合作,将共同完成一个项目实践作为最终考核。
3.2 课程的知识模块设置
该课程的核心思想是为学生全面讲述数据的整个生命周期,包括数据获取、数据准备、模型建立、数据分析和挖掘、数据可视化,以及最终把数据解决方案转化为可执行的业务解决方案的方法和过程。以实际案例让学生了解数据处理的基本方法和生态系统,掌握使用相关工具及算法来解决学习、科研和工作中数据问题的综合技能,重点培养学生的数据思维,并通过数据科学为学生连接自然科学、社会科学与信息技术。具体的知识模块设置如图1所示。
(1)问题发现:引导学生发现业务问题,思考解决这个问题所需要的领域知识,思考这个问题是否可以转换成一个数据问题,培养学生数据思维和计算思维的视角与思考方式。
(2)数据准备:培养学生数据获取的能力,并使其能够进行数据清洗与整理,确定保留与丢弃的部分,保证处理前的数据质量。
(3)高级数据分析:在统计方法的基础上学习高级的数据分析方法,培养学生模型建立的能力,使其掌握数据挖掘的基本思想和基本算法,并能够使用相关工具进行高级数据分析和数据挖掘,发现知识。
(4)数据可视化:培养学生的图表表达能力和“用数据说话”的能力。
(5)数据解决方案:让学生阐释结果,确定关键的发现,并找出价值。
(6)可执行的业务方案:让学生通过数据模型的建立、分析与验证获得数据解决方案,并在此基础上考虑业务问题和现状,提出可行的业务方案。