课程名称 |
大数据与云计算实践 |
Practice on Big Dataand Cloud Computing |
开课单位 |
计算机科学与工程 |
课程性质 |
必修课 |
课程类别 |
实践环节 |
课程代码 |
210731101101 |
学分 |
2 |
学时 |
48 |
适用专业 |
智能科学与技术 |
先修课程 |
程序设计综合实践、操作系统、数据库系统、计算机网络 |
授课语言 |
中文 |
一、课程简介
(一)课程中文简介
《大数据与云计算实践》是智能科学与技术专业的必修实践课程。本课程的目的是使学生在学习程序设计综合实践、大数据分析与处理、云计算等课程,以及学习了大数据基本原理及其相关编程技术之后,按大数据处理的基本过程进行一个适当规模的项目开发实战,在开发实践中巩固技术、增长能力、提升素质、丰富经验,达到培养解决工程实践问题能力的目标。
本课程要求学生以团队的形式完成一个大数据技术项目综合应用开发。综合应用大数据采集、存储、管理、分析等技术,选择并运用适合的大数据技术软件工具建立在相关应用领域的数据加工模型。本课程要求学生能够运用大数据处理平台对海量数据进行采集、存储及管理,综合应用大数据分析方法及其算法,能够对已采集数据在相关应用领域进行合理分析及处理。
(二)课程英文简介
‘Practice on Big Dataand Cloud Computing’ is a compulsory practical course for Intelligence science and technology majors. Based on the basic principles of big data and programming techniques (e.g., ‘Comprehensive practice of programming’, ’ Big Data Analysis and Processing’, ‘CloudComputing’), the aim of this course is to develop the ability of students to build a project about big data processing with appropriate scale. This project help students to improve their ability and quality and enriches experience in the actual development to achieve the goal of training the ability to solve engineering practice problems.
This course requires students to complete a comprehensive application development of a big data technology project by team. The students will learn comprehensive application technologies of big data acquisition, storage, management. After understanding these technologies, they learn how to select and use appropriate big data technology software tools to build data processing models in related application areas. This course requires students to use the big data processing platform to collect, store and manage huge amount of data, comprehensively apply big data analysis methods and algorithms. Finally they are able to reasonably analyze and process the collected data in related application fields.
二、实训课程目标
CO1:掌握数据采集及大数据存储技术与原理,能够运用大数据处理平台对海量数据进行采集、管理及存储;掌握分布式文件系统原理、分布式系统平台的搭建。
CO2:掌握大数据技术项目开发流程及综合应用开发的基本方法,能够在团队中合作完成各阶段任务,提高学生对大数据开发的实践能力。
CO3:综合应用大数据采集、存储、管理、分析等技术,能够选择并运用适合的大数据技术软件工具建立在相关应用领域的数据加工模型,并利用模型与相关人员进行有效沟通。
表1智能科学与技术专业课程目标与毕业要求指标点
适用专业 |
毕业要求内涵观测点 |
课程目标 |
智能科学与技术 |
GR4.3能够对实验结果进行合理分析、解释,并对多个子问题进行关联分析,找出冲突点并进行平衡,通过实验数据分析、信息综合等手段得到合理有效的结论 |
CO1 |
GR6.3能够正确评价计算机技术与应用工程实践和复杂工程问题解决方案对社会、健康、安全、法律以及文化的影响,并能够理解应该承担的责任。 |
CO2、CO3 |
三、实训内容与要求
实训内容:
1、团队组建:指导教师公布实训要求及候选题目,组织学生分组,每个项目小组由3-4人组成,可根据大数据处理阶段进行小组成员分工。小组成员分别负责大数据采集、大数据存储与管理、大数据分析、大数据可视化等若干任务,确定每人具体职责。
2、项目选题:指导教师每年根据社会需求及往届学生实训反馈信息筛选出至少5个候选题目,给出每题题目的基本要求,要求每个项目小组通过搜集查看与选题相关的背景资料,在组长的带领下讨论选题中要求掌握的平台技术及所需的数据分析算法。学生自选题目必须先通过指导教师审核确认。
3、平台选择与系统搭建:每个项目小组根据选题,选择适合的大数据处理平台并进行系统搭建,为后续大数据存储和管理做好底层系统部署。例如:项目小组可选择分布式文件存储系统HDFS,对Hadoop平台进行搭建,以便在团队中完成后续的任务。
4、大数据的存储管理:项目小组运用任意一种NoSQL数据库进行数据存储管理,应用Java等编程语言实现对NoSQL数据库的访问,实现对NoSQL数据库中的数据进行增删改查等操作。例如,项目小组可选择分布式数据库HBase、Mongodb、Redis等非关系数据库进行安装和部署,并对数据库文件进行操作,实现对数据的存储管理。
5、大数据分析处理框架的编程实现:以数据处理分析算法实践为目标,各小组根据采集的相关领域的数据及大数据存储平台,选择大数据处理框架MapReduce或Spark,对MapReduce或Spark编程模型的函数进行编写实现。最后,能够对分析得到的结果针对相关领域作出相应决策。
6、大数据推荐算法的应用及实现:各小组能够结合某领域的数据,利用相关大数据推荐算法,建立推荐模型,查看推荐结果并实现数据在此领域的推荐应用。
实训要求:
实训要求学生必须采用“项目小组”的形式,具体要求如下:
1.每个小组搭建Linux分布式平台时,能够利用小组名字进行区别命名(比如bigdata101),并且在平台上部署各个技术框架(HDFS,HBase,NoSQL,MapReduce等)。
2.每个小组选题后进行行业知识或领域知识的业务理解,之后小组对每个步骤进行分工协作。针对采集数据的业务特征,各团队成员分工协作,分别负责相关领域的数据爬取、选择适当的分布式存储技术进行存储、在大数据处理框架上运用数据分析算法进行编程等多项任务。团队最终的数据加工结果具有一定的结论,并能够对此领域具有一定的指导意义。
3.每个小组根据每个步骤,撰写实验报告文档,包含实验题目、小组分工、实验代码、实验过程、实验结果与结论以及实验心得等,其中,根据实验过程描述,实验代码要能够在计算机上顺利运行;
4. 所选题目的所有任务不要求全部实现,每个项目小组可以选择大数据采集、大数据存储平台搭建、大数据存储及管理、大数据分析、大数据可视化等至少2个任务,完成编码并进行测试。
四、实验设备与环境配置
1. 计算机:Intel Core4 i7CPU 3.4GHZ、内存8GB、硬盘2TB以上;
2. 实验平台及开发环境:虚拟机VMware workstation 15,Ubuntu Linux16.04,Hadoop2.10.0,JAVA JDK1.7,Hbase 1.1.5, Spark2.1.0;
3.虚拟仿真教学平台。
五、课程思政、创新创业元素
教学章节 |
知识点 |
思政元素案例 |
培养目标 |
备注 |
1 |
团队组建 |
团队协作 |
培养大学生的团队协作精神 |
|
2 |
项目选题 |
以人为本的设计理念 |
培养大学生在软件开发中以人为本的设计理念 |
创新创业案例 |
2 |
项目选题 |
短视频抖音在世界各国的发展和影响 |
当代大学生应放眼世界,了解并跟随世界发展趋势勇做时代精神的弘扬者和改革创新的实践者。 |
|
3 |
平台选择与系统搭建 |
弘扬工匠精神 |
培养大学生的严谨认真、精益求精、追求完美的工匠精神 |
|
4 |
大数据的存储管理 |
百度云下载成为新的服务模式 |
培养学生探索未知、追求真理、启发创新创业意识。 |
创新创业案例 |
4 |
大数据的存储管理 |
新的图数据库管理系统在云栖大会上发布情况 |
已有创业公司的经验:根据实际业务问题,发现问题,寻找问题产生的根源,问题分析与抽象,提出解决问题的方法,使学生对科研和创新有初步的认识。 |
创新创业案例 |
5 |
大数据分析处理框架的编程实现 |
弘扬工匠精神 |
培养大学生的严谨认真、精益求精、追求完美的工匠精神 |
|
5 |
大数据分析处理框架的编程实现 |
我国天气预报的长足进步 |
注重学思结合、知行统一,增强学生勇于探索的创新精神、善于解决问题的实践能力。 |
|
6 |
大数据推荐算法的应用及实现 |
“双十一”购物数据显示大屏中的可视化案例 |
培养学生针对具体问题进行具体分析的能力,能灵活变通,踏入社会后能适应社会的飞速变化并进行学习和成长。 |
|
6 |
大数据推荐算法的应用及实现 |
京东典型的大数据应用案例 |
注重学思结合、知行统一,增强学生勇于探索的创新精神、善于解决问题的实践能力。 |
|
六、主要参考资料
[1]林子雨.大数据技术原理与应用[M].人民邮电出版社.第2版.2017.2.
[2]林子雨.大数据基础编程、实验和案例教程[M]. 清华大学出版社.2017.8.
七、考核方式、方法及实验成绩评定方法
本课程实践考核分别从工作态度、作品质量、实训报告质量、独立分析与解决问题能力、沟通与团队合作等方面进行评价,指导教师根据每位学生实训课程过程表现、实训作品及实训文档进行总评分,具体评分项由指导教师给出分数。
评分过程:
1、实训开始时,由指导教师公布课程评分标准,要求全体学生认真掌握领会。
2、教师检查各组作品,判断各组成员工作量、程序质量、数据分析结果可信度,并审核各组文档制品,根据表2中所列评分标准,分别进行打分,
3、所有实训环节结束后,汇总计算每个同学的工作态度、作品质量、实训报告质量、独立分析与解决问题能力、沟通与团队合作等方面总积分。最终成绩采用五级制评分。
(一) 评分标准
表2评分标准
考核 环节 |
占总成绩 比例 |
<60 (不及格) |
60-69 (及格) |
70-79 (中等) |
80-89 (良好) |
90-100 (优秀) |
工作态度 |
10% |
消极应对阶段负责人安排的任务,拖延应付,影响小组进展 |
基本上能主动完成阶段负责人安排的本阶段任务,偶尔有拖后或应付现象 |
能积极完成阶段负责人安排的本阶段任务 |
能主动辅助阶段负责人完成阶段本阶段任务 |
能积极主动高效地辅助阶段负责人完成本阶段任务。 |
作品质量 |
40% |
对大数据技术理论与实践理解不够,采集存储及分析等阶段作品不完整,代码多处有错误或抄袭。 |
对大数据技术原理及理论有基本的实践能力,基本上能够按时完成各阶段的任务,有数据存储、分析结果,偶尔有代码错误或者数据分析不恰当的地方。 |
对大数据技术原理及理论有相当的实践,能够按时完成各个阶段的基本任务,能基本完成采集存储,并能展示基本的数据分析结果。 |
掌握大数据技术原理,能够高质量完成数据采集存储并展示分析结果。 |
完全掌握并运用大数据技术原理,能够高质量完成数据采集存储并展示分析结果,而且结果有深度有创意,有一定的社会意义。 |
实训报告质量 |
20% |
不能合理总结阶段成果,不能按时撰写符合要求的阶段实习报告文档,报告中错误较多。 |
基本上能够总结阶段成果,按时撰写符合要求的阶段实习报告文档,报告中偶尔有错误 |
能总结阶段成果,按时撰写符合要求的阶段实习报告文档 |
能高质量完成总结阶段成果,撰写阶段实习报告文档 |
能高质量完成总结阶段成果,撰写阶段实习报告文档,所完成内容有合理创意。 |
独立分析与解决问题能力 |
20% |
大数据原理及技术基础知识掌握不牢,分析问题思路不清晰,不能找出数据采集存储及分析等阶段的实现方式,无法独立完成小组分配的阶段性任务。 |
基本掌握大数据原理及技术基础知识,对项目有一定的分析,能够所提出针对数据采集存储及分析的思路和实现方法,其思路和方法存在部分缺陷,经常需要协助解决。 |
较好地掌握大数据原理及技术基础知识,对项目有一定的分析,对数据采集存储及分析的任务能够找到解决思路和方法,其方法基本可行,偶尔需要协助解决 |
较好地掌握大数据原理及技术基础知识,对项目的分析有一定的深度和广度,针对数据采集存储及分析的任务的思路和方法相当得当。 |
熟练掌握大数据原理及技术基础知识,对项目的分析问题有较高的深度和广度,针对数据采集存储及分析的任务的思路和方法十分得当。而且能提出有创意的见解。 |
沟通与团队合作 |
10% |
不能以协作、共同进步的心态对待同组成员,不能积极及时响应同组成员的请求,所提供的协作质量较差,与同组队员基本无沟通,在一定程度上影响团队工作任务的进展。 |
基本上能以协作、共同进步的心态对待同组成员,在完成份内任务之余,对其他组员提供的协助意愿不强,但勉强可以满足工作要求,与其他组员沟通较少。 |
基本上能以协作、共同进步的心态对待同组成员,在完成份内任务之余,对其他组员只提供一般协助,与其他组员沟通正常。 |
能以协作、共同进步的心态对待同组成员,注重团队利益,在完成份内任务之余,经常帮助其他组员,与其他组员较好地沟通。 |
能主动以协作、共同进步的心态对待同组成员,处处以小组团队为重,在完成份内任务之余,经常主动帮助其他组员,与其他组员较好地沟通。 |
(二)考核环节权重
表3 实训课程目标与项目环节对应关系
考核环节 |
CO1 |
CO2 |
CO3 |
工作态度 |
√ |
√ |
|
作品质量 |
√ |
√ |
√ |
实训报告质量 |
√ |
√ |
√ |
独立分析与解决问题能力 |
|
√ |
√ |
沟通与团队合作 |
|
√ |
√ |
|
100% |
100% |
100% |
撰稿人:陈欣
审核人: 刘晓鹏
批准人:崔宾阁