1、依据分析与挖掘技术课程标准课程编码考核方式考查课程性质必修课程类型专业核心课计划学时64学分4开设学期6开谀单位信息工程学院适用范围大数据工程技术专业一、课程低迷1 .畏履制定依福本标准根据国家职业教育改革实施方案3中的“课程内容与职业标准/接、教学过程与生产过程对接”的要求.2023版6大数据工程技术人才培养方案中的职业岗位能力要求“具务从事大数据聚集、存储、分析、挖求、S(处理等工程岗位的处理能力”以及职业本科的内在要求而制定。该课程标准用于指导大数据挖掘技术的课程教学、课程考核、故学督导与课程窿设等工作.2 .谭赛地位与性质本谭.程是一门专上核心深,其先修课程是Python程序设计.C大
2、数据分析可视化技术后续深程方大数福技术能合应用K主要目的是培族学生利用Python软件,以数据分析、数据挖掘应用为主线,对她挣项处理.关联规则.决策树、贝叶斯分类器、KNN分类器、线成分类算法、回归分析、聚类分析等方法,按照实际数据分析、数据挖掘步思,培养从基本原理到软件实现的基本操作能力,并培养其良好的数利分析与无渔规范和职业素养,为后期大数据技术琮合应用和毕业设计的制作打下坚实基础。序米程名眷课程类型文撑关系1Python程序设计前导课程本谍程从理论上要求掌握PyIhon相关知识点和常用第三方模块,能纱使用Py1.hOn实现数据类型相关操作.理佛面向对象的思想,以及掌提一些常见第三方模块的
3、使用。2大数据分析可视化技术前导课程本课程通过具体的分析项目,闻述了在大数据分析的应用过程中,可视化通过交互式视世表现的方式未探索和理斛复杂的数据,通过可视化分析软件.更好地从复杂数据中科到新的发现,2大数据技术综合应用后续课程本课程通过一个具体的项目,阑述了项目慨述、搭建大敷据集辞环境.数据采集、数据流处理、数据分析与数据可视化等一系列知识体系的应用。3 .本课程设计理念是以职业需求为导向,通过任务驱动力式构建学生期业岗位能力和职业素养。在教学过程中,充分挖融课程思欢元素,努力实现职业技能和职业精神培养的高度融合;强调以学生为教学活动的主体.装师通史任务布置、启发式教学.问题导向教学以及之程
4、评价等方式贯穿教学过程。本课程通过大数据变堀技术相关理论的讲慢和具体任务的实施,培养学生用理论知识去分析、.解决实际问题的能力:通过上机实践培养学生实际操作能力并枳系统计分析的矍月经转:逋这基于工作过程的任务分解及设计,培养学生的职业惆位能力及职业素养,从而催生学生挣合职业能力的生成.4 .课猩内容选取的依据(1)景槿内容选取井本原则收学内事齐实化根据职业岗位能力要求,分析归纳岗位典型工作过程,将课程教学目标贯穿在精心设计的项目中.敕学内*项目化.选取具有代表性的宾际项目作为教学案例,将其设计成典型工作任务,形成与工作任务相匹配的教学项目,使之更符合专业人才培养目标的要求.在教学过程中,以学生
5、为中心,教师为主体,引导学生在学中做,触中学,力求做到“教、学、做”一体化.*Mtt4t.以项目任务制实施教学,每个学习任务都先力其基本统计原理和公式.然后根据具体实刎项目需求,通过详维的Python数据分析与挖握步赛演示,并对挖报结果进行徉细解择说明分析,把提好职业岗位技能要求的熟熔程度,从常见到一般,由易到难,层层推进,深入浅出,最终实现教学目标。t学内*腰次化.除选取初次就业的职业岗位技能要求外,还兼腹满足更高职业岗位技能要求的深度和广度,以拓展学生的知识面与技能储备,同时迁可以兼雁不同层次学生的学习需求,培养学生可排钱发展能力.(2)课程内总选取的思路打破以知识传授为主要特征的传统学习
6、模式,呆里以项目为蛆,、任务为引、行动为导向的敏学模式,快照“做中学,学H微”的将教学和理论知识融为一侬的行动导向的思路组织教学。首先调查分析职业岗位能力要求,归结总结典型工作任务,其次畀究课程的主要学习项目、黑程整体设计思珞、单元设计、能力训熔项目及黑程的教学蝶式,最后重新构族课程苑识体系,并确定设程教学内容.IMI内容取突出取文*位16力目标:果程以学生为主体,用项目任务来训练学生的能力:选取的教学内容应尽可能多的涵苦若应岗位所涉及的知识点和技能点,每个学习项目都是一个完整的技能训炼过程。以训媒学生肆合实践能力,从而实现“学生身份”向“职业岗位身份”的转换。二、景程目标(一)谭程总目梅致祭
7、分析与指轴技术课程的总体目标是:鳌求学生单提对数据挖锚的各个方法(包含数据预处理.关联规则、决策树、贝叶斯分类器、KNN分类器、集成分类算法、回归分析、聚类分析、异常值检测等)从基本原理到软件具体操作.同时,培养学生掌握基本的创新方法、具有爱求创新的态度和意识,能移独立思考、分析问题,能够利用数据挖掘工具解决实际问题的能力;并且培养学生具有一定的收利急赛能力、团队毋作的精神以及适应信息化社会要求的自学能力和获取新知识、新技术的能力.(二)课程分目标1.总政目标(I)培养学生热爱徂国,为桓国新时代事业而努力学习的奋斗情神:(2)深程的开设可以培养学生的踏实工作作风.(3)培养学生观察和思考能力以
8、及团队合作的能力)培养学生分析问题.解决问题着的坚韧不拔、不怕困苦的优秀品质:(4)培养学生严谨细致和爱岗敬业的职业操守。2.知识目标1 .了解多元统计分析各个力法的基本原理:2 .熟隽PythOn实现数据预处理的步爨和过程:3 .熟悉Python实现决策桁的步骤和Ii程:-1.勒隽Python实现朴素贝叶斯的步骤和过程:5 .热年Python实现回归分析的步骤和it程:6 .熟年Python实现聚类分析的步骤和It程,7 .熟悉Python实现异常值检测的步索为Ii程:3 .技能目标1 .具有熟练使用Python语言的能力.2 .具有他据慎处理的能力:3 .具有狗建决策林、扑素贝叶斯、KNN
9、线性回归、逆辑回归.KmeanS聚类的能力:4 .具有检测数据中异常值的能力。4 .情修态度与价值现(1)认识到数据挖掘在大数据中的地位和作用,或发对本课程的浓厚学习兴趣:(2)通过对大数据挖报技术的学习,树立正确的知识产收现,激发学生乐于分享的奉献精神:C3)通过数据挖掘的其现,认识到任何事情期不能出任何基错的重要次.养成严顼仔铀、一丝不有的工作作风;(1)通过引导学生从官网下载正版软件,养成正确的知识产权的观念及信息安全的主动观念;(5)通过项目密求的分析,设计及问题的解决,培养学生善于分析、勤于实践、不怕失败、百折不提的优良品质。三、崇程内容标准大蛾据挖旭技术课程以项目制实施教学,其中
10、包含了8个项目21个任务:项目1主要讲解了数据慎处理:项目2主要讲侪决策树.常见的决诲材算法包括ID3、C45.CART算法:项目3到项目7主要讲解常用的数据挖掘算法,包括朴素贝叶斯.KNN分类器、集成学习、及性回归、迈辑回归:项目8是讲解聚类分析,主要包括KMeanS聚美。实般条件允许的情兄下.可采取理实一体化歙学模式.主要内容:主要包括数担清理、战据集成.数据观州和数揖变换,模块名知识点投能点模块一:题据懂处理1 .掌程PythOn实现敷挹清理的方法和步骤:2 .掌握Python实现合并数据的方法和步骤;3 .掌握PythOn实现蚁据标准化.数据分箱等1 .具有使用Python软件实现检测
11、异常值、缺失值的能力:2 .具有使用PyIhOn软件实现数据合井的能力:3 .具有使用Python软件实现标准化.分箱的能力.僚发思政元素“律回春晖淞,万泉始更新州立民横自豪感与专业自信,激发学习动力。“工欲善其事,必先利其器;培养小组协作和解决问题能力。皴学点1. Python软件实现异常值检测2. Py1.hOn软件实现缺失值填充3、PythOn软件实现数据归一化1、Python软件实现数据标准化敦学今点1、Python软件异常值检测的实现2. Py1.hon软件缺失值填充的实现3. Py1.hon软件实现,数据归一化4、Python软件实现数据标准化5、Python软件实现数抠采样2 .
12、模块二:决策情主要内容:决策树是一种机器学习的方法.决策样的生成算法有ID3,G1.5和CART等.决第树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类转果.本项目将通过决策榜分类的实现,培合大黄实例说明如何利用Python软件对数据文件进行分类.模块名知识点技能点模块二:决策树1 .了解决策树相关的基本概念:2 .掌提Python软件通用决策样算法的过程;3 .掌握Py1.hon软件对分类结果的1.具有使用Python软件实现决策树分类的能力;2,具有使用Python软件实现财分类结果进行评价的能力:评价;4.了解决策树剪枝的
13、相关方法.3.具有使用Python软件绘制出决策楼模型的能力.僚复悬政元米“万事俱各.只欠东风培养学生百主学习的能力,学会小组协作,登阅资料,交流讨论解决同题的能力。毅学点1.决策树中泾典算法如ID3.C4.5.CART算法的分类过程2、PyIhon实现决诲材分类模里的建立3、Py1.hon实现决第材分类梗里的可现化敦学魔点1.PyIhon实现决策樨分类模型2、PyIhon实现分类效果的评价3、Python实现决董材模型的绘制3 .模块三,朴素贝叶斯主要内容:朴素贝叶斯是贝叶斯分类赛中的一种模型,用已知类别的数枢集训探模型,从而实现对未知类别数箔的类别狎断,其理论基础是贝叶斯决策论,本项目主要
14、介绍贝叶斯公式的基本原理,并使用PythOn工具后具体案例进行操作,并对操作结果进行详细的解释说明.模块名知识点投能点模块三:朴亲贝叶斯1 .了解贝叶斯公式的基本原理:2 .掌握PythOn软件实现扑去贝叶斯的步骤:3,掌握Python软件对朴素贝叶斯分类结果的评价.1 .具有使用Pyrhon软件实现朴素贝叶斯分类的能力:2 .具有使用PythOn软件实现对分类结果进行评价的能力:果发悬欧元崇闻道有先后,术业有专攻二培养学生严谟认真的治学态度,严格建循并改畏规则.“不以规矩,不能成方ar,培养学生产谨认真的治学态度,严格遵循并敬畏税期.效学重点1、Py1.hon软件实现朴素贝叶斯分类过程2、P
15、ython软件实现朴素贝叶斯分类结果的评价毅学魔点1.Python软件实现朴素贝叶斯分类2、Python软件实现分类效果的评价4 .模块四:KNN分类工主要内容:KNN的落本思想是:情人没有标签(标注数据的类别),即没右径过分类的新数据,先提取新数据的特征并与测试集中的每一个数据特征进行比较;然后从潮试集中提取K个最锦近类像的数据特征标卷,统计这K个最邻近数据中出现次数最多的分类,将其作为新的数据类别.本模关主要介绍KNN分类器的套本原理及其分类过程,井使用PythOn工具对具体案例实现KNN分类器.模块名知识点技能点模块四:KNN分类61 .了解KNN分类器的苏本原理;2 .掌握Python
16、工具实现KNK分类器分析方法;3 .常5Python工具实现分类妓果的评价1 .具有使用Py1.hon工具实现KNN分关器的能力;2 .具有使用PyIhGn工具实现分类效果评价的能力:等要恩政元素培养学生专注的工匠精神,学会分析和解决故障问题.爱岗敬业的精神。选取优秀毕业生从事相关岗位工作的实例,分享学生的实习周记。救学点1 .距离的计算方式2 .KNN分类器实现分类的过程3 .用Python软件实现KNN分类器便里1.用Python软件实现分类效果的评价教学弟点1 .能典的计算方式2 .KNN分类器实现分类的过程3 .用Python软件实现KNN分类器便里4 .用Python软件实现分类效果
17、的评价6.模块五:集成学习主要内容:集成学习本身不是一个单独的机器学习等法,而是通过构健并结合多个机器学习器来完成学习任务,集成学习可以用于分类问题集成,回与问则集成,转征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影.本模块主要介绍维成学习的类别.巢成学习的Python实现、集咸学习模型的评价,以及使用PythOn工具对具体案例实现集成学习的步莪和过程进行详解。模块名知识点找能点模块五:集成学习1.了解臬成学习算法的类别及其基本原理:2*提使用Py1.hon工具实现集成学习的基本步骤和方法:1.具有使用PythOn工具实现集成学习的能力:2.具有使用Pytho
18、n工具实现集成学习评价的能力;3.掌强使用Python工具实现集成学3.具有使用Python工具实现集成学习算法的讦价:习参数调整的能力。僚复悬政元米具备通it学习资料荻取信廛的能力,具备通过网络有效获取信息的能力。培养学生专注的工匠精神,学会分析和解决故障问题,爱忸敬业的精神。教学点1.集成学习的类别及各自的步骤2.集成学习的Python实现教学京点1.集成学习的类别及各自的步界2、集成学习的Python实现6 .模块大I线性19归主要内容:在统计学中,线性回归(1.inearRegreSSion)是利用称为线性回归方程的最小平方函疑对一个或多个自变量和因变量之间关系进行建穰的一种回归分析.
19、本隹块主要介绍线梃回归的基本定义和类别,并使用Python工具实现段性回归便里的建立和评价。模块名知火点技能点模块六:多重病应分析1.零35或性回归的定义:2 .掌握线性回归的类别:3 .掌握线性回归的PythOn实现:4 .拿操线也回归模型的评价指标.1 .具有速立慢性回归援51的能力:2 .具有使用Python工具实现模型评价的能力;3,具有使用PythOn工具实现求解线性回归模型回归系数和俄距的货力。谭意恩欧元素国学肓人:韩您的师说“古之学者必有师,师者,所以传道受业解惑也“人非生而知之者,孰能无感?感而不从师,其为盛也,终不解矣.圣人无力怀。孔子日:三人行.则必有我师。是故弟子不必不如
20、师,师不必贤于第子,闻道有先后,术业有专攻,如悬而巳.三臼主育人.教学重点1.线性回归模型的定义和分类2 .段性回归模型的Python实现3 .我性回归模型的评价It学魔点1.线仕回归模型的PythOn实现2、线住回归模型的评价7 .模块七:量馨日归主要内容:1.ogisiicReRrCSSiOn虽然被琼为回归.但其实际上是分类模型,并常用于二分类.1.ogisticReRrCSSion因其舞单、可并行化.可解群强深受工业界后裳。本项目主要讲解更辑回归的定义、逻辑回归与线性回归的区别、逻辑回归的Python实现以及逐辑回归模型的评价.模块名知巩点技能点模块七:逻辑回归1.理解逻辑回归的定义及其
21、相关原理:2,掌握逐辑回归的Py1.hon宾现;3.掌握逐辑回归犊里的评价:I.掌握逻辑回归的参数更新过程。1 .具有使用PyIhon工具实现逻辑回与模型的能力:2 .具有使用PythOn工具实现建界回归模型评价的能力.课签思欧元素结合当前国家信息化洪设.学好统计知识,树立大局意识,保护好国家和用户的核心数据.维护好国家和客户的利菽。培养学生敬业的工匠精神.激发课程学习的兴趣,教学点1.嵬辑回归的定义2,袤辑回归的蚊学公式3.交轲回归的Python实现1.茨构回与模型的评价教学魔点1,及辑回归的Python实现2、至相回归模型的评价本课程各模块学时分史建议如下:序号模块名学时理论实屐4注1数据
22、预处理8142决策树12663朴素贝叶斯8441KNN分焚器8115集成学习12666致性回归844i逻辑回归844合计643232回、敢学实;*或忧1.却夷要求(1)专任效舜昊求熟落大数据枭集与强处理.数理统计与钱率论.统计分析与可视化技术:熟悉Python的下设,安装、Kf,最好熟悉在各高校镜像网站的下戏如清华大学镜像网站的: 具有三隼以上数据分析与挖轮项目的势彩: 3年以上教学经.以或讲师以上职称的双师型教师。(2)兼职教舜要求: 具有一定的普通话基础,并掌握一定的教学、教育相关知识,能充分表达所教学的内容: 熟慈大数据项目开发具有三年以上的项目开发实践经殷:(3)收学团队按照每届5个教
23、学施皴的观模,可正各2名专任教师.1名兼职教卿.职称和年龄结为合理,互补性强。课程负费人应具有高境职称的“双师”教师。 .敕材及介考费科(1)常依据本谍程标准编写教材或选用合适教材.教材应充分体现基于面向公司开发的人员应用汤景的设计思想,突出职业IiJ位能力培养的思路。(2)教材应当适合理论基本够用,实践为主题的思想.(3)教材内容应体现先进性、通用性、实用性,将最新参于技术标准、主流技术、主流产品及时纳入教材.便教材紧栗行业发展.4散村庄图文并茂,引用图表要清断精美;教材应融入“互联网+”特色,如荷深版教材或者巳在线上平台开课的教材;语言表迷应深入浅出、文字精练,并力求形成一种灵活.亲切、活
24、泼的语体风格:款科应融入.从而箫加教材的可读性,增强软科对学生的吸引力.本课程便用的教材及叁考姿料如下表所示:序号敕材名爵主出版社出版日期I大数据分析与挖握石胜飞人艮邮电出版社2018.8介才丧科1数据挖握:方法与应用(第2版徐华清华大学出版社2022.42PyIhOn数据希域与机器学习魏伟一,张国治清华大学出版社2021.43败据分析与数格检据(第2版)哈梅.于健,王清华大学出版社2020.9建荣,李雪良4大数据挖掘及应用(第2版王国胤,刘怦,于洪,曾宪华,吴思远清华大学出版社2021.11 .敕学环境本课程建议全部在机房授课,实现过我边做边学一体化教学模式.机房电脑配置要求:内存不少于8G
25、B以上、SU为15以上,系统推荐“in1.,Anaconda.4敬学建议本课程建议使用“项目驱动.任务引领、理实一体”的教学模式.教学过程中,应以学生为中心,教师为主体,引导学生在学中做,做中学,力求做到“教、学*做”一体化。在教学内容组织方式上尽量采用的理论与实际相结合的形式,注重实践的疑果,并将实践环节贯穿课程教学的始终.加强学生对效据统计分析的认识和学赛,培养学生分析问题、解决问题和实际动手能力。教师在教学中应采取多种教学手段荏商教学成I1.如级上线下融合教学、启发式教学,问题导向教学、小组讨论法、学生讲授法等。本谍程的较心目的是由注入深学习并掌握数据采集、处理、分析、统计和可视化等.对
26、于更奉点内容,疑议录制相关微魂视频、适当加大作业量及安排理后实践蜂习。跳议戏上.段下融合教学安排如下:蛟上视叛(5-15分钟)线下课时城上作叱测试线下实践作业20个左右646次6次5.敕学讦价本课程的评价方式为过程性考核和终结性考核相结合的方式。过程性考核主要以整个学期的学习过程中的评价为主.注重培养和激发学生的学习税税性和自悟心。过程性考核主要包括:出勤、课堂表现、平时作业、学习态度、实验作业、阶段性测验等。终结性考核可以定期求考试闭段或开操)或期末考核。跖议本课程采取以下方式及比例进行评价:评价项目平时我现实验作业期末考核考核内容出勤、表现.平时作业实验任务期末考试比例10%30%60%学
27、习积极性评价以青发兴趣、展现个性、发展心智和提防素质为基本理念,以促进学生可拼埃发展为核心.在评价的过程中可对学生参与讨论的积毅态度、自佶心、合作交流意识,以及独立思考的能力、创新思推能力等方面进行学生互评和教师评价,如:1)是否积极主动地参与讨论和分析;2)是否款于表述自己的想法,对自己的观点有充分的自信:3)是否积欢认真地参与模拟实践和应用实践;4)是否敢于尝试从不同角度思考间是,有独到的见解:5)能否理解他人的思路,并在与小姐成员合作交流中得到启发与进步:6)是否有认真反思自己思考过程的意识.6.累发滨源开发与利用根据课程目标、学生实际以及本谍程的理论性和实践等特点,本课程的教学应该空设
28、由文字教材.多堞体课件、线上资源等多种媒体教学资源为一体的配套教材,全套教材各司其职,以文字教材为中心,多媒体教学课件为辅助,线上资源补充,共同完成教学任务,达成教学目标。1 .常见课程费源的开发。利用幻灯片、投影仪、电子教案、视叛资料等,充分利用这些许源创设形象生动的工作情境,激发学生的学习,促进学生对知识的理解和掌提.健议加强常用课程资源的开发,建立多媒体课程资源的数据库,学力实现哥学校多媒体资液的共享,以提高费源利用效率.2 .积极开发和利用网培课程费源。充分利用诸如线上教学平台、电子书籍、电子期刊、数据库、数字图书馆、敖讦网站和电子论坛等网络信息资源,使教学媒体从单一媒体向多种媒体转交;使教学活动从信息的单向传递向双向交互转变:使学生从单独的学习向合作学习校受;力争做到教师上线、课程上戏、学习上线.五、Mt1 .僚直赦争团队课程负责人:主讲教师:2 .责任(1)大数用工程技术专业速设指导委员会把握课程发展方向:(2)大数据教研室主任与课程负责人负责课程的整体建设、内容的调整、课程的持续发展;(3)主讲敖牌负JIt课程的授课过程,主许敬卿与实训教师共同负责课程的实训教学;(4)大数据技术栽哥室主任、课程负责人负责驻督课程的实施,开展教学瞥导工作.六、其它学院:信息工程学院教研室:大数据技术与应用教研室讲制人:教研室主任审核:教学院长复核:湍制时间:2023年8月