《机器学习基础及应用》教案第8课使用决策树算法实现分类与回归.docx
《《机器学习基础及应用》教案第8课使用决策树算法实现分类与回归.docx》由会员分享,可在线阅读,更多相关《《机器学习基础及应用》教案第8课使用决策树算法实现分类与回归.docx(20页珍藏版)》请在优知文库上搜索。
1、课题使用决策树算法实现分类与回归课时2课时(90min)教学目标知识技能目标:(1)掌握决策树算法用于分类任务的基本原理(2)掌握决策树算法用于回归任务的基本原理(3)掌握ID3算法、C4.5算法和CART算法的基本原理(4)掌握决策树算法的Skleam实现方法(5)能够使用决策树算法训练分类模型(6)能够使用决策树算法训练回归模型(7)能够编写程序,寻找最佳的决策树深度值素质目标:(I)关注国家资讯,增强民族意识,培养爱国主义精神。(2)理解决策树算法的基本原理,培养勇为人先的创新精神教学重难点教学重点:决策树算法用于分类任务和回归任务的基本原理;ID3算法、C4.5算法和CART算法的基本
2、原理;决策树算法的Sklearn实现方法教学难点:使用决策树算法训练分类和回归模型;编写程序,寻找最佳的决策树深度值教学方法案例分析法、问答法、讨论法、i井授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,提前了解决策树算法的相关知识【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问题导入【教师】要求学生扫码观看”决策树算法的基本原理”视频,提出以下问题:(1)决策树算法用于分类任务的基本原理是怎样的?(2)决策树算法用于回归任务的基本原理是
3、怎样的?(3)常用的构造决策树的算法有哪几种?【学生】思考、举手回答传授新知【教师】通过学生的回答引入要讲的知识,介绍决策树算法的基本原理、决策树算法的SkIearn实现的相关知识6.1 决策树算法的基本原理决策树(decisiontree)是一种基于树结构的机器学习模型,可以用于分类与回归任务。在机器学习中,决策树分为分类树和回归树,当对样本的所属类别进行预测时使用分类树;当对样本的某个值进行预测时使用回归树。6.1.1 决策树算法的原理分析1.分类决策树的基本原理分类任务的目标是通过对雌集的学习,总结一种决策规则,预测未知样本的类别。使用决策树算法进行分类的原理是给定一个训练数据集,根据训
4、练集构造决策树,根据决策树写出对应的决策规贝k然后使用决策规则对待分类样本”进行分类.【教师】通过多媒体展示“购买计算机的客户数据集“表格,并进彳济并解例如,购买计算机的客户数据集(见表6-2),使用决策树算法训练模型,可构造决策树.表62购买计算机的客户数据集客户编号年龄收入是否为学生信用情况购买计算机情况I青年高否一般没有购买2青年高否好没有购买3中年高否一般已购买4老年中否一般已购买5老年高是一般已购买6老年高是好没有购买7中年中是好已购买8青年中否一般没有购买9青年高是一般已购买10老年中是一般已购买11青年中是好已购买12中年中否好已购买13中年高是一般已购买14老年中否好没有购买【
5、教师】通过多媒体展示“分类决策树”图片(详见教材),并进彳五并解从图可以看出,决策树的根节点和内部节点为数据集中的特征属性,叶节点为类别标签,根据特征属性的取值来判断进入哪一个分支。决策树分类采用自顶向下的递归方式,在决策树内部节点进行属性值的比较,根据不同的属性值判断从该节点向下的分支,在叶节点上得到结论。所以,从决策树的根节点到叶节点的每一条路径都对应一条合取规则。例如,图6的决策树对应的决策规则为If年龄=青年人不是学生Then没有购买计算机If年龄=青年人是学生Then已购买计算机If年龄=中年Then已购买计算机If年龄=老年人信用情况=好Then没有购买计算机If年龄=老年信用情况
6、二一般Then已购买计算机使用这些决策规则就可以对新的待测样本的类别进行判定。例如,新样本(老年,收入中等,不是学生,信用一般)的类别判定为已购买计算机。2.回归决策树的基本原理回归任务研究的是一组变量与另一组变量之间的关系,其预测结果是连续的数值。回归决策树的基本原理是给定一个数据集,根据数据集构造决策树,根据决策树将特征空间划分为若干单元,每个单元有一个特定的输出(如训练集对应样本的平均值).对于新的待测样本,只要按照特征值将其归到某个单元,即可得到相应的输出值。【教师】通过多媒体展示“回归决策树图片和回归决策树测试数据集“表格(详见教材),井进彳五并解例如,回归决策树测试数据集(见表6-
7、3),使用决策树算法训练模型,可构造如图所示的决策树(使用决策树算法对表6-3中的数据集进行回归预测的程序见例6-5)表6-3回归决策树测试数据集XyXy142839510719回归任务中,数据集的特征变量一般是连续的数值。因此,决策树的根节点和内部节点一般为数据集的特征属性,每个分支为特征属性值中两相邻点的中值(将特征属性值进行排序,然后取相邻两点的中值),叶节点为模型的输出值。根据图6-2中的回归决策树可将特征空间划分为多个单元,每个单元有一个特定的输出值(图6-2中的输出值为各对应点的平均值),如图6-3所示。这样,对新的待测样本进行预测时,只要按照特征值将其归到某个单元,即可得到相应的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习基础及应用 机器 学习 基础 应用 教案 使用 决策树 算法 实现 分类 回归
