当前位置: 首页 > news >正文

IBM SPSS Modeler分类决策树C5.0模型分析空气污染物数据

全文链接:http://tecdat.cn/?p=30752

如何通过方法有效的分析海量数据,并从其中找到有利的资讯已经成为一种趋势点击文末“阅读原文”获取完整代码数据)。

而决策树算法是目前在进行数据分析时很常用的方法。本文将使用IBM SPSS Modeler进行实践,介绍决策树在空气污染预测领域的实践案例。

相关视频

分类预测模型的构建流程,具体步骤如下:

(1)数据处理 :审核数据,过滤掉含有缺失值的数据记录。

(2)划分数据集,训练集70%,测试集30% 。

(3)构建模型时的参数设置 。

(4)构建模型:构建C5.0模型。

(5)结果评估,用测试集数据运行得到的运行结果,对模型采用命中率评估两个模型的预测效果。

加入表节点

5403882b01443257ad4e16906c077068.png

读取数据

335e8c8d4bb9ce831278077da8bd117b.png

添加“抽样”节点

随机抽取70%的样本作为训练集

3a7c867536e9289850ffe0de73aa0c85.png

“C5.0”节点

f900082a9cf08c828192871724bf5131.png

生成的决策树模型,并对测试数据进行预测

得到测试数据的分类结果的准确度

7365b03359acd411d26e3d49ad936fd1.png

预测分类结果

b532e821ef563252dbe47928db7e37c3.png

有88.1%的测试样本的预测值和实际值相符。

并且得到如下的决策树模型:

509be64c1317fb19cd69035948204ab4.png


点击标题查阅往期内容

232d26f5a9445016cbfd7921ed940603.png

数据分享|PYTHON用决策树分类预测糖尿病和可视化实例

outside_default.png

左右滑动查看更多

outside_default.png

01

8456af13863bbed6c02beeb11156e293.png

02

7faee0fda84f72ac0760ffbacaaca952.png

03

11f307528edc97320f4ac734fb7890dd.png

04

66901dc9bbc4839c878cfd4f6a5d7bfd.png

其中变量的重要性如下图所示:

6fcf088d453c53e375c687bf98e503ac.png

从结果可以看到,首要污染物类型与AQI、NO2还有O3等变量有关。其中AQI对首要污染物类型的结果具有最重要的影响。

C5.0是在C4.5的基础上发展起来的。C5.0 算法是用信息增益(根节点的熵减去该拆分的熵)来度量拆分纯度的。第一次拆分某一字段,划分出相对应的样本子集。然后继续拆分这些样本子集,一般情况下使用的是另一字段进行拆分,一直循环这样一个过程,直到满足拆分终止条件。最后,若生成的树出现过度拟合的状况,则要修剪那些缺乏价值的样本子集。

90696106f116aede094832bf6d33c08f.jpeg

本文中分析的数据分享到会员群,扫描下面二维码即可加群!

e49556fa7d383c1cad721960091cfa5f.png

f6a18fbf1fa913f214e552524f35a386.jpeg

点击文末“阅读原文”

获取全文完整代码数据资料。

本文选自《IBM SPSS Modeler分类决策树C5.0模型分析空气污染物数据》。

点击标题查阅往期内容

数据分享|Spss Modeler关联规则Apriori模型、Carma算法分析超市顾客购买商品数据挖掘实例

数据分享|Python用Apriori算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

【视频】关联规则模型、Apriori算法及R语言挖掘商店交易数据与交互可视化|数据分享

R语言用关联规则和聚类模型挖掘处方数据探索药物配伍中的规律

用SPSS Modeler的Web复杂网络对所有腧穴进行关联规则分析

PYTHON在线零售数据关联规则挖掘APRIORI算法数据可视化

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

R语言关联挖掘实例(购物篮分析)

python关联规则学习:FP-Growth算法对药品进行“菜篮子”分析

基于R的FP树fp growth 关联数据挖掘技术在煤矿隐患管理

python关联规则学习:FP-Growth算法对药品进行“菜篮子”分析

通过Python中的Apriori算法进行关联规则挖掘

Python中的Apriori关联算法-市场购物篮分析

R语言用关联规则和聚类模型挖掘处方数据探索药物配伍中的规律

在R语言中轻松创建关联网络

python主题建模可视化LDA和T-SNE交互式可视化

R语言时间序列数据指数平滑法分析交互式动态可视化

用R语言制作交互式图表和地图

如何用r语言制作交互可视化报告图表

5d788a815c4ec18a9f534cdbdba14ff9.png

de574548de56937cf0178f4dfdc4d2c5.jpeg

1fd5d97899ff8150c5e5ae5f67de7411.png

相关文章:

  • 软件测试工程师,如何工资过万?(经验之谈)
  • TextMeshPro源码移植-替换掉PackageManager
  • 【校招VIP】[推电影项目]产品的规划和商业化分析
  • chatGPT与世界杯的故事:人工智能的双重面对
  • 信号相角位移量的计算与信号位移计算-附Matlab代码
  • 小红书店铺需不需要开?在小红书开店需要注意什么
  • 通过图卷积网络从单词语义学习到句子句法,用于基于方面的情感分析
  • Springboot你写我评小说同好交流网站hp7zh计算机毕业设计-课程设计-期末作业-毕设程序代做
  • GitHub上架即巅峰!《Spring Cloud微服务架构实战》标星已超30k
  • ADI的DSP开发软件:CCES软件的使用说明(很早期写的一点心得)
  • Webpack完整打包流程分析
  • ubuntu 20.04 设置DNS
  • 小型扫雪机结构设计
  • Day17 | 每天五道题
  • 无人机边缘计算中的计算卸载——Stackelberg博弈方法论文复现附matlab代码
  • 【明天截稿】Wiley出版社,传感器网络与电路类SCI,仅2-3个月左右录用
  • Matplotlib学习笔记(第一章)
  • 做一个公司网站大概要多少钱?
  • MySQL 数据库主从复制
  • 分布式文件存储系统FastDFS[1]-介绍以及安装
  • 电加热油锅炉工作原理_电加热导油
  • 大型电蒸汽锅炉_工业电阻炉
  • 燃气蒸汽锅炉的分类_大连生物质蒸汽锅炉
  • 天津市维修锅炉_锅炉汽化处理方法
  • 蒸汽汽锅炉厂家_延安锅炉厂家
  • 山西热水锅炉厂家_酒店热水 锅炉
  • 蒸汽锅炉生产厂家_燃油蒸汽发生器
  • 燃煤锅炉烧热水_张家口 淘汰取缔燃煤锅炉
  • 生物质锅炉_炉
  • 锅炉天然气_天燃气热风炉