应用预测建模
作者:[美]马克斯·库恩著;马恩驰译
出版:机械工业出版社 2016.4
丛书:数据科学与工程技术丛书
页数:409
定价:99.00 元
ISBN-13:9787111533429
ISBN-10:7111533429 
去豆瓣看看    译者序
  前言
  第1章导论
  1.1预测与解释
  1.2预测模型的关键部分
  1.3专业术语
  1.4实例数据集和典型数据场景
  1.5概述
  1.6符号
  第一部分一般策略
  第2章预测建模过程简介
  2.1案例分析:预测燃油效能
  2.2主题
  2.3总结
  第3章数据预处理
  3.1案例分析:高内涵筛选中的细胞分组
  3.2单个预测变量数据变换
  3.3多个预测变量数据变换
  3.4处理缺失值
  3.5移除预测变量
  3.6增加预测变量
  3.7区间化预测变量
  3.8计算
  习题
  第4章过度拟合与模型调优
  4.1过度拟合的问题
  4.2模型调优
  4.3数据分割
  4.4重抽样技术
  4.5案例分析:信用评分
  4.6选择调优参数值
  4.7数据划分建议
  4.8不同模型间的选择
  4.9计算
  习题
  第二部分回归模型
  第5章衡量回归模型的效果
  5.1模型效果的定量度量
  5.2方差偏差的权衡
  5.3计算
  第6章线性回归及其扩展
  6.1案例分析:定量构效关系建模
  6.2线性回归
  6.3偏最小二乘法
  6.4惩罚模型
  6.5计算
  习题
  第7章非线性回归模型
  7.1神经网络
  7.2多元自适应回归样条
  7.3支持向量机
  7.4K近邻
  7.5计算
  习题
  第8章回归树与基于规则的模型
  8.1简单回归树
  8.2回归模型树
  8.3基于规则的模型
  8.4装袋树
  8.5随机森林
  8.6助推法
  8.7Cubist
  8.8计算
  习题
  第9章溶解度模型总结
  第10章案例研究:混凝土混合物的抗压强度
  10.1模型构建策略
  10.2模型性能
  10.3优化抗压强度
  10.4计算
  第三部分分类模型
  第11章分类模型的效果度量
  11.1类预测
  11.2评估预测类
  11.3评估类概率
  11.4计算
  第12章判别分析和其他线性分类模型
  12.1案例分析:预测是否成功申请经费
  12.2逻辑回归
  12.3线性判别分析
  12.4偏最小二乘判别分析
  12.5惩罚模型
  12.6最近收缩质心
  12.7计算
  习题
  第13章非线性分类模型
  13.1非线性判别分析
  13.2神经网络
  13.3灵活判别分析
  13.4支持向量机
  13.5K近邻
  13.6朴素贝叶斯
  13.7计算
  习题
  第14章分类树与基于规则的模型
  14.1基本的分类树
  14.2基于规则的模型
  14.3装袋决策树
  14.4随机森林
  14.5助推法
  14.6C5.0
  14.7比较两种分类预测变量编码方式
  14.8计算
  习题
  第15章经费申请模型的总结
  第16章对严重类失衡的补救方法
  16.1案例分析: 预测房车保险所有权
  16.2类失衡的影响
  16.3模型调优
  16.4选择截点
  16.5调整先验概率
  16.6不等案例权重
  16.7抽样方法
  16.8成本敏感度训练
  16.9计算
  习题
  第17章案例研究:作业调度
  17.1数据切分和模型策略
  17.2结果
  17.3计算
  第18章衡量预测变量重要性
  18.1数值结果变量
  18.2分类结果变量
  18.3其他方法
  18.4计算
  习题
  第19章特征选择介绍
  19.1使用无信息预测变量的结果
  19.2减少预测变量个数的方法
  19.3绕封法
  19.4过滤法
  19.5选择偏差
  19.6案例分析:预测认知损伤
  19.7计算
  习题
  第20章影响模型表现的因素
  20.1第Ⅲ类错误
  20.2结果变量的测量误差
  20.3预测变量的测量误差
  20.4连续变量离散化
  20.5模型预测何时是可信的
  20.6大样本的影响
  20.7计算
  习题
  附录
  附录A各种模型的总结
  附录BR语言介绍
  附录C值得关注的网站
  参考文献
  马克斯·库恩(Max Kuhn)
  康涅狄格州格罗顿市辉瑞全球研发非临床统计部主任,在制药和诊断行业已有近20年应用预测模型的经验,他还是很多R包的作者。
  谢尔·约翰逊(Kjell Johnson)
  博士,在药物研发和其他行业有近20年统计咨询和预测建模经验,曾任辉瑞全球研发统计部主任。 
  这是一本专注于预测建模的数据分析书,意在为实践者提供预测建模过程的指导,比如如何进行数据预处理、模型调优、预测变量重要性度量、变量选择等。读者可以从中学到许多建模方法以及提高对许多常用的、现代的有效模型的认识,如线性回归、非线性回归和分类模型,涉及树方法、支持向量机等。第10章和第17章分别研究混凝土混合物的抗压强度和作业调度两个案例。
  作者重实际应用,轻数学理论,从实际数据出发,结合开源软件R语言来求解实际问题,详细给出R代码和处理的步骤。R包AppliedPredictiveModeling包含书中使用的数据,以及可以用于重复书中每一章分析的R代码,让读者能在一定精度范围内重复本书的结果,并自然地将书中的预测建模方法应用到自己的数据上。章后附有习题,方便读者巩固所学。
  这本业界互相推荐的好书,适合所有数据分析人员阅读。
比价列表