购物车中还没有商品,赶紧选购吧!
IBM SPSS数据分析与挖掘实战案例精粹(配光盘)
商 城 价
降价通知
市 场 价
累计评价4
累计销量2
手机购买
商品二维码
配送
服务
当当旗舰店 发货并提供售后服务。
可用积分
可用 0
承诺
  • 正品
  • 包退
  • 闪速
数量
库存  个
5.00
商品评价 5
服务态度 5
发货速度 5
暂无联系方式
  • 商品详情
  • 规格参数
  • 用户评论(4
  • 网友讨论圈
手机购买
商品二维码
加入购物车
价格:
数量:
库存  个

商品详情

商品名称:IBM SPSS数据分析与挖掘实战案例精粹(配光盘)
商品编号:9787302299547
店铺:当当旗舰店
ISBN编号:9787302299547
书名:IBM SPSS数据分析与挖掘实战案例精粹(附光盘),IBM SPSS数据分析与挖掘实战案例精粹(附光盘)
作者:张文彤,钟云飞
作者地区:中国大陆
出版社名称:清华大学出版社
定价:64.00元
开本:16开
是否是套装:否

更多参数>>

编辑推荐

    全书以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据分析精髓的领悟。本书所附光盘包括案例数据和分析程序/流文件,读者可完整重现全部的分析内容。
    本书适合从初学者到专家各个级别的数据分析人员阅读,尤其适合于以下读者群:需要提升实战能力的数据分析专业人员;在市场营销、金融、财务、人力资源管理中需要应用数据分析的人士;从事咨询、科研等工作的专业人士;同时也适合于各专业的本科和研究生作为学习数据分析应用的参考书。

目录


1.1  三种数据分析方法论t3
1.1.1  严格设计支持下的统计
方法论t3
1.1.2  半试验研究支持下的统计
方法论t4
1.1.3  偏智能化、自动化分析的
数据挖掘应用方法论t5
1.2  CRISP-DM方法论介绍t6
1.2.1  概述t6
1.2.2  商业理解t8
1.2.3  数据理解t8
1.2.4  数据准备t9
1.2.5  建立模型t9
1.2.6  模型评价t9
1.2.7  结果部署t10
第2章  数据分析方法体系简介t11
2.1  统计软件中的数据存储格式t11
2.1.1  二维数据表t11
2.1.2  变量的存储类型t12
2.1.3  变量的测量尺度t12
2.2  数据的统计描述与参数估计t13
2.2.1  连续变量的统计描述t13
2.2.2  连续变量的参数估计t16
2.2.3  分类变量的统计描述和参数
估计t18
2.2.4  统计图形体系t21
2.3  常用假设检验方法t24
2.3.1  假设检验的基本原理t25
2.3.2  单变量假设检验方法t26
2.3.3  双变量假设检验方法t28
2.4  多变量模型t31
2.4.1  方差分析/一般线性模型t31
2.4.2  广义线性模型和混合线性
模型t32
2.4.3  回归模型t34
2.4.4  其他常见模型t36
2.5  多元统计分析模型t38
2.5.1  信息浓缩t38
2.5.2  变量间内在关联结构的
探讨t38
2.5.3  数据分类t39
2.5.4  分析元素间的关联t41
2.6  智能统计分析/数据挖掘方法t42
2.6.1  树模型t42
2.6.2  神经网络t43
2.6.3  支持向量机t43
2.6.4  贝叶斯网络t44
2.6.5  *近邻元素分析t44
2.6.6  关联规则与序列分析t44
第3章  IBM SPSS Statistics操作
入门t46
3.1  案例背景t46
3.2  数据文件的读入与变量整理t47
3.2.1  SPSS的基本操作界面t47
3.2.2  数据准备t49
3.3  问卷数据分析t53
3.3.1  生成频数表t53
3.3.2  计算均值t54
3.3.3  对多选题进行描述t55
3.4  项目总结和讨论t56
第4章  IBM SPSS Statistics操作
进阶t57
4.1  案例背景t57
4.1.1  项目背景t57
4.1.2  分析思路t59
4.2  问卷录入t59
4.2.1  开放题的定义t59
4.2.2  单选题的定义t60
4.2.3  多选题的定义t60
4.3  问卷质量校验t62
4.3.1  去除重复记录t62
4.3.2  发现异常值t64
4.3.3  逻辑校验t65
4.4  问卷数据分析t67
4.4.1  问卷加权t67
4.4.2  业务分析t70
4.5  项目总结和讨论t71
第5章  IBM SPSS Modeler操作入门t73
5.1  IBM SPSS Modeler概述t73
5.1.1  IBM SPSS Modeler的界面t73
5.1.2  IBM SPSS Modeler的架构
与产品构成t76
5.2  IBM SPSS Modeler相关操作
与技巧t77
5.2.1  IBM SPSS Modeler的基本
操作t77
5.2.2  IBM SPSS Modeler中的
表达式t79
5.2.3  IBM SPSS Modeler的若干
使用技巧t79
5.3  IBM SPSS Modeler功能介绍t81
5.3.1  数据整理案例t81
5.3.2  探索性数据分析案例t82
5.3.3  建立模型、模型检验与模型
应用案例t83
5.4  案例分析:药物选择决策支持t86
5.4.1  背景介绍t86
5.4.2  数据说明t86
5.4.3  商业理解t87
5.4.4  数据理解t87
5.4.5  数据准备t88
5.4.6  模型建立和评估t89
5.4.7  模型发布t91
5.5  如何进一步学习IBM SPSS
Modelert93
  
第二部分  影响因素发现与数值预测
第6章  酸奶饮料新产品口味测试
研究案例t97
6.1  案例背景t97
6.1.1  研究项目概况t97
6.1.2  分析思路与商业理解t98
6.2  数据理解t98
6.2.1  研究设计框架复查t98
6.2.2  均值的列表描述t99
6.2.3  均值的图形描述t101
6.3  不同品牌的评分差异分析t102
6.3.1  单因素方差分析模型简介t103
6.3.2  品牌作用的总体检验t104
6.3.3  组间两两比较t105
6.3.4  方差齐性检验t108
6.4  两因素方差分析模型分析t108
6.4.1  两因素方差分析模型简介t109
6.4.2  拟合包括交互项的饱
和模型t110
6.4.3  拟合只包含主效应的模型t111
6.4.4  组间两两比较t112
6.4.5  随机因素分析t114
6.5  分析结论与讨论t116
6.5.1  分析结论t116
6.5.2  Benchmark:用还是不用t116
第7章  偏态分布的激素水平影响
因素分析t118
7.1  案例背景t118
7.1.1  研究项目概况t118
7.1.2  分析思路与商业理解t119
7.2  数据理解t119
7.2.1  单变量描述t119
7.2.2  变量关联探索t122
7.3  对因变量变换后的建模分析t127
7.3.1  常见的变量变换方法t127
7.3.2  本案例的具体操作t128
7.4  秩变换分析t131
7.5  利用Cox模型进行分析t132
7.5.1  Cox回归模型的基本原理t133
7.5.2  本案例的具体操作t134
7.6  项目总结与讨论t136
7.6.1  分析结论t136
7.6.2  如何正确选择分析模型t136
第8章  某车企汽车年销量预测案例t138
8.1  案例背景t138
8.1.1  研究项目概况t138
8.1.2  分析思路和商业理解t139
8.2  数据理解t140
8.3  变量变换后的线性回归t142
8.3.1  线性回归模型简介t142
8.3.2  变量变换后拟合线性回归
模型t143
8.3.3  模型拟合效果的判断t146
8.3.4  存储预测值和区间估计值t148
8.4  曲线拟合t148
8.4.1  用曲线估计过程同时拟合
多个曲线模型t149
8.4.2  模型拟合效果的判断t151
8.4.3  模型的预测t153
8.5  利用非线性回归进行拟合t154
8.5.1  模型简介t154
8.5.2  构建分段回归模型t155
8.5.3  不同模型效果的比较t157
8.6  项目总结与讨论t158
8.6.1  分析结论t158
8.6.2  行走在理想与现实之间t158
第9章  脑外伤急救后迟发性颅脑损伤
影响因素分析案例t160
9.1  案例背景t160
9.1.1  研究项目概况t160
9.1.2  分析思路和商业理解t161
9.2  数据理解t161
9.2.1  变量关联的图表描述t161
9.2.2  变量关联的单变量检验t164
9.3  构建二分类Logistic回归模型t167
9.3.1  模型简介t167
9.3.2  初步尝试建模t169
9.3.3  构建*终模型t174
9.4  利用树模型发现交互项t175
9.4.1  模型简介t176
9.4.2  进行树模型分析t178
9.5  使用广义线性过程进行分析t181
9.5.1  模型简介t181
9.5.2  构建仅包括主效应的模型t182
9.5.3  在模型中加入交互项t185
9.6  项目总结与讨论t186
9.6.1  分析结论t186
9.6.2  尺有所短,寸有所长t187
第10章  中国消费者信心指数影响
  因素分析t188
10.1  案例背景t188
10.1.1  项目背景t188
10.1.2  项目问卷t189
10.1.3  分析思路和商业理解t192
10.2  数据理解t193
10.2.1  考察时间、地域对信心
 指数的影响t193
10.2.2  考察性别、职业、婚姻状况
 等对信心指数的影响t195
10.2.3  考察年龄对信心指数的
 影响t196
10.3  标准GLM框架下的建模分析t197
10.3.1  建立总模型t197
10.3.2  两两比较的结果t200
10.4  多元方差分析模型的结果t202
10.4.1  模型简介t202
10.4.2  拟合多元方差分析模型t203
10.5  *优尺度回归t209
10.5.1  方法简介t210
10.5.2  利用*优尺度回归进行
 分析t211
10.6  多水平模型框架下的建模分析t214
10.6.1  模型简介t215
10.6.2  针对时间拟合多水平模型t216
10.7  项目总结与讨论t221
10.7.1  分析结论t221
10.7.2  什么时候运用复杂模型
 来建模t222
  
第三部分  信息浓缩、分类与感知图呈现
第11章  探讨消费者购买保健品的
  动机t225
11.1  案例背景t225
11.1.1  研究项目概况t225
11.1.2  分析思路和商业理解t227
11.2  数据理解t227
11.2.1  单变量描述t227
11.2.2  变量关联探索t228
11.3  利用因子分析进行信息浓缩t229
11.3.1  模型简介t229
11.3.2  因子分析的具体操作t231
11.4  基于因子分析结果进行市场细分t238
11.4.1  不同婚姻状况受访者的
 差异t238
11.4.2  不同品牌保健品使用者的
 因子偏好差异t240
11.5  项目总结与讨论t241
11.5.1  研究结论t241
11.5.2  合理解读因子分析的结果t242
第12章  1988年汉城奥运会男子十项
  全能成绩分析t244
12.1  案例背景t244
12.1.1  项目概况t244
12.1.2  分析思路和商业理解t245
12.2  数据理解t246
12.2.1  单变量描述t246
12.2.2  变量关联性探索t246
12.2.3  尝试初步建模t247
12.3  利用因子分析进行信息浓缩t249
12.3.1  初步分析t249
12.3.2  因子旋转t252
12.3.3  继续寻找更好的分析结果t253
12.3.4  结果存储与发布t254
12.4  主成分回归t255
12.5  将主成分回归方程还原回原始
 变量的形式t257
12.6  项目总结与讨论t257
12.6.1  研究结论t257
12.6.2  正确诠释因子的方差解释
 比例t258
第13章  打败SARSt259
13.1  案例背景t259
13.1.1  研究项目概况t259
13.1.2  分析思路和商业理解t262
13.2  数据理解与数据准备t263
13.2.1  消费者关注的信息t263
13.2.2  突发事件保险产品购买
 倾向t265
13.2.3  未来消费者生活方式的
 变化t267
13.3  “非典”信息关注倾向的多维偏好
 分析t269
13.3.1  模型简介t269
13.3.2  多维偏好分析的SPSS
 操作t270
13.3.3  尝试初步建模t272
13.3.4  引入更多的背景变量t275
13.4  突发事件险种购买倾向的多重
 对应分析t278
13.4.1  模型简介t278
13.4.2  简单对应分析t280
13.4.3  多重对应分析t284
13.5  “非典”对未来生活方式的影响t289
13.5.1  采用多维偏好分析进行
 初步探索t289
13.5.2  换用因子分析进行信息
 汇总t291
13.6  项目总结与讨论t295
13.6.1  研究结论t295
13.6.2  对多维偏好分析等信息浓缩
 方法本质的讨论t297
第14章  住院费用影响因素挖掘t299
14.1  案例背景t299
14.1.1  项目概况t299
14.1.2  分析思路/商业理解t302
14.2  数据理解与数据准备t303
14.2.1  费用数据分布t303
14.2.2  变量合并t305
14.2.3  *值清理t306
14.2.4  病种分布考察t306
14.2.5  变量变换t307
14.3  采用聚类分析寻找费用类型t308
14.3.1  用因子分析汇总信息t308
14.3.2  聚类分析方法简介t310
14.3.3  对费用数据进行聚类分析t312
14.4  住院费用影响因素的神经网络
 分析t315
14.4.1  模型简介t316
14.4.2  初步尝试用神经网络建模t318
14.4.3  对年龄离散化后重新建模t323
14.4.4  构建双因变量神经网络t325
14.4.5  进一步寻找更清晰的结果
 解释t327
14.5  不同疗法疗效与费用比较的神经
 网络分析t328
14.5.1  生成工作用数据集t329
14.5.2  进行神经网络的建模预测t330
14.5.3  模型预测值的比较t332
14.6  项目总结与讨论t334
14.6.1  研究结论t334
14.6.2  数据挖掘方法和经典方法的
 取舍t335
  
第四部分  数据挖掘案例精选
第15章  淘宝大卖家之营销数据
  分析t339
15.1  案例背景t339
15.1.1  卖家张三t339
15.1.2  分析思路和商业理解t340
15.2  利用RFM模型定位促销名单t341
15.2.1  RFM模型简介t341
15.2.2  对数据进行RFM模型
 分析t343
15.3  寻找有重购行为买家的特征t348
15.3.1  数据理解与数据准备t348
15.3.2  利用直销模块寻找重购
 人群的特征t354
15.4  总结与讨论t356
15.4.1  可使用的其他营销分析
 方法t356
15.4.2  研究总结t357
第16章  超市商品购买关联分析t358
16.1  案例背景t358
16.1.1  研究背景t358
16.1.2  分析思路和商业理解t358
16.2  数据准备t359
16.3  商品购买关联分析t362
16.3.1  几种典型关联算法介绍t362
16.3.2  商品购买关联分析t364
16.4  结果应用t369
第17章  电信业客户流失分析t370
17.1  案例背景t370
17.2  商业理解t371
17.2.1  如何定义流失t372
17.2.2  哪些变量可用于预测流失t372
17.2.3  如何定义分析用数据的
 时间窗口t373
17.2.4  如何从分析结果中获取实际
 收益t374
17.3  数据理解与数据准备t374
17.3.1  分析的数据基础t374
17.3.2  生成数据挖掘宽表t376
17.3.3  数据探索性分析t382
17.4  建立模型与模型评估t390
17.4.1  模型的选择t390
17.4.2  建模思路1:聚类t392
17.4.3  建模思路2:用决策树生成
 规则集t394
17.4.4  建模思路3:用神经网络
 生成流失评分t395
17.5  模型的应用及营销预演t399
17.6  总结与讨论t401
17.6.1  研究总结t401
17.6.2  进一步阅读t402
第18章  信用风险评分方法t403
18.1  案例背景t403
18.1.1  引言t403
18.1.2  信用评分的方法t405
18.2  商业理解t406
18.3  数据理解与数据准备t409
18.4  建立模型与模型评估t410
18.4.1  对输入变量分箱t411
18.4.2  用Logistic回归建立信用
 预测模型t415
18.4.3  生成信用评分模型t417
18.4.4  模型检验t420
18.5  对若干问题的说明t422
18.5.1  拒绝推断t422
18.5.2  模型的监控t423
18.5.3  进一步阅读t424
第19章  医疗保险业的欺诈发现t425
19.1  案例背景t425
19.2  商业理解t426
19.3  数据理解与数据准备t427
19.3.1  数据集概况t427
19.3.2  对数据进行描述t429
19.3.3  对数据源合并的考虑t431
19.4  建立模型t432
19.4.1  进行欺诈发现的若干技术
 思路和方法t432
19.4.2  模型1:变量对比发现疑似
 欺诈t434
19.4.3  模型2:通过Benford定律
 发现疑似欺诈t436
19.4.4  模型3:通过对投保人细分
 发现疑似欺诈t439
19.4.5  模型4:发现医疗保健机构
 行为模式异常t441
19.4.6  模型5:使用关联规则发现
 多个医保机构共用投保人
 信息t441
19.4.7  模型6:发现异常诊断与
 处理过程t442
  
19.5  结果发布t444
19.6  进一步阅读t445
第20章  电子商务中的数据挖掘
  应用t446
20.1  案例背景t446
20.1.1  引言t446
20.1.2  网络数据分析的分类t447
20.2  数据理解t448
20.2.1  分析的数据基础t448
20.2.2  网络数据的常见来源t450
20.3  数据准备t452
20.3.1  识别访问用户t453
20.3.2  从网络日志中提取有用
 信息t454
20.3.3  合并网络日志与相关数据t455
20.4  建立模型与模型发布t455
20.4.1  对访问建立模型t456
20.4.2  自动选择模型功能及组合
 模型的应用t459
20.4.3  对访问者建立模型t462
20.4.4  产品特征模型t464
20.5  进一步阅读t465
  
附    录
附录A  本书光盘内容介绍t469
附录B  SPSS 软件的安装与激活t470
附录C  书中统计方法、模型与知识点
索引t472
附录D  IBM SPSS Statistics函数
一览表t474
附录E  IBM SPSS Modeler节点
功能简介t485
  
  
  
参考文献t495
  
  
  
后记t498

内容介绍

    全书以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据分析精髓的领悟。本书所附光盘包括案例数据和分析程序/流文件,读者可完整重现全部的分析内容。
    本书适合从初学者到专家各个级别的数据分析人员阅读,尤其适合于以下读者群:需要提升实战能力的数据分析专业人员;在市场营销、金融、财务、人力资源管理中需要应用数据分析的人士;从事咨询、科研等工作的专业人士;同时也适合于各专业的本科和研究生作为学习数据分析应用的参考书。

作者介绍


张文彤 博士,数据挖掘、市场研究、统计软件教学与应用领域专家,现任全球第八大市场研究集团INTAGE中国公司全国技术总监。曾在复旦大学任教数载,期间协助SPSS在中国建立并完善了其培训体系,是国内知名的SPSS培训师之一。在数据挖掘、市场研究、医药数据分析等领域均经验丰富,曾负责为知名跨国公司完成了中国城市女性市场细分模型、销量预测模型、商圈选址模型等各类项目,并协助完成多项IT、电信、税务、银行等行业的数据挖掘项目。

钟云飞  数据分析专家,拥有超过10年的统计分析与数据挖掘在各行业的软件应用及咨询经验,历任SPSS、SAS软件公司首席咨询顾问,目前在国际商业机器(中国)有限公司软件部工作,从事SPSS软件企业应用的推广工作。主要关注统计分析与数据挖掘在银行、电信、政府、保险、零售等行业的应用实践,致力于使用数据分析方法帮助企业和政府组织从数据中获取有价值的信息,从而提高管理水平。

基本信息
商品名称: IBM SPSS数据分析与挖掘实战案例精粹(配光盘) 开本: 大32开
作者: 张文彤 等编著 定价: 64.00
ISBN号: 9787302299547 出版时间: 2013-02-01
出版社: 清华大学出版社 印刷时间: 2013-02-01
版次: 1 印次: 1
100 好评率 %
此商品还没有设置买家印象,陪我一起等下嘛
a***a
2020-09-29 20:41:00
印刷质量:印刷质量好!书内容也很全面,关于SPSS问题就在里面查询,很方便!
0 0
s***i
2019-08-23 17:43:00
书不错,就是后边案例讲的不太详细,给的附带光盘一张dvd竟然只有一两百兆,那你用cd盘刻多好啊,浪费一张dvd盘
0 0
d***u
2019-07-25 19:50:00
不错!
0 0
z***2
2019-07-06 18:57:00
非常好
0 0
对比栏

1

您还可以继续添加

2

您还可以继续添加

3

您还可以继续添加

4

您还可以继续添加