前 言
所谓艺术,就是指如果只靠系统学习既有的知识体系,但自身不具备相当天赋,或者没有经过长期实战操作以积累经验、激发灵感的话就始终难以登堂入室成为大师的那些学科,音乐、舞蹈、绘画等无不如此。而大英百科全书恰恰就把统计学定义为“一门收集数据、分析数据,并根据数据进行推断的艺术和科学”。显然,作为一门应用学科,统计学非常强调实战能力,一名出色的统计师需要通过经历各种各样的实战分析项目来总结经验和吸取教训以持续成长,光靠操作教科书上的那些标准案例,只能成为工匠,不能成为大师。
近年来,随着计算机技术的飞速发展,统计软件工具出现了日新月异的变化,大大提高了统计工具的可用性。分析工具的高度易用性和实战需求的同步发展,促使各行各业对统计分析和数据挖掘人员的需求呈现爆炸性增长,远远超过了正常培养周期能够提供的数量,而广大统计分析人员希望能够得到一本完全从实战操作的角度出发,而不是单纯以介绍某一种统计软件的角度出发的参考书以迅速帮助自己提升实战能力的愿望,也因之而变得更为迫切。这也是当初笔者考虑编写本书的初衷。
本书定位为实战类书籍,第1版自出版以来虽然受到了广大读者的热烈追捧,但也发现了在内容安排上仍然存在着一些不尽如人意的地方。
(1) 第1版在同一本书里同时讲解IBM SPSS Statistics和IBM SPSS Modeler 两种软件,方法体系则同时涉及传统的统计分析和数据挖掘两种体系,虽然更大范围地满足了读者需求,但也给很多读者对内容的理解和消化造成了困扰。
(2) 第1版在设计上没有太多地考虑简单方法和数据操作介绍,直接切入了综合案例,原意是希望读者学习完笔者的其余教程之后再使用本书来提高,但实际使用中,确实有很多读者将本书作为SPSS的第一本书使用,这样无疑增加了学习难度。
有鉴于此,在第2版中笔者将数据挖掘拆分出来单独成书,本书将专门讨论数据分析的实战案例。在修订原有案例的同时,基于IBM SPSS Statistics 24的最新功能补充了数据整理和描述了一些实践案例,增加了Python插件等新功能的使用操作,并增补了信效度检验等一些新的复杂案例,使初学者直接阅读本书的难度降低,而老用户则可以体会到新版软件的最新功能,真正做到兼顾不同的读者层次。对于不同的读者群而言,他们各自能从本书得到以下帮助。
(1) 入门:对于IBM SPSS Statistics的新用户而言,本书显然是最佳的学习软件操作和实战技能的教科书,本书采用相应软件的最新版本,就统计分析中的一些典型案例进行了深入浅出的全面介绍,用户只需要按照书中的讲解顺序依次操作,就可以真正习得相应的数据分析实战操作能力。
(2) 提升:对于已经熟悉相应SPSS系列产品如何使用的老用户而言,本书就是他们渴望多年的“专家教程”,笔者在案例中真正展示的并非简单的软件操作,而是完整的统计思维和实战分析思路,已有数据分析基础的读者通过对这些案例的学习,必然能更快地跨越从理论到实战的鸿沟,从而使自己对软件工具的掌握和实战操作能力都得到真正的提升。
(3) 领悟:对资深的统计分析人员而言,其对分析工具的应用早已超越了具体某个公司的产品层面,达到“不滞于物,草木竹石皆可为剑”的地步,但本书仍然具有很高的参考价值,因为软件仅仅是实现工具,其背后的统计思维、统计方法、基本原则等都完全相同,但不同的人在面对相同问题时所采用的分析流程、处理方式等又各有千秋,通过对书中案例的学习、参照和比较,分析人员必然能够起到举一反三的效果,从而真正对实战操作达到“悟”的境地。
本书由张文彤、钟云飞、王清华共同编写,其中第1章由张文彤和钟云飞共同编写,第3章由王清华和张文彤共同编写,其余各章由张文彤编写。
希望本书能够帮助读者更加深入地了解数据分析,从而进一步促进数据分析在国内的普及。也希望广大读者能一如既往地踊跃提出自己使用中的宝贵意见和建议,使本书再版时能够更上一层楼,更完美地满足大家的学习和工作需求。
编 者