内容简介
数据分析方法就是解决大数据分析与应用的重要方法,已成为自然科学和社会科学各个学科研究者必备的知识。MATLAB是一套高性能的数值计算和可视化软件,是实现数据分析与处理的有效工具。全书共分7章,主要内容包括:MATLAB软件简介,数据处理的基本方法、回归模型、判别分析、主成分分析与典型相关分析、聚类分析、数据模拟方法、应用神经网络进行模式识别和预测。此外,每章除了习题还安排了紧密联系实际的综合性、分析性实验内容。
目录
前言教学建议第1章 MATLAB基础11.1 数据分析与MATLAB11.1.1 数据分析概述11.1.2 MATLAB在数据分析中的作用21.2 MATLAB基础概述31.2.1 MATLAB的影响31.2.2 MATLAB的特点与主要功能31.2.3 MATLAB主界面与常用窗口41.2.4 MATLAB的联机帮助71.2.5 工具箱及其在线帮助81.3 MATLAB基本语法101.3.1 数据类型101.3.2 操作符与运算符121.3.3 MATLAB命令函数141.4 数组和矩阵运算141.4.1 数组的创建与运算141.4.2 矩阵的输入与运算151.5 M文件与编程201.5.1 M文件编辑/调试器窗口201.5.2 M文件211.5.3 控制语句的编程221.6 MATLAB通用操作实例25习题128第2章 数据描述性分析292.1 基本统计量与数据可视化292.1.1 一维样本数据的基本统计量292.1.2 多维样本数据的统计量362.1.3 样本数据可视化392.2 数据分布及其检验452.2.1 一维数据的分布与检验452.2.2 多维数据的正态分布检验482.3 数据变换522.3.1 数据属性变换522.3.2 Box-Cox变换552.3.3 基于数据变换的综合评价模型57习题259实验1 数据统计量及其分布检验61第3章 回归分析633.1 一元回归模型633.1.1 一元线性回归模型633.1.2 一元多项式回归模型673.1.3 一元非线性回归模型693.1.4 一元回归建模实例763.2 多元线性回归模型793.2.1 多元线性回归模型及其表示793.2.2 MATLAB的回归分析命令823.2.3 多元线性回归实例893.3 逐步回归923.3.1 最优回归方程的选择923.3.2 引入变量和剔除变量的依据933.3.3 逐步回归的MATLAB实现943.4 回归诊断963.4.1 异常点与强影响点诊断963.4.2 残差分析1003.4.3 多重共线性诊断102习题3106实验2 多元线性回归与逐步回归110第4章 判别分析1114.1 距离判别分析1114.1.1 判别分析的概念1114.1.2 距离的定义1114.1.3 两个总体的距离判别分析1144.1.4 多个总体的距离判别分析1194.2 判别准则的评价1214.3 贝叶斯判别分析1244.3.1 两个总体的贝叶斯判别1244.3.2 多个总体的贝叶斯判别1284.3.3 平均误判率1304.4 K近邻判别与支持向量机135习题4141实验3 距离判别与贝叶斯判别分析145第5章 主成分分析与典型相关分析1475.1 主成分分析1475.1.1 主成分分析的基本原理1475.1.2 样本主成分分析1545.2 主成分分析的应用1585.2.1 主成分分析用于综合评价1585.2.2 主成分分析用于分类1615.2.3 主成分分析用于信号分离1635.3 典型相关分析1665.3.1 典型相关分析的基本原理1665.3.2 样本的典型变量与典型相关系数1695.3.3 典型相关系数的显著性检验1705.3.4 典型相关分析实例1725.4 趋势性与属性相关分析应用实例1775.4.1 Cox-Stuart趋势检验1775.4.2 属性数据分析178习题5180实验4 主成分分析与典型相关分析184第6章 聚类分析1876.1 距离聚类1876.1.1 聚类的思想1876.1.2 样品间的距离1886.1.3 变量间的相似系数1906.1.4 类间距离与递推公式1926.2 谱系聚类1936.2.1 谱系聚类的思想1936.2.2 谱系聚类的步骤1946.2.3 谱系聚类的MATLAB实现1966.3 K均值聚类2006.3.1 K均值聚类的思想2006.3.2 K均值聚类的步骤2006.3.3 K均值聚类的MATLAB实现2016.4 模糊均值聚类2036.4.1 模糊C均值聚类2036.4.2 模糊减法聚类2056.5 聚类的有效性2076.5.1 谱系聚类的有效性2076.5.2 K均值聚类的有效性2096.5.3 模糊聚类的有效性211习题6212实验5 聚类方法与聚类有效性215第7章 数值模拟分析2177.1 蒙特卡罗方法与应用2177.1.1 蒙特卡罗方法的基本思想2177.1.2 随机数的产生与MATLAB的伪随机数2187.1.3 蒙特卡罗方法应用实例2197.2 BP神经网络及应用2277.2.1 人工神经元及人工神经元网络2277.2.2 BP神经网络2287.2.3 MATLAB神经网络工具箱2307.2.4 BP神经网络应用实例232习题7239实验6 数值模拟240参考文献241
前言/序言
前言 自本书第1版出版以来,我们的社会已进入大数据时代,数据分析方法越来越受到人们的重视,许多学校选用了本书作为教材,并取得了良好的教学效果。同时分析数据的MATLAB软件也在不断地升级与更新,功能越来越强大、越来越智能化。为了让读者更好地学习与掌握数据分析方法,我们对第1版进行了修订。这次修订仍然保持原教材的基本框架与内容体系,但对部分章节的例题数据进行了更新,涉及软件更新的部分也对原书的程序进行改编与优化,补充了部分更具有现实意义的数据分析例题与习题,力求体现三方面的特点: 第一,通过例题或案例进一步加强数据分析理论与方法的应用,着重培养学生解决实际数据分析问题的能力,提高综合分析问题的素质。 第二,通过对原教材的例题、实验问题与习题进行调整,更新数据和增加不同领域的数据分析问题,使得涉及的问题更贴近实际,从而进一步提高学生的学习兴趣和学习效率。 第三,通过补充、完善原教材的理论与方法内容,以适应软件工具的升级与更新,使得教学更简便、过程更有效,进一步培养学生的创新能力。 这次修订工作仍由吴礼斌、李柏年担任主编,所有例题程序均在MATLAB(2014a)中验证通过,并打包放在华章网站(http://www.hzbook.com)供下载使用。 编者教学建议在教学过程中,一要重视数据分析原理的介绍,二要重视MATLAB程序编写的算法分析,三要重视每章的综合性实验教学。学生应具有计算机高级语言编程基础,学习过高等数学、线性代数、概率论与数理统计等课程。 建议总教学时数为54学时,其中综合实验为24学时。建议课堂教学在计算机多媒体机房内完成,实现“讲与练”结合,实验课要求学生提交实验报告。具体各章的教学时数、内容和要求可作如下安排: 第1章 MATLAB基础 (6学时,其中2学时实验)教学内容:MATLAB与数据分析;MATLAB的基本界面操作;矩阵的基本运算;MATLAB编程与M文件;MATLAB与Excel数据的读写交换。 教学要求:熟练掌握MATLAB的基本界面操作;理解运算符、操作符、基本数学函数命令等的功能与调用格式;掌握矩阵的运算;熟练掌握选择、循环语句的编程;掌握建立M文件的方法;了解MATLAB与Excel数据的读写交换。 第2章 数据描述性分析(8学时,其中2学时实验)教学内容:基本统计量(如均值、方差、分位数等)与数据可视化;数据分布与检验(一元与多元数据);数据变换(无量纲化、Box-Cox变换等)。 教学要求:熟练掌握利用MATLAB计算基本统计量与数据可视化;掌握jbtest与lillietest关于数据的正态性检验;掌握协方差矩阵相等的检验方法;理解数据变换的意义与方法。 第3章 回归分析(8学时,其中4学时实验)教学内容:一元回归模型(线性与非线性回归模型);多元线性回归模型;逐步回归分析;残差分析。 教学要求:理解回归分析的原理;熟练掌握MATLAB回归分析的命令;会应用MATLAB回归模型类建立回归模型;掌握非线性回归的基本方法以及MATLAB实现;掌握逐步回归的MATLAB方法;掌握残差分析。 第4章 判别分析(8学时,其中4学时实验)教学内容:距离判别分析;贝叶斯判别分析;判别准则的评价。 教学要求:理解判别分析的原理;熟练掌握MATLAB软件进行距离判别与贝叶斯判别的方法和步骤;掌握判别分析的回代误判率与交叉误判率的计算;掌握解决实际判别问题的建模方法。 第5章 主成分分析与典型相关分析(8学时,其中4学时实验)教学内容:主成分分析的原理(总体主成分的定义、计算、性质,样本主成分计算方法);主成分分析的应用(基于主成分分析的综合评价、分类、信号分离等);典型相关分析(原理,典型相关系数计算、检验,样本数据典型相关变量);典型相关分析应用实例;时间序列的趋势性与列联表分析。 教学要求:理解主成分与典型相关分析的原理;熟练掌握利用MATLAB进行主成分分析的计算步骤;掌握MATLAB进行典型相关分析的计算步骤;掌握具体实际问题典型相关分析结果的合理解释;了解趋势性与列联表分析。 第6章 聚类分析(8学时,其中4学时实验)教学内容:距离聚类分析(向量距离、类间距离);谱系聚类与K均值聚类;模糊均值聚类(模糊C均值聚类,模糊减法聚类);聚类的有效性。 教学要求:理解聚类的思想与原理;熟练掌握MATLAB关于各种样品距离与类间距离的计算方法;会作谱系聚类图;掌握应用MATLAB计算各种聚类的命令;掌握聚类效果分析方法及程序的实现。 第7章 数值模拟分析(8学时,其中4学时实验)教学内容:蒙特卡罗方法与应用(思想及应用、MATLAB的伪随机数);BP神经网络与应用(神经网络的概念、BP神经网络、MATLAB神经网络工具箱、BP神经网络的预测与判别)。 教学要求:理解蒙特卡罗方法;掌握用MATLAB生成伪随机数的方法;掌握伪随机数的应用;理解神经网络的基本思想;掌握MATLAB实现神经网络的预测与判别。
MATLAB数据分析方法(第2版) 电子书 下载 mobi epub pdf txt