正版 机器学习 周志华 西瓜书 机器学习基础知识 机器学习方法 人工智能 权威的机器学习中文教科

正版 机器学习 周志华 西瓜书 机器学习基础知识 机器学习方法 人工智能 权威的机器学习中文教科 pdf epub mobi txt 电子书 下载 2025

周志华著 著
图书标签:
  • 机器学习
  • 人工智能
  • 周志华
  • 西瓜书
  • 机器学习基础
  • 机器学习方法
  • 模式识别
  • 数据挖掘
  • 算法
  • 教科书
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 恒久图书专营店
出版社: 清华大学出版社
ISBN:9787302423287
商品编码:10717804774
包装:平装
开本:16
出版时间:2016-01-01

具体描述



商品参数
机器学习
            定价 88.00
出版社 清华大学出版社
版次 1
出版时间 2016年01月
开本 16
作者 周志华 著
装帧 平装
页数
字数
ISBN编码 9787302423287


内容介绍

机器学习是计算机科学与人工智能的重要分支领域. 本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面. 全书共16 章,大致分为3 个部分:第1 部分(第1~3 章)介绍机器学习的基础知识;第2 部分(第4~10 章)讨论—些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3 部分(第11~16 章)为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等. 每章都附有习题并介绍了相关阅读材料,以便有兴趣的读者进—步钻研探索。

本书可作为高等院校计算机、自动化及相关专业的本科生或研究生教材,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。





作者介绍

周志华,南京大学计算机系教授,ACM杰出科学家,IEEE Fellow, IAPR Fellow, IET/IEE Fellow, 中国计算机学会会士。国家杰出青年科学基金获得者、长江学者特聘教授。先后担任多种SCI(E)期刊执行主编、副主编、副编辑、编委等。中国计算机学会人工智能与模式识别专业委员会主任,中国人工智能学会机器学习专业委员会主任,IEEE计算智能学会数据挖掘技术委员会副主席。



目录

目录


第1章 1

1.1 引言 1

1.2 基本术 2

1.3 假设空间 4

1.4 归纳偏好 6

1.5 发展历程 10

1.6 应用现状 13

1.7 阅读材料 16

习题 19

参考文献 20

休息—会儿 22



第2章 模型评估与选择 23

2.1 经验误差与过拟合 23

2.2 评估方法 24

2.2.1 留出法 25

2.2.2 交叉验证法 26

2.2.3 自助法 27

2.2.4 调参与zui终模型 28

2.3 性能度量 28

2.3.1 错误率与精度 29

2.3.2 查准率、查全率与F1 30

2.3.3 ROC与AUC 33

2.3.4 代价敏感错误率与代价曲线 35

2.4 比较检验 37

2.4.1 假设检验 37

2.4.2 交叉验证t检验 40

2.4.3 McNemar检验 41

2.4.4 Friedman检验与后续检验 42

2.5 偏差与方差 44

2.6 阅读材料 46

习题 48

参考文献 49

休息—会儿 51



第3章 线性模型 53

3.1 基本形式 53

3.2 线性回归 53

3.3 对数几率回归 57

3.4 线性判别分析 60

3.5 多分类学习 63

3.6 类别不平衡问题 66

3.7 阅读材料 67

习题 69

参考文献 70

休息—会儿 72



第4章 决策树 73

4.1 基本流程 73

4.2 划分选择 75

4.2.1 信息增益 75

4.2.2 增益率 77

4.2.3 基尼指数 79

4.3 剪枝处理 79

4.3.1 预剪枝 80

4.3.2 后剪枝 82

4.4 连续与缺失值 83

4.4.1 连续值处理 83

4.4.2 缺失值处理 85

4.5 多变量决策树 88

4.6 阅读材料 92

习题 93

参考文献 94

休息—会儿 95



第5章 神经网络 97

5.1 神经元模型 97

5.2 感知机与多层网络 98

5.3 误差逆传播算法 101

5.4 全局zui小与局部极小 106

5.5 其他常见神经网络 108

5.5.1 RBF网络 108

5.5.2 ART网络 108

5.5.3 SOM网络 109

5.5.4 级联相关网络 110

5.5.5 Elman网络 111

5.5.6 Boltzmann机 111

5.6 深度学习 113

5.7 阅读材料 115

习题 116

参考文献 117

休息—会儿 120



第6章 支持向量机 121

6.1 间隔与支持向量 121

6.2 对偶问题 123

6.3 核函数 126

6.4 软间隔与正则化 129

6.5 支持向量回归 133

6.6 核方法 137

6.7 阅读材料 139

习题 141

参考文献 142

休息—会儿 145



第7章 贝叶斯分类器 147

7.1 贝叶斯决策论 147

7.2 极大似然估计 149

7.3 朴素贝叶斯分类器 150

7.4 半朴素贝叶斯分类器 154

7.5 贝叶斯网 156

7.5.1 结构 157

7.5.2 学习 159

7.5.3 推断 161

7.6 EM算法 162

7.7 阅读材料 164

习题 166

参考文献 167

休息—会儿 169



第8章 集成学习 171

8.1 个体与集成 171

8.2 Boosting 173

8.3 Bagging与随机森林 178

8.3.1 Bagging 178

8.3.2 随机森林 179

8.4 结合策略 181

8.4.1 平均法 181

8.4.2 投票法 182

8.4.3 学习法 183

8.5 多样性 185

8.5.1 误差--分歧分解 185

8.5.2 多样性度量 186

8.5.3 多样性增强 188

8.6 阅读材料 190

习题 192

参考文献 193

休息—会儿 196




第9章 聚类 197

9.1 聚类任务 197

9.2 性能度量 197

9.3 距离计算 199

9.4 原型聚类 202

9.4.1 k均值算法 202

9.4.2 学习向量量化 204

9.4.3 高斯混合聚类 206

9.5 密度聚类 211

9.6 层次聚类 214

9.7 阅读材料 217

习题 220

参考文献 221

休息—会儿 224



第10章 降维与度量学习 225

10.1 k近邻学习 225

10.2 低维嵌入 226

10.3 主成分分析 229

10.4 核化线性降维 232

10.5 流形学习 234

10.5.1 等度量映射 234

10.5.2 局部线性嵌入 235

10.6 度量学习 237

10.7 阅读材料 240

习题 242

参考文献 243

休息—会儿 246



第11章 特征选择与稀疏学习 247

11.1 子集搜索与评价 247

11.2 过滤式选择 249

11.3 包裹式选择 250

11.4 嵌入式选择与L$_1$正则化 252

11.5 稀疏表示与字典学习 254

11.6 压缩感知 257

11.7 阅读材料 260

习题 262

参考文献 263

休息—会儿 266




第12章 计算学习理论 267

12.1 基础知识 267

12.2 PAC学习 268

12.3 有限假设空间 270

12.3.1 可分情形 270

12.3.2 不可分情形 272

12.4 VC维 273

12.5 Rademacher复杂度 279

12.6 稳定性 284

12.7 阅读材料 287

习题 289

参考文献 290

休息—会儿 292



第13章 半监督学习 293

13.1 未标记样本 293

13.2 生成式方法 295

13.3 半监督SVM 298

13.4 图半监督学习 300

13.5 基于分歧的方法 304

13.6 半监督聚类 307

13.7 阅读材料 311

习题 313

参考文献 314

休息—会儿 317




第14章 概率图模型 319

14.1 隐马尔可夫模型 319

14.2 马尔可夫随机场 322

14.3 条件随机场 325

14.4 学习与推断 328

14.4.1 变量消去 328

14.4.2 信念传播 330

14.5 近似推断 331

14.5.1 MCMC采样 331

14.5.2 变分推断 334

14.6 话题模型 337

14.7 阅读材料 339

习题 341

参考文献 342

休息—会儿 345



第15章 规则学习 347

15.1 基本概念 347

15.2 序贯覆盖 349

15.3 剪枝优化 352

15.4 —阶规则学习 354

15.5 归纳逻辑程序设计 357

15.5.1 zui小—般泛化 358

15.5.2 逆归结 359

15.6 阅读材料 363

习题 365

参考文献 366

休息—会儿 369




第16章 强化学习 371

16.1 任务与奖赏 371

16.2 $K$-摇臂赌博机 373

16.2.1 探索与利用 373

16.2.2 $epsilon $-贪心 374

16.2.3 Softmax 375

16.3 有模型学习 377

16.3.1 策略评估 377

16.3.2 策略改进 379

16.3.3 策略迭代与值迭代 381

16.4 免模型学习 382

16.4.1 蒙特卡罗强化学习 383

16.4.2 时序差分学习 386

16.5 值函数近似 388

16.6 模仿学习 390

16.6.1 直接模仿学习 391

16.6.2 逆强化学习 391

16.7 阅读材料 393

习题 394

参考文献 395

休息—会儿 397



附录 399

A 矩阵 399

B 优化 403

C 概率分布 409


后记 417


索引 419




《数据科学实践:从理论到落地》 洞悉数据价值,驱动智能决策 在当今信息爆炸的时代,数据已成为企业最宝贵的资产。如何从海量数据中挖掘洞见,转化为实际的业务价值,是每一个组织面临的挑战。本书《数据科学实践:从理论到落地》正是一本旨在帮助读者系统掌握数据科学核心技能,并将其高效应用于实际业务场景的指南。它并非一本专注于特定算法或理论的学术著作,而是着眼于整个数据科学的生命周期,从数据获取、清洗、探索性分析,到模型构建、评估、部署,再到最终的业务价值实现,提供一套完整且可行的实践框架。 本书的写作初衷,源于作者在多年数据科学项目实践中积累的宝贵经验。我们深知,理论知识固然重要,但将这些知识转化为解决实际问题的能力,才是衡量数据科学家价值的关键。因此,本书在理论讲解上力求严谨,但更侧重于如何在真实世界的数据挑战中应用这些理论。我们避免了冗长抽象的数学推导,而是通过生动的案例和清晰的逻辑,展现数据科学解决问题的全貌。 第一部分:数据科学基石——理解与准备 在开启数据科学之旅前,首要任务是建立对数据的深刻理解和熟练的数据处理能力。本书的开篇,将带您走进数据的世界,了解不同类型数据的特点,以及数据在业务流程中的角色。 数据获取与整合:我们将详细探讨各种数据源的类型,包括关系型数据库、NoSQL数据库、API接口、文本文件、日志文件等,并介绍多种有效的数据提取和整合策略。您将学习如何设计健壮的数据管道,确保数据在进入分析流程前是准确、完整且一致的。 数据清洗与预处理:真实世界的数据往往充斥着噪声、缺失值、异常值和格式不一致等问题。本部分将深入讲解各种数据清洗技术,例如缺失值插补(均值、中位数、回归插补、KNN插补等)、异常值检测与处理(统计方法、箱线图、Isolation Forest等)、数据类型转换、字符串处理、日期时间格式标准化等。我们将强调在清洗过程中保持数据完整性和准确性的重要性,并指导您如何根据具体业务场景选择最合适的方法。 探索性数据分析(EDA):EDA是数据科学的灵魂。它帮助我们初步了解数据的分布、变量之间的关系以及潜在的模式。本书将引导您系统地进行EDA,包括描述性统计分析(均值、方差、分位数等)、数据可视化(直方图、散点图、箱线图、热力图、地理信息图等)以及特征工程的初步探索。您将学习如何利用EDA的结果来发现数据中的洞见,为后续的模型选择和特征构建提供依据。 特征工程:将原始数据转化为机器学习模型能够理解和利用的特征,是数据科学中最具创造性和挑战性的环节之一。本部分将详细介绍多种特征工程技术,包括特征创建(多项式特征、交互特征、聚合特征等)、特征转换(对数转换、Box-Cox转换、标准化、归一化等)、特征编码(独热编码、标签编码、目标编码等)以及处理类别特征和文本特征的方法。我们还将探讨如何基于领域知识和EDA发现来设计有意义的特征,以提升模型性能。 第二部分:核心技术——模型构建与评估 在完成数据准备后,我们将进入模型的构建阶段。本书并非仅仅罗列算法,而是从模型选择、训练、调优到评估的整个流程进行系统阐述。 模型选择策略:面对琳琅满目的机器学习模型,如何选择最适合当前任务的模型是关键。我们将基于问题类型(分类、回归、聚类、降维等)、数据规模、模型可解释性、训练效率等维度,提供一套行之有效的模型选择框架。您将了解线性模型、树模型、集成模型、支持向量机、神经网络等主流模型的优缺点及其适用场景。 模型训练与优化:本书将深入讲解模型训练的核心概念,包括损失函数、优化算法(梯度下降及其变种)、正则化技术(L1、L2、Dropout等)以及过拟合与欠拟合的诊断与解决。我们还将重点介绍模型调优的技术,如交叉验证、网格搜索、随机搜索和贝叶斯优化等,帮助您找到最优的模型超参数组合。 模型评估指标:选择合适的评估指标对于客观衡量模型性能至关重要。我们将详细讲解针对不同任务的评估指标,例如分类任务中的准确率、精确率、召回率、F1分数、AUC-ROC曲线;回归任务中的均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、R²分数;聚类任务中的轮廓系数、Calinski-Harabasz指数等。我们还将强调理解指标的业务含义,以及如何根据业务目标选择最能反映实际效果的指标。 集成学习:集成学习通过组合多个模型来提升整体性能。本书将系统介绍集成学习的常见方法,如Bagging(如随机森林)、Boosting(如AdaBoost, Gradient Boosting, XGBoost, LightGBM)以及Stacking。您将学习它们的原理、实现方式以及在实际应用中如何有效利用它们来构建更鲁棒、更高精度的模型。 第三部分:落地实践——部署、监控与价值实现 模型的效果最终需要通过实际部署并产生业务价值来体现。本部分将把焦点从模型本身转移到整个数据科学项目的生命周期。 模型部署:将训练好的模型集成到生产环境中,是数据科学项目落地的关键一步。我们将探讨模型部署的各种方式,包括RESTful API、批处理推理、嵌入式部署等,并介绍常用的部署工具和框架。您将学习如何保证模型的稳定运行,并处理好模型与现有系统的集成问题。 模型监控与维护:模型部署并非终点,而是持续优化的起点。数据会随时间发生变化,模型的性能也可能随之衰减。本书将指导您如何建立有效的模型监控机制,跟踪模型性能、数据漂移和概念漂移,并及时采取措施进行模型重训练或更新。 A/B测试与实验设计:为了科学地评估模型对业务的影响,A/B测试是不可或缺的工具。我们将讲解如何设计有效的A/B测试实验,收集和分析实验数据,以及如何做出基于数据驱动的决策。 数据伦理与合规性:在数据科学实践中,数据隐私、公平性和透明度是必须考虑的重要问题。本书将强调数据伦理的重要性,并介绍相关的法律法规和最佳实践,帮助您构建负责任的数据科学解决方案。 项目管理与沟通:成功的数据科学项目离不开良好的项目管理和跨职能沟通。我们将分享在数据科学项目中如何进行需求定义、项目规划、团队协作以及如何有效地与业务部门沟通,确保项目按时交付并实现预期目标。 本书特色 强调实践性:本书的核心在于“实践”。我们通过丰富的真实案例,将抽象的理论转化为可操作的步骤,让读者能够立即上手。 系统性视角:本书覆盖了数据科学的整个生命周期,从数据准备到模型部署,提供了一个端到端的解决方案。 循序渐进的难度:从基础概念到高级技术,本书设计了清晰的学习路径,适合不同经验水平的读者。 技术与业务的融合:我们不仅关注技术细节,更强调如何将数据科学技术与业务目标相结合,最终驱动业务增长。 无偏见的工具与方法介绍:本书力求客观地介绍各种常用的数据科学工具和方法,不局限于特定平台或技术栈,让读者能够根据实际需求灵活选择。 目标读者 本书适合以下人群: 希望进入数据科学领域,系统学习数据科学技能的初学者。 有一定数据分析或编程基础,希望提升模型构建和应用能力的开发人员、分析师。 希望将数据科学应用于业务决策的各行业从业人员,包括产品经理、市场营销人员、运营人员等。 对人工智能和数据驱动决策感兴趣的读者。 阅读《数据科学实践:从理论到落地》,您将不仅仅是获得一套技术工具,更是掌握一套解决实际问题的思维方式和方法论。让我们一起,用数据驱动未来,用智慧创造价值。

用户评价

评分

我是一位在业余时间学习机器学习的爱好者,之前也尝试过几本不同的书籍,但总感觉在理解上有些隔阂。直到我遇到了这本《机器学习》,我才真正体会到什么叫做“庖丁解牛”。作者的叙述风格非常独特,既有严谨的学术大家的风范,又充满了循循善诱的教育智慧。他善于用生活中常见的例子来类比复杂的机器学习概念,这使得抽象的理论变得生动有趣,也更容易被理解。比如,在解释“正则化”的时候,作者用“约束运动员的训练强度,避免过度疲劳导致伤病”来比喻,这个例子非常贴切,让我一下子就明白了正则化的核心作用。而且,书中在介绍每一种算法时,都会站在一个更高的维度,去分析它在整个机器学习领域中的定位和价值,而不是孤立地讲解。这种宏观的视角,让我能够更好地把握机器学习的整体图景,也更有信心去应对未来的学习和挑战。这本书真的让我感受到了知识的力量,也让我对人工智能的未来充满了期待。

评分

这本《机器学习》真是让我大开眼界!之前对机器学习的理解一直停留在一些零散的概念上,比如神经网络、决策树之类的,但总觉得缺乏一个系统性的框架。这本书正好填补了我的空白。作者从最基础的数学概念讲起,一点点构建起整个机器学习的理论体系,这一点我非常欣赏。不会像有些书上来就抛出一堆公式,让人摸不着头脑。它用了大量的例子来解释抽象的概念,比如在讲到“过拟合”的时候,举了一个考试“死记硬背”的例子,我瞬间就明白了。而且,书中提到的算法,比如支持向量机,不仅仅是介绍了原理,还讲了如何选择核函数、调整参数,这些实操性的东西对于想动手实践的人来说简直是宝藏。我特别喜欢它在介绍各个算法时,都会先铺垫背景,说明为什么需要这个算法,它解决了什么问题,然后再深入讲解。这种循序渐进的方式,让我感觉学起来不那么吃力,也更容易理解算法之间的联系和区别。这本书的编排逻辑非常清晰,章节之间的过渡也很自然,读起来就像是在听一位经验丰富的老师在讲课,条理分明,逻辑严谨。

评分

作为一名对人工智能领域一直抱有浓厚兴趣的读者,我一直在寻找一本能够深入浅出、又兼具深度与广度的中文教材。这本《机器学习》简直就是我梦寐以求的那一本。它不仅仅是一本枯燥的技术手册,更像是一部引人入胜的学术探索之旅。作者在梳理经典机器学习算法时,并没有止步于表面的描述,而是深入剖析了其背后的数学原理和统计学基础,同时巧妙地融入了其在人工智能发展史中的地位和演进。这一点让我尤其震撼,它让我在学习算法本身的同时,也对整个AI技术的发展脉络有了更深刻的认识。更难得的是,书中对一些前沿问题的探讨也相当有见地,虽然篇幅可能不如基础算法那样详尽,但其点拨性的论述足以激发读者进一步的思考和探索。我个人认为,这本书最吸引我的地方在于它所传递的一种严谨的学术态度和科学的思维方式。它鼓励读者去质疑、去验证,而不是盲目接受。这种潜移默化的影响,远比单纯的技术知识传递要宝贵得多。

评分

我是一名在校大学生,正在准备毕业设计,方向就选了机器学习。之前看过不少网络上的零散教程,但总觉得知识点不连贯,很多时候遇到问题就卡住了。这本书给我带来的最大帮助在于它提供了一个完整的知识体系。从最基础的模型评估,到各种监督学习、无监督学习算法,再到一些进阶的主题,它都进行了系统性的讲解。我印象特别深的是关于“偏差-方差权衡”这一部分的阐述,作者用非常形象的比喻,比如“新手射箭”和“老手射箭”,清晰地解释了偏差和方差的概念以及它们对模型性能的影响。这让我一下子就抓住了模型优化的关键。而且,书中给出的公式推导过程也非常详尽,虽然有时候需要花点时间去消化,但最终理解之后,那种豁然开朗的感觉是无与伦比的。对于我这样的学生来说,这本书不仅仅是学习工具,更是激发我学习动力和研究兴趣的源泉。

评分

不得不说,这本《机器学习》是我近几年来读过最扎实、最有分量的技术类书籍之一。它对于机器学习核心概念的阐释,堪称典范。从模型选择的原则,到各种算法的优缺点分析,再到实际应用中的注意事项,作者都处理得恰到好处。我尤其欣赏它在介绍一些相对复杂的算法时,能够兼顾理论的深度和工程的可操作性。例如,在讲解集成学习时,它不仅介绍了Bagging和Boosting的基本思想,还详细讨论了Random Forest和Gradient Boosting等具体模型,并且提供了相应的优化策略。这对于我这样的实践者来说,非常有价值。书中对数学原理的运用也十分精准,但并没有让数学公式成为阅读的障碍,而是将它们巧妙地融入到概念的解释和算法的推导中,使得读者在掌握理论的同时,也能建立起扎实的数学基础。这本书给我带来的提升是全方位的,它不仅让我掌握了机器学习的知识,更重要的是,它教会了我如何去思考问题,如何去构建一个有效的机器学习解决方案。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou 等,本站所有链接都为正版商品购买链接。

© 2025 windowsfront.com All Rights Reserved. 静流书站 版权所有