发表于2024-11-23
数据科学概论/数据科学与大数据技术丛书 pdf epub mobi txt 电子书 下载
理论篇//
1 数据科学概论
1.1 数据科学的定义
1.2 数据科学的定位
1.2.1 数据科学与数据库、大数据分析的关系
1.2.2 数据科学与基于数据的决策的关系
1.3 数据科学家
1.3.1 数据科学家的技能
1.4 数据科学的基本原则(Principle)
1.4.1 原则1:数据分析可以划分成一系列明确的阶段
1.4.2 原则2:描述性分析与预测性分析
1.4.3 原则3:实体的相似度
1.4.4 原则4:模型的泛化能力
1.4.5 原则5:分析结果的评估与特定应用场景有关
1.4.6 原则6:相关性不同于因果关系
1.4.7 原则7:通过并行处理提高数据处理(分析)速度
1.5 数据处理流程:时间维度的纵向视角
1.6 数据处理系统的架构:系统维度的计算视角
1.6.1 数据处理系统的层次架构
1.6.2 数据处理系统的Lambda架构
1.7 数据的多样性:数据类型维度的横向视角
1.8 数据价值的挖掘:价值维度的价值提升视角
1.9 思考题
2 OLTP与数据服务
2.1 面向OLTP应用的RDBMS数据库技术
2.1.1 关系数据库技术与SQL查询语言
2.1.2 利用索引加快数据访问
2.1.3 数据库的事务处理、恢复技术与安全保证
2.1.4 并行数据库与分布式数据库
2.2 面向数据服务的NoSQL数据库技术
2.2.1 NoSQL数据库技术
2.2.2 CAP理论
2.2.3 Key-Value数据库
2.2.4 Column Family数据库
2.2.5 Document数据库
2.2.6 Graph数据库
2.3 NewSQL数据库技术
2.3.1 VoltDB数据库
2.3.2 Google Spanner数据库
2.4 思考题
3 OLAP与结构化数据分析
3.1 联机分析处理(OLAP)与结构化数据分析
3.1.1 从操作型的业务数据库向数据仓库抽取、转换和装载数据
3.1.2 数据仓库与星型模型
3.1.3 联机分析处理OLAP
3.1.4 三种类型的OLAP系统
3.2 高性能OLAP系统的关键技术
3.2.1 列存储技术
3.2.2 位图索引技术
3.2.3 内存数据库技术
3.2.4 MPP并行数据库
3.3 结构化数据分析工具介绍
3.3.1 MPP(Shared-Nothing)数据库、基于列存储的关系数据库
3.3.2 SQL on Hadoop系统
3.3.3 性能比较
3.4 思考题
......
数据科学概论/数据科学与大数据技术丛书 pdf epub mobi txt 电子书 下载