包邮 数据即未来:大数据王者之道+大数据技术原理与应用 大数据技术书籍 数据科学

包邮 数据即未来:大数据王者之道+大数据技术原理与应用 大数据技术书籍 数据科学 pdf epub mobi txt 电子书 下载 2025

[美] 布瑞恩·戈德西,林子雨 著
图书标签:
  • 大数据
  • 数据科学
  • 数据分析
  • 大数据技术
  • 大数据应用
  • 机器学习
  • 人工智能
  • 商业智能
  • 数据挖掘
  • 包邮
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 旷氏文豪图书专营店
出版社: 机械工业
ISBN:9787111589266
商品编码:26395081570
开本:16
出版时间:2017-02-01

具体描述

YL13743  9787111589266 9787115443304

数据即未来:大数据王者之道

本书详细介绍了数据科学项目的三个阶段。准备阶段进行信息收集;构建阶段将计划付诸行动,利用准备阶段获得的信息以及相关统计和软件提供的可用工具来构建产品;交付阶段进行产品的交付、反馈及修改等。本书在介绍过程中会教你如何预见问题以及如何处理不确定性,一步步引导你完成软件和科学思维的佳实践。

本书赞誉
中文版序
中文版序二
译者序
前言
致谢
关于本书
关于原书封面插图
第一部分 准备和收集数据与知识
第1章 数据科学的逻辑 2
1.1 数据科学与本书 4
1.2 意识的可贵 7
1.3 研发人员与数据科学家 9
1.4 需要成为软件研发者吗 12
1.5 需要明白统计学吗 13
1.6 优先级:知识、技术、观点 14
1.7 最佳实践 17
1.8 阅读本书:我怎么讨论概念 23
小结 24
第2章 通过好的提问设置目标 26
2.1聆听客户 27
2.2提出关于数据的好问题 37
2.3用数据回答问题 42
2.4设定目标 48
2.5计划要有弹性 50
练习 51
小结 51
第3章 周围的数据:虚拟的荒野 52
3.1数据作为研究对象 52
3.2数据可能存在的地方,以及如何与之交互 62
3.3数据侦察 80
3.4案例:microRNA与基因表达 89
练习 94
小结 95
第4章 数据整理:从捕捉到驯化 96
4.1案例研究:最佳田径表演 97
4.2准备整理数据 101
4.3技巧与工具 109
4.4常见的陷阱 112
练习 119
小结 119
第5章 数据评估:动手检查 120
5.1案例:安然的电子邮件数据 121
5.2描述性统计 123
5.3检查数据的假设 130
5.4寻找特定的实体 134
5.5大概的统计分析 140
练习 147
小结 147
第二部分 构建软件和统计产品
第6章 制订计划 150
6.1学到了什么 152
6.2重新考虑期望和目标 158
6.3规划 164
6.4沟通新目标 175
练习 176
小结 177
第7章 统计建模:概念与基础 178
7.1如何看待统计 179
7.2统计学:与数据科学相关的领域 180
7.3数学 184
7.4统计模型与推理 194
7.5其他的统计方法 218
练习 227
小结 227
第8章 软件:统计学在行动 229
8.1电子表格和用户图形界面应用 230
8.2编程 239
8.3选择统计软件工具 264
8.4把统计转换成软件 271
练习 277
小结 278
第9章 辅助软件:更大、更快、更高效 279
9.1数据库 280
9.2高性能计算 287
9.3云服务 290
9.4大数据技术 293
9.5XX即服务 297
练习 298
小结 298
第10章 执行计划:汇总 299
10.1执行计划的诀窍 300
10.2修改计划 308
10.3结果:知道什么时候足够好 310
10.4案例研究:基因活性测定协议 315
练习 328
小结 329
第三部分 整理产品结束项目
第11章 交付产品 332
11.1了解客户 333
11.2交付形式 335
11.3内容 345
11.4案例:分析电子游戏 351
练习 353
小结 353
第12章 交付后:问题与修改 354
12.1产品及其使用问题 354
12.2反馈 364
12.3产品修改 370
练习 377
小结 378
第13章 结束:项目善后 379
13.1项目善后 380
13.2从项目中学习 392
13.3展望未来 396
练习 398
小结 399
练习:案例与答案 400


大数据技术原理与应用(第2版)

(1) 概念篇:介绍当前紧密关联的*新IT领域技术云计算、大数据和物联网。 
(2) 大数据存储与管理篇:介绍分布式数据存储的概念、原理和技术,包括HDFS、HBase、NoSQL数据库、云数据库。 
(3) 大数据处理与分析篇:介绍MapReduce分布式编程框架、基于内存的分布式计算框架Spark、图计算、流计算、数据可视化。 
(4) 大数据应用篇:介绍基于大数据技术的推荐系统。

第一篇 大数据基础 

第1章 大数据概述 2 
1.1 大数据时代 2 
1.1.1 第三次信息化浪潮 2 
1.1.2 信息科技为大数据时代提供 
技术支撑 3 
1.1.3 数据产生方式的变革促成大数据时代的来临 5 
1.1.4 大数据的发展历程 6 
1.2 大数据的概念 7 
1.2.1 数据量大 7 
1.2.2 数据类型繁多 8 
1.2.3 处理速度快 9 
1.2.4 价值密度低 9 
1.3 大数据的影响 9 
1.3.1 大数据对科学研究的影响 10 
1.3.2 大数据对思维方式的影响 11 
1.3.3 大数据对社会发展的影响 11 
1.3.4 大数据对就业市场的影响 12 
1.3.5 大数据对人才培养的影响 13 
1.4 大数据的应用 14 
1.5 大数据关键技术 14 
1.6 大数据计算模式 15 
1.6.1 批处理计算 16 
1.6.2 流计算 16 
1.6.3 图计算 16 
1.6.4 查询分析计算 17 
1.7 大数据产业 17 
1.8 大数据与云计算、物联网 18 
1.8.1 云计算 18 
1.8.2 物联网 21 
1.8.3 大数据与云计算、物联网的关系 25 
1.9 本章小结 26 
1.10 习题 26 
第2章 大数据处理架构Hadoop 28 
2.1 概述 28 
2.1.1 Hadoop简介 28 
2.1.2 Hadoop的发展简史 28 
2.1.3 Hadoop的特性 29 
2.1.4 Hadoop的应用现状 29 
2.1.5 Hadoop的版本 30 
2.2 Hadoop生态系统 30 
2.2.1 HDFS 31 
2.2.2 HBase 31 
2.2.3 MapReduce 31 
2.2.4 Hive 32 
2.2.5 Pig 32 
2.2.6 Mahout 32 
2.2.7 Zookeeper 32 
2.2.8 Flume 32 
2.2.9 Sqoop 32 
2.2.10 Ambari 33 
2.3 Hadoop的安装与使用 33 
2.3.1 创建Hadoop用户 33 
2.3.2 Java的安装 34 
2.3.3 SSH登录权限设置 34 
2.3.4 安装单机Hadoop 34 
2.3.5 Hadoop伪分布式安装 35 
2.4 本章小结 37 
2.5 习题 38 
实验1 安装Hadoop 38 

第二篇 大数据存储与管理 

第3章 分布式文件系统HDFS 42 
3.1 分布式文件系统 42 
3.1.1 计算机集群结构 42 
3.1.2 分布式文件系统的结构 43 
3.1.3 分布式文件系统的设计需求 44 
3.2 HDFS简介 44 
3.3 HDFS的相关概念 45 
3.3.1 块 45 
3.3.2 名称节点和数据节点 46 
3.3.3 第二名称节点 47 
3.4 HDFS体系结构 48 
3.4.1 概述 48 
3.4.2 HDFS命名空间管理 49 
3.4.3 通信协议 49 
3.4.4 客户端 50 
3.4.5 HDFS体系结构的局限性 50 
3.5 HDFS的存储原理 50 
3.5.1 数据的冗余存储 50 
3.5.2 数据存取策略 51 
3.5.3 数据错误与恢复 52 
3.6 HDFS的数据读写过程 53 
3.6.1 读数据的过程 53 
3.6.2 写数据的过程 54 
3.7 HDFS编程实践 55 
3.7.1 HDFS常用命令 55 
3.7.2 HDFS的Web界面 56 
3.7.3 HDFS常用Java API及应用实例 57 
3.8 本章小结 60 
3.9 习题 61 
实验2 熟悉常用的HDFS操作 61 
第4章 分布式数据库HBase 63 
4.1 概述 63 
4.1.1 从BigTable说起 63 
4.1.2 HBase简介 63 
4.1.3 HBase与传统关系数据库的 
对比分析 64 
4.2 HBase访问接口 65 
4.3 HBase数据模型 66 
4.3.1 数据模型概述 66 
4.3.2 数据模型的相关概念 66 
4.3.3 数据坐标 67 
4.3.4 概念视图 68 
4.3.5 物理视图 69 
4.3.6 面向列的存储 69 
4.4 HBase的实现原理 71 
4.4.1 HBase的功能组件 71 
4.4.2 表和Region 71 
4.4.3 Region的定位 72 
4.5 HBase运行机制 74 
4.5.1 HBase系统架构 74 
4.5.2 Region服务器的工作原理 76 
4.5.3 Store的工作原理 77 
4.5.4 HLog的工作原理 77 
4.6 HBase编程实践 78 
4.6.1 HBase常用的Shell命令 78 
4.6.2 HBase常用的Java API及 
应用实例 80 
4.7 本章小结 90 
4.8 习题 90 
实验3 熟悉常用的HBase操作 91 
第5章 NoSQL数据库 94 
5.1 NoSQL简介 94 
5.2 NoSQL兴起的原因 95 
5.2.1 关系数据库无法满足 ..........



用户评价

评分

评分

评分

评分

评分

评分

评分

评分

评分

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou 等,本站所有链接都为正版商品购买链接。

© 2025 windowsfront.com All Rights Reserved. 静流书站 版权所有