Python绝技 运用Python成为顶级数据工程师+Python数据分析入门从数据获取到可视化

Python绝技 运用Python成为顶级数据工程师+Python数据分析入门从数据获取到可视化 pdf epub mobi txt 电子书 下载 2025

黄文青 零一 沈祥壮? 著
图书标签:
  • Python
  • 数据分析
  • 数据工程
  • Python绝技
  • 数据可视化
  • 数据获取
  • 入门
  • 编程
  • 技术
  • 实战
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 蓝墨水图书专营店
出版社: 电子工业
ISBN:9787121336546
商品编码:28677382246

具体描述






作 译 者:黄文青

出版时间:2018-05    千 字 数:300

版    次:01-01    页    数:212

开    本:16开

装    帧:

I S B N :9787121336546     

换    版:

所属分类:科技 >> 计算机 >> 计算机科学

纸质书定价:¥79.0

仅仅会Python编程是不够的。想成为一名优秀的数据分析工程师,还需要有全方位、透彻理解问题本质的能力,善于把实际的工作任务拆解成准确的数据问题,并运用相关的知识来解决。本书恰好是从这个角度出发的,它条分缕析地帮助你认识任务的本质,教你从数据的角度来思考、拆解任务,并最终顺利地达成目标。

1 概述 / 1

1.1 何为数据工程师 /  1

1.2 数据分析的流程 /  3

1.3 数据分析的工具  /  11

1.4 大数据的思与辨  /  14

2 关于Python /  17 

2.1 为什么是Python  / 17

2.2 常用基础库  / 19

2.2.1 Numpy  /  19

2.2.2 Pandas  / 26

2.2.3 Scipy /  37

2.2.4 Matplotlib  / 38

3 基础分析  /  43

3.1 场景分析与建模策略  /  43

3.1.1 统计量 / 43 

3.1.2 概率分布 / 48

3.2 实例讲解 /  55

3.2.1 谁的成绩更优秀  /  55

3.2.2 应该库存多少水果  / 57

4 数据挖掘  / 60

4.1 场景分析与建模策略  / 60

4.1.1 分类 / 61

4.1.2 聚类 /  76

4.1.3 回归  /  86

4.1.4 关联规则  / 90 

4.2 数据挖掘的重要概念 / 93

4.2.1 数据预处理   / 93

4.2.2 评估与验证 /97

4.2.3 Bagging 与Adaboost / 99

4.2.4 梯度下降与牛顿法 / 102

4.3 实例讲解  /105

4.3.1 信用卡欺诈监测 / 105

4.3.2 员工离职预判 /110

5 深度学习/ 114

5.1 场景分析与建模策略 / 115

5.1.1 感知机 / 115

5.1.2 自编码器 / 119

5.1.3 限制玻尔兹曼机 /123

5.1.4 深度信念神经网络 / 127

5.1.5 卷积神经网络 / 129

5.2 人工智能应用概况 / 137

5.2.1 深度学习的历史 /137

5.2.2 人工智能的杰作 / 140

5.3 实例讲解 / 146

5.3.1 学习识别手写数字 /  146

5.3.2 让机器认识一只猫  /  151

6 大数据分析 /  160

6.1 常用组件介绍 / 160

6.1.1 数据传输 / 165

6.1.3 数据计算 /  174

6.1.4 数据展示 /  180

6.2 大数据处理架构  / 188

6.2.1 Lambda 架构 / 189

6.2.2 Kappa 架构  / 192

6.2.3 ELK 架构 / 193

6.3 项目设计  / 194

参考文献 / 202

版 次:1页 数:字 数:200000印刷时间:2018年03月01日开 本:16开纸 张:轻型纸包 装:平装-胶订是否套装:否国际标准书号ISBN:9787121333590

所属分类:

图书>计算机/网络>程序设计>其他

编辑推荐

本书内容来自笔者在高校授课的内容,主要介绍如何运用 Python 工具获取电商平台的页面数据,并对数据进行清洗和存储。本书简化了 Python 基础部分,保证有足够的篇幅来介绍爬虫和数据清洗的内容。

本书采用的版本是 Python 3.6.2,是笔者写书时的*版本,而且笔者习惯用的操作平台是Windows 系统。

 

 

内容简介

      本书是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的 Python 读物。书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。

 

    本书共分 11 章, 6 个核心主题:其一是 Python 基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是 Python 爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、 反防爬虫、 表单交互和模拟页面点击; 其三是 Python 数据库应用, 包括 MongoDB、 MySQL 在 Python中的连接与应用;其四是数据清洗和组织,包括 NumPy 数组知识、 pandas 数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者贯穿爬虫、数据清洗与组织的过程;*后是数据可视化,包括 Matplotlib 和 Pyecharts 两个库的使用,涉及饼图、柱形图、线图、词云图、地图等图形,帮助读者进入可视化的殿堂。

 

    本书以实战为主,适合 Python 初学者及高等院校的相关专业学生,也适合 Python 培训机构作为实验教材使用。

作者简介

零一

原名陈海城,

零一数据学院创始人,

电商数据专家,数据分析师,开发工程师。

从事培训教育、数据分析和人工智能行业。

 

黄园园,具有十年软件开发经验,全栈工程师,六西格玛黑带,精通Python和机器学习算法,具有丰富的分布式爬虫开发经验;曾在苏州三星电子电脑(SESC)、新加坡电信(NCS)、希捷科技(Seagate Technology)等世界知名企业研发部工作,参与过花旗银行在线支付系统、银行账单自动化审核系统等大型软件开发,曾任杭州沐垚科技CTO。

显示全部信息

目 录

第 1 章 Python 基础 /1

1.1 安装 Python 环境 /1

1.1.1 Python 3.6.2 安装与配置 /1

1.1.2 使用 IDE 工具——PyCharm /4

1.1.3 使用 IDE 工具——Anaconda / 4

1.2 Python 操作入门/6

1.2.1 编写第一个 Python 代码/6

1.2.2 Python 基本操作/9

1.2.3 变量/10

1.3 Python 数据类型/10

1.3.1 数字/10

1.3.2 字符串/11

1.3.3 列表/13

1.3.4 元组/14

显示全部信息

前 言

Python 是军刀型的开源工具,被广泛应用于 Web 开发、爬虫、数据清洗、自然语言处理、机器学习和人工智能等方面,而且Python 的语法简洁易读,这让许多编程入门者不再望而却步,因此Python 在最近几年非常受欢迎,各行各业的技术人员都开始使用 Python。

本书内容来自笔者在高校授课的内容,主要介绍如何运用 Python 工具获取电商平台的页面数据,并对数据进行清洗和存储。本书简化了Python 基础部分,保证有足够的篇幅来介绍爬虫和数据清洗的内容。

本书采用的版本是Python 3.6.2,是笔者写书时的最新版本,而且笔者习惯用的操作平台是Windows 系统。虽然目前一些高校和开发者在使用 Python 2.7,但是 Python 团队将在 2020 年停止对Python 2.7 的支持更新, Python 2.X 转向 Python 3.X 是大势所趋。

显示全部信息

媒体评论

这本书教大家如何利用Python撰写爬虫程序,清洗和组织数据,解析网页的内容,并将数据储存于数据库中。巨细无遗,帮助大家节省时间,是值得一读的好书!

 

国立台湾大学资讯工程博士,铭传大学资讯工程学系教授李御玺 (Yue-Shi Lee) 

 

 

零一兄的这本Python爬虫技术是一个完整大数据应用框架:从数据收集、分析到数据可视化、数据建模。各章节以实际案例为出发点,对大数据分析、爬虫技术应用感兴趣的小伙伴们来说,这本书值得购买。 

版 次:1页 数:字 数:印刷时间:2018年03月01日开 本:16开纸 张:胶版纸包 装:平装-胶订是否套装:否国际标准书号ISBN:9787121336539

所属分类:

图书>计算机/网络>程序设计>其他

快速直达

编辑推荐

内容简介

作者简介

目 录

前 言

媒体评论

下载免费当当读书

编辑推荐

这是一本务实之作,充分体现数据分析流程的各项环节,包含数据的采集、清洗和探索性分析,并通过大家耳熟能说的Python工具加以实操。

 

内容简介

本书作为数据分析的入门图书,以Python语言为基础,介绍了数据分析的整个流程。本书内容涵盖数据的获取(即网络爬虫程序的设计)、前期数据的清洗和处理、运用机器学习算法进行建模分析,以及使用可视化的方法展示数据及结果。首先,书中不会涉及过于高级的语法,不过还是希望读者有一定的语法基础,这样可以更好地理解本书的内容。其次,本书重点在于应用Python来完成一些数据分析和数据处理的工作,即如何使用Python来完成工作而非专注于Python语言语法等原理的讲解。本书的目的是让初学者不论对数据分析流程本身还是Python语言,都能有一个十分直观的感受,为以后的深入学习打下基础。*后,读者不必须按顺序通读本书,因为各个章节层次比较分明,可以根据兴趣或者需要来自行安排。例如第5章介绍了一些实战的小项目,有趣且难度不大,大家可以在学习前面内容之余来阅读这部分内容。

作者简介

沈祥壮 

自学Python两年,以数据分析为主线,系统学习了数据的采集,处理、分析和可视化。在研究统计机器学习理论的同时,使用Python语言实现了部分统计学习算法。研究方向包括数据采集,数据挖掘,统计机器学习及图像处理。

目 录

1 准备    1

1.1 开发环境搭建    2

1.1.1 在Ubuntu系统下搭建Python集成开发环境    2

1.1.2 在Windows系统下搭建Python集成开发环境    13

1.1.3 三种安装第三方库的方法    16

1.2 Python基础语法介绍    19

1.2.1 if__name__=='__main__'    20

1.2.2 列表解析式    22

1.2.3 装饰器    23

1.2.4 递归函数    26

1.2.5 面向对象    27

1.3 The Zen of Python    28

参考文献    30

 

2 数据的获取    31

2.1 爬虫简介    31

2.2 数据抓取实践    33

2.2.1 请求网页数据    33

2.2.2 网页解析    38

2.2.3 数据的存储    46

2.3 爬虫进阶    50

2.3.1 异常处理    50

2.3.2 robots.txt    58

2.3.3 动态UA    60

2.3.4 代理IP    61

2.3.5 编码检测    61

2.3.6 正则表达式入门    63

2.3.7 模拟登录    69

2.3.8 验证码问题    74

2.3.9 动态加载内容的获取    84

2.3.10 多线程与多进程    93

2.4 爬虫总结    101

参考文献    102

 

3 数据的存取与清洗    103

3.1 数据存取    103

3.1.1 基本文件操作    103

3.1.2 CSV文件的存取    111

3.1.3 JSON文件的存取    116

3.1.4 XLSX文件的存取    121

3.1.5 MySQL数据库文件的存取    137

3.2 NumPy    145

3.2.1 NumPy简介    145

3.2.2 NumPy基本操作    146

3.3 pandas    158

3.3.1 pandas简介    158

3.3.2 Series与DataFrame的使用    159

3.3.3 布尔值数组与函数应用    169

3.4 数据的清洗    174

3.4.1 编码问题    174

3.4.2 缺失值的检测与处理    175

3.4.3 去除异常值    181

3.4.4 去除重复值与冗余信息    183

3.4.5 注意事项    185

参考文献    187

 

4 数据的分析及可视化    188

4.1 探索性数据分析    189

4.1.1 基本流程    189

4.1.2 数据降维    197

4.2 机器学习入门    199

4.2.1 机器学习简介    200

4.2.2 决策树——机器学习算法的应用    202

4.3 手动实现KNN算法    205

4.3.1 特例——最邻近分类器    205

4.3.2 KNN算法的完整实现    213

4.4 数据可视化    215

4.4.1 高质量作图工具——matplotlib    215

4.4.2 快速作图工具——pandas与matplotlib    223

4.4.3 简捷作图工具——seaborn与matplotlib    226

4.4.4 词云图    230

参考文献    232

 

5 Python与生活    234

5.1 定制一个新闻提醒服务    234

5.1.1 新闻数据的抓取    235

5.1.2 实现邮件发送功能    237

5.1.3 定时执行及本地日志记录    239

5.2 Python与数学    241

5.2.1 估计π值    242

5.2.2 三门问题    245

5.2.3 解决LP与QP问题(选读)    247

5.3 QQ群聊天记录数据分析    251

参考文献    256



用户评价

评分

评分

评分

评分

评分

评分

评分

评分

评分

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou 等,本站所有链接都为正版商品购买链接。

© 2025 windowsfront.com All Rights Reserved. 静流书站 版权所有