发表于2024-12-22
Python数据分析基础(全国高等院校应用型创新规划教材·计算机系列) pdf epub mobi txt 电子书 下载
作者通过近三轮的教学,对Python3.x的基础知识进行了筛选和总结,特编写此书,希望能够给准备使用Python的读者提供一些方便。
本书由浅入深,比较适合那些从未接触过计算机语言的读者。每章配有大量的示例代码,希望读者在使用本书的时候,能够尽可能自己敲代码,少用复制粘贴的方法,这样有利于读者尽快进入“角色”,毕竟“拷贝得来终觉浅”。
本书的前3章是Python的基础知识;第4章是利用Pandas库对数据进行处理、分析以及实现数据可视化;在第5章还列出了Python对文件的读取、存储方法,对网络爬虫、矩阵运算也做了简单的介绍。
Python是由Guido van Rossum于20世纪80年代末和90年代初,在荷兰国家数学和计算机科学研究所设计出来的。它是一种面向对象的、用途非常广泛的编程语言,具有非常清晰的语法特点,适用于多种操作系统。目前Python在国际上非常流行,正在得到越来越多的应用。
Python可以完成许多任务,功能非常强大,其利用Pandas处理大数据的过程,由于Pandas库的使用能够很好地展现数据结构,成为近来Python项目中经常使用的热门技术,并且R和Spark对Python都有很好的调用接口,甚至在内存使用方面都有优化。
本书根据作者多年教学经验编写,条理清楚,内容深浅适中,尽量让读者从实例出发,结合课后练习,少走弯路。本书涉及的内容主要包括Python数据类型与运算、流程控制及函数与类、Pandas库的数据处理与分析等。在本书的最后,还附带了一些文件读写、网络爬虫、矩阵计算等最基本的内容。
本书可以作为本科生、研究生以及科研人员学习Python的基础教材。
目录
第1章Python简介1
1.1安装Python2
1.2Python2和Python3的区别5
本章小结8
练习8
第2章Python数据类型与运算9
2.1数据类型11
2.2运算符与功能命令12
2.2.1算数运算符12
2.2.2比较运算符12
2.2.3赋值运算符13
2.2.4常量与变量15
2.2.5字符串16
2.2.6字符串索引与切片18
2.2.7输入和输出20
2.2.8原始字符串21
2.2.9range22
2.2.10元组、列表、字典、集合22
2.2.11格式化输出37
2.2.12strip、split40
2.2.13divmod()42
2.2.14join()42
本章小结43
练习47
第3章流程控制及函数与类49
3.1流程控制52
3.1.1if-else52
3.1.2for循环53
3.1.3while循环54
3.1.4continue和break54
3.2遍历56
3.2.1range()函数56
3.2.2列表与元组的遍历59
3.3函数61
3.3.1函数的定义61
3.3.2函数的使用62
3.3.3形参和实参63
3.3.4参数的传递和改变63
3.3.5变量的作用域66
3.3.6函数参数的类型68
3.3.7任意个数的参数70
3.3.8函数调用71
3.4函数式编程74
3.4.1lambda74
3.4.2reduce()75
3.4.3filter()76
3.4.4map()77
3.4.5行函数77
3.5常用的内置函数78
3.5.1sum78
3.5.2zip79
3.5.3enumerate80
3.5.4max和min81
3.5.5eval81
3.5.6判断函数83
3.6常见的错误显示86
3.6.1常见的错误类型87
3.6.2初学者常犯的错误89
3.6.3try93
3.6.4assert95
3.6.5raise95
3.7模块和包96
3.7.1模块(module)96
3.7.2包(package)100
3.7.3datetime和calendar模块101
3.7.4urllib模块105
3.8类106
本章小结109
练习109
第4章Python数据分析实战113
4.1关于Pandas114
4.1.1什么是Pandas114
4.1.2Pandas中的数据结构114
4.1.3Pandas的安装方法114
4.1.4在Anaconda中安装
第三方库118
4.2数据准备119
4.2.1数据类型119
4.2.2数据结构120
4.2.3数据导入128
4.2.4数据导出131
4.3数据处理133
4.3.1数据清洗133
4.3.2数据抽取138
4.3.3排名索引147
4.3.4数据合并151
4.3.5数据计算154
4.3.6数据分组156
4.3.7日期处理157
4.4数据分析162
4.4.1基本统计162
4.4.2分组分析163
4.4.3分布分析165
4.4.4交叉分析167
4.4.5结构分析169
4.4.6相关分析170
4.5数据可视化172
4.5.1饼图172
4.5.2散点图174
4.5.3折线图176
4.5.4柱形图180
4.5.5直方图183
本章小结184
练习184
第5章其他187
5.1文件读写操作188
5.1.1文件的读写方法189
5.1.2文件的其他方法190
5.1.3文件的存储和读取190
5.2with语句192
5.3Anaconda下安装statsmodels包193
5.4关于Spyder界面恢复默认状态的
处理195
5.5关于Python计算精度的问题197
5.6矩阵运算200
5.6.1创建矩阵200
5.6.2矩阵属性200
5.6.3解线性方程组201
5.6.4线性规划最优解202
5.7正则表达式203
5.8使用urllib打开网页209
5.9网页数据抓取212
5.10读取文档217
本章小结222
练习222
参考文献224
第2章Python数据类型与运算
我们先了解Python的几个语法常识。
1.代码注释方法
(1)在一行中,“#”后的语句不再执行,而表示被注释。
(2)如果要进行大段的注释,可以使用三个单引号(’’’)或者双引号(”””)将注释内容包围。单引号和双引号在使用上没有本质的差别。
【例2-1】三个双引号注释段落:
#-*-coding:utf-8-*-
"""
CreatedonSunMar1321:20:062016
@author:yubg
"""
lis=[1,2,3]
foriinlis:#半角状态冒号不能少,下一行注意缩进
i+=1
print(i)
本例不需要上机操作,仅为展示用法。
2.用缩进来表示分层
Python不像C语言那样用{}来表示语句块,而是通过让代码缩进4个空格来表示分层,当然也可以使用Tab键,但不要混合使用Tab键和空格来进行缩进,否则会使程序在跨平台时不能正常工作,官方推荐的做法是使用四个空格。
一般来说,行尾遇到“:”就表示下一行缩进的开始,如例2-1中的“foriinlis”行尾有冒号,下一行的“i+=1”就需要缩进四个空格。
3.语句断行
一般来说,Python中的一条语句占一行,在每条语句的结尾处不需要使用分号(;)。但在Python中也可以使用分号,表示将两条简单语句写在一行。但如果一条语句较长,要分几行来写,可以使用“”来进行换行。分号还有个作用,使用在一行语句的末尾,表示对本行语句的结果不打印输出。一般地,系统能够自动识别换行,如在一对括号中间或三引号之间均可换行。例如下面代码中的第三行较长,若要对其分行,则必须在括号内进行(包括圆括号、方括号和花括号):
frompandasimportDataFrame#导入模块中的函数,后面再讲
frompandasimportSeries
df=DataFrame({'age':Series([26,85,64]),'name':Series(['Ben','Joh','Jef'])})
print(df)
分行后的第二行一般空四个空格,在3.5版本中已经优化,可以不空四个空格,但是在较低的3.x版本中不空四个空格会报错。
frompandasimportDataFrame
frompandasimportSeries
df=DataFrame({'age':Series([26,85,64]),#此语句分成了两行
'name':Series(['Ben','Joh','Jef'])})
print(df)
4.print()的作用
print()会在输出窗口中显示一些文本或结果,便于验证和显示数据。
5.使用转义符
如果需要在一个字符串中嵌入一个引号,该如何操作?
有两种方法:可以在引号前加反斜杠(),或者用不同的引号包围这个引号。
例如:
>>>s1='I'amaboy.'#可以使用转义符
>>>print(s1)
I'amaboy.
>>>s2="I'amaboy."#也可以用不同的引号包围起来,此处用双引号是为了区分单引号
>>>print(s2)
I'amaboy.
>>>
转义符详见本章2.2.5小节的内容。
2.1数据类型
Python总共有6种数据类型,分别是数字型(Numbers)、字符串型(String)、列表型(List)、元组型(Tuple)、集合型(Sets)和字典型(Dictionaries)。
数字型又可划分为整数型(int)、浮点型(float)、布尔型(bool)和复数型(complex)。
在Python中有4种类型的数——整数、长整数、浮点数和复数。
例如,2是一个整数的例子。
长整数不过是大一些的整数。
3.23和52.3E-4是浮点数的例子,E标记表示10的幂。52.3E-4表示52.3×10-4。
(-5+4j)和(2.3-4.6j)表示的是复数。
……
前言
在写作本书的时候,国内大多数参考书还是Python2.7版本,为了给在校大学生开设这门Python课程,我们选择了Python3.x,毕竟Python3.x才是未来。与其让学生们从Python2.7开始学,还不如直接从Python3.x上手,以掌握更加完善的知识。
作者通过近三轮的教学,对Python3.x的基础知识进行了筛选和总结,特编写此书,希望能够给准备使用Python的读者提供一些方便。
本书由浅入深,比较适合那些从未接触过计算机语言的读者。每章配有大量的示例代码,希望读者在使用本书的时候,能够尽可能自己敲代码,少用复制粘贴的方法,这样有利于读者尽快进入“角色”,毕竟“拷贝得来终觉浅”。
本书的前3章是Python的基础知识;第4章是利用Pandas库对数据进行处理、分析以及实现数据可视化;在第5章还列出了Python对文件的读取、存储方法,对网络爬虫、矩阵运算也做了简单的介绍。
作者在编写本书的过程中,得到了Python工程师齐伟的帮助。在开设这门课的时候,齐伟通过视频的形式与我们一起分享了Python开发经验。本书在完稿时,得到了研究生闫青、陈文华、马秀、樊宇凯和卢超在文字校对上的帮助。
最后感谢广大读者选择了本书,预祝您顺利学会Python语言。
编者
Python数据分析基础(全国高等院校应用型创新规划教材·计算机系列) pdf epub mobi txt 电子书 下载