pandas是本书后续内容的首选库pandas可以滿足以下需求:
具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的數据而导致的常见错误.
既能处理时间序列数据也能处理非时间序列数据的数据结构
数学运算和简约(比如对某个轴求和)可以根据不同嘚元数据(轴编号)执行
合并及其他出现在常见数据库(例如基于SQL的)中的关系型运算
两个数据结构:Series和DataFrame。Series是一种类似于以为NumPy数组的对象它由一组数据(各种NumPy数据类型)和与之相关的一组数据标签(即索引)组成的。可以用index和values分别规定索引和值如果不规定索引,会自动創建 0 到 N-1 索引
DataFrame是一种表格型结构,含有一組有序的列每一列可以是不同的数据类型。既有行索引又有列索引,可以被看做由Series组成的字典(使用共同的索引)跟其他类似的数據结构(比如R中的data.frame),DataFrame面向行和列的操作基本是平衡的其实,DataFrame中的数据是以一个或者多个二维块存放的(不是列表、字典或者其他)
另一种常见的结构是嵌套字典即字典的字典,这样的结构会默认为外键为列内列为行。
下面列出了DataFrame构造函数能够接受的各种数据
下面是Index的方法与属性,值得注意的是:index并不是数组
下面介绍基本的Series 和 DataFrame 数据处理手段。首先是索引:
下面说索引、选取和过滤
下面是常用的索引选项:
#pandas 有一个重要的功能就是能够根据索引自动对齐,其中索引不重合的部分值为NaN #使用add方法并传入填充值,注意下面的fill_value函数是先对应填充再进行加和,而不是加和嘚到NaN之后再填充
除了add之外还有其他的方法:
3、汇总和计算描述统计
有些汇总统计(如相关系数和协方差)是通过参数对计算出來的这一节数据得不到?上不去网
唯一值、值计数以及成员资格
上面这几个函数是真的非常实用!
#NumPy的数据类型中缺少真正的NA数据类型或位模式?
#有一个函数 reset_index 这个函数(方法)可以重新设置index,其中drop = True选项会丢弃原来的索引而设置新的从0开始的索引这个方法只对DataFrame有用貌似。
#注意:由于DataFrame的设定只要有NA的行就会舍弃
#传入how = 'all' 则丢掉全为NA的行,这里的 how 的起名真的有点随心所欲了哈哈 #这里的thresh函数是选取最少non-NA值个数的行選出来
层次化索引(hierarchical index)是pandas的重要功能,这能使在一个轴上拥有两个以上的索引级别抽象点说,它能使你以低维度形式处理高维度
其他有关pandas的话题
最近接受Pythonpython数据分析入门的培训准备接下来深入研究一下,正处在初涉阶段先上一个小练习热热身。
项目分析数据:这是有关科技工作者心理健康数据的分析项目,數据是CSV格式的这是一个很好的网站,里面的数据可以拿来做Pythonpython数据分析入门大家可以下载,片段如下:
需求:统计各个国家存在的心理健康问题的平均年龄
附上我的处理代码,里面的注释有我的思考过程:
这是处理后的数据结果:
国家,存在心理问题的平均年龄
结束如果有可以优化的地方,希望大家赐教
这本书几乎是python数据分析入门入门必读书了主要介绍了python3个库numpy(数组),pandas(python数据分析入门)和matplotlib(绘图)的学习
国外已经有该书的第2版了,基于最新的Python3建议英文好的看最噺版本,下面提供中文和英文电子版下载链接:
1)电子版(英文)和代码:
2)pdf版(英文和中文版):已上传到百度云盘可以在后台回复“资料”获取到
光看书不仅孤独,还有时候看不懂因为这本书更多的是一些功能语法的介绍,缺少实践的案例操作所以这本书结合这幾个课程一起学习效果会事半功倍。
1)对应这本书《第2-3章Python基础知识》:
书中会涉及到描述统计学和概率的内容对于没有基础的朋友来说,看起来会很痛苦可以用下面的live进行统计知识补充:
2)对应这本书的《第4-5章python数据分析入门包(numpy和pandas)》的使用和《第7章数据清洗和准备》,但是书中没有提供完成的例子在live中我给出一个医院销售数据的完整分析案例,通过一个完整案例学会python数据分析入门的流程
3)对应这夲书的第9章绘图包(matplotlib)的使用和如何制作python数据分析入门报告:
如何用Python绘图和制作python数据分析入门报告?
4)对应本书的第13章机器学习包(scikit-learn)如哬使用:
我们现在一天很多事情不可能一直在电脑端学习的,所以如何利用碎片化时间在手机上学习这本书
在手机上安装一个可以看電子书的软件,我个人用的是掌阅APP电脑端登录微信后,将PDF版本通过微信的文件助手发到自己手机微信中
在手机微信中打开刚才的PDF文件,点击下图“用其他应用打开”
选择用电子书APP打开这个PDF文件我这里用的是掌阅
现在电子书已经在手机上了,惊喜不
打开这个电子书,按下图操作就可以在手机上按目录学习了
推荐:一个小白的逆袭之路