pandas 可视化.DataFrame.plot 图例中文乱码怎么破

本文主要介绍了一下如何简单的探查数据之间的关系

要制作直方图首先把X轴的值的范围等分成多个间隔,然后数出每个间隔中包含的值的数量然后把该数量作为Y轴的徝。使用方法pandas 可视化.DataFrame.hist()函数

#制作工资收入中位数(Median列)的直方图
 
# hist()函数默认是自动分成10等分的且生成的图中是有网格线的,现在要分成20等分同时消除网格线
 
# 其实可以一次性制作多个直方图,layout参数的意思是将两个图分成两行一列如果没有这个参数,默认会将全部的图放在同┅行
 

箱型图是基于五数概括法(最小值第一个四分位数,第一个四分位数(中位数)第三个四分位数,最大值)的数据的一个图形汇總还需要用到四分位数间距IQR = 第三个四分位数 - 第一个四分位数。详情请google

# 按照每一个专业类型分类统计 # 将X轴的坐标文字旋转90度垂直显示

要想找出多个变量之间的关联,就要把多个变量的变化都做在同一个图上进行比较

# 将两个散点图放在一起(按颜色区分)观察是否有关联
 
 

我要回帖

更多关于 pandas 可视化 的文章

 

随机推荐