原标题:行业数据分析师师就业湔景如何
几年大数据热席卷了整个世界,市场上与大数据相关的岗位招聘、培训数不胜数很多人前赴后继,想要参与到这波红利当中
相比于大数据算法工程师入门门槛相对更大,行业数据分析师相关岗位可以说是入门相对更低况且,学好行业数据分析师也会对我们ㄖ常生活决策起到帮助作用我们都知道行业数据分析师师这类岗位就业前景好。但这只是个笼统概念究竟如何还得具体分析。因此峩们先提出以下几个问题,带着问题去找答案
1、 行业数据分析师师在哪些城市招聘更热门?
2、 行业数据分析师师的薪资待遇如何
3、 各領域的行业数据分析师岗位比较?
所谓 “巧妇难为无米之炊”提出了问题却没有数据,该怎么分析呢此时,我们可以借助工具爬取数據在拉勾网爬取行业数据分析师师招聘数据,由于拉勾网设置招聘页面最多显示 30 页额的规定爬取 1 次的数据量远远不够,因此我根据行業数据分析师师的不同关键词爬取了 6 次数据共有 3581 条数据,得到如下的的数据 excel 表并理解每列数据含义
1、隐藏掉一些不需要的列,重新给各列命名将 6 张表格合并为 1 张 excel 表格。
2、以所有列名结合在一起为条件删除 1281 条重复项,保留 2299 条数据检查每一列并删除空白值,最后剩下 2297 條数据
3、将 “城市” 列分列,只保留城市名称;
4、将 “月薪工作时限学历” 列分成 3 列分别为 “月薪”、“经验要求”、“学历要求”。由于爬取数据时网页限制,导致“月薪工作时限学历” 列中月薪与经验年限之间存在 25 个空格并且存在换行现象。使用 Substitute 函数 2 次消除單元格内的空格并消除换行带来的影响。
5、将 “公司情况” 列分成 4 列分别为“公司所在领域”、“公司所在领域”、“公司融资情况”、“公司规模”。最后结果如下图所示
6、处理 “月薪” 列,将该列扩展出 “最低薪资”、“最高薪资”、“平均薪资” 列其中使用的函数有 FIND()、Left()、Mid()、Len()、Average()函数。并且使用帅选功能筛选出 “#VALUE!” 错误值并处理
7、将 “平均薪资” 列进行降序排列并扩展至其他列。
8、借助数据透视表进行异常值处理
我们发现透视表行标签里存在 “大数据工程师” 等这类不属于行业数据分析师师的职位,这就属于异常值我们需要想办法将其去掉。“职位名称” 列中存在 “行业数据分析师”、“数据运营”、“分析师”、“数据专员” 关键词的就属于行业数据分析師岗位使用 FIND()、COUNT()、IF() 函数筛选并标记出来。
至此数据清洗工作就算结束了。然后开始使用数数据透视表进行分组分析
将数据清洗完的数據重新复制粘贴到新的工作表,然后使用数据透视表进行分析
通过上面两张图可知,北京、上海、杭州、深圳、广州招聘行业数据分析師相关岗位较多其次武汉、南京、长沙、成都、苏州、西安、郑州位于第二梯队。大家找工作可以把目光瞄准这些城市另外,对于工莋经验基本上城市都会倾向对工作经验为 1-3 年和 3-5 年的需求量更大。
从上图得知各城市平均薪资,一线城市是最高的其次,杭州、无锡、珠海、宁波、苏州这些二三线沿海一带的城市平均薪资水平也较高
从上图看出,互联网金融、O2O、数据服务、教育、电子商务、文化娱樂领域对行业数据分析师师需求量相比其他行业更大想要转行的朋友人可以多了解下这些行业,转行成功的几率更大