大数据行情
现在市面上的数据岗位有这么几种:
数据分析师
数据科学家
算法工程师
数据工程师
大数据工程师
爬虫工程师
初级数据分析师待遇不高,而且由于入行门槛最低,竞争也最激烈。所做的事情主要是给业务部门取数、扯皮等等,想要做分析的话得看你的部门职能还有 leader 给不给机会,最重要的是 SQL 和 Excel 用得好,Python 掌握得好也是加分项。最不推荐,但实在没办法了也可以做,数据驱动的理念越来越深入人心,许多公司都会提供相应的坑位,努力一把还是能找到的工作,只是可能待遇通常都不太令人满意。
数据科学家,比数据分析师的 level 更高一些,会有机会做一些算法和模型。面试的要求通常会比较高,而且由于每家公司的需求不一样,问的问题会非常杂,覆盖面很广,基本没法提前针对性准备。这个岗位最难的是过面试关,要是能拿到 offer,待遇通常都不会太差,做的事情也很有挑战性,很有趣。有些公司可能挂个数据分析师的岗位但要求是数据科学家的,这个只能自己看看 JD 了。
算法工程师,需要深入了解机器学习算法,最好能发几篇相关领域的论文啥的。待遇没得说,同数据科学家一样,难在面试。如果在学校的时候没有深耕,就不建议投这个岗位了。
数据科学家和算法工程师这两个岗位,都是高薪、高挑战的岗位,面试也非常难。而且这些岗位成本高,又缺乏落地方法论,所以通常来说坑位偏少,加上高薪吸引大量人才,面对的竞争最为激烈。数据分析师是人多,但你仍然有优势。而在这两个岗位上,你将面对各种 985 以上的优秀人才的竞争,自己估量一下吧。而且数据科学家对经验的要求同样很高,许多公司都只想招有经验的人,初级岗位很少,比较常见的是数据分析师升上来或者从别的岗位转过来的。
数据工程师,日常主要是做 ETL,数据仓库建设,基础设施运维等等。工作内容繁杂枯燥。需要维护 ETL 定时任务,所以每天都得看一眼监控,遇到任务出错也和运维一样需要及时抢修,大数据文摘翻译过一篇文章《数据工程师的没落》,对这些情况讲得很清楚了。
需要的技能就是 SQL、Python 以及各种开源软件的使用( Hive、HBase、Spark、Kafka、Airflow 等等)。要做好这个工作,除了数据处理能力,还需要能理解各种算法模型,因为会需要帮助数据科学家把算法工程化。
待遇就是一般的研发工程师水平,比算法工程师和数据科学家低,比数据分析师高。竞争激烈程度不高,因为很多编程好的人没有数据 sense,有数据 sense 的人编程不一定行,就算编程还可以,一般也是优先考虑数据科学家。
坑位很多,毕竟要搞数据驱动的话,必然需要人手来建设数据仓库的,在很长一段时间内,都会是一个必不可少的角色。
大数据工程师,偏底层运维性质,主要是维护大数据集群和相关服务,以及基于开源生态做二次开发。很多公司会把这个和数据工程师混淆,自己看 JD 判断吧。这个岗位需要对开源生态很熟悉,了解底层知识,阅读过源码。待遇和数据工程师类似,坑位主要是大公司有,中小公司一般是数据工程师兼任这部分职能,只有大公司才会有定制化开发的需求。开源组件基本能满足大部分数据需求了,所以实际上岗位需求比较有限。
爬虫工程师,需要对爬虫知识有全面的了解,这里也不多谈。有爬虫需求的公司很多,但需求一般都不会强到单独设置爬虫岗位,都是其它岗位的人根据需求临时开发一下。坑位是非常非常少的,大公司也不一定有。