看看头条

我的梦想是——做一名科学家,会算数的那种!

我的梦想是——做一名科学家,会算数的那种!

上一篇聊完了Data Science该如何申请(老师,我也想申请Data Science呢!),那这一篇就说说看学完DS能做什么。

我的梦想是——做一名科学家,会算数的那种!

一 什么样的行业需要Data Science?

广义的来讲,所有的行业都需要Data science,无论是现在最火的互联网公司如FLAG,一直很高大上的咨询公司如Mckinsey,还是说数据密集的投行券商如高盛摩根士丹利。因为在这个网络时代,我们每个人的行为、习惯都随时随刻的在产生大量的数据,而这些数据中都充满了大量有用的信息,如何能获得这些信息就变得极为关键,这也正是Data Science的研究领域。

说完这些虚的,让我们来看看具体到职位和职能:

二 Data Science究竟是做什么的?

第一类:纯数据分析类

Data Analyst 数据分析师

数据分析师侧重于利用统计学、数学等知识进行数据挖掘,日常的主要工作内容为收集数据、清洗数据、然后做一些分析或可视化处理,对编程语言有一定的要求,如R,Python,Javascript,C/C++,SQL等。初级的Analyst的工作就是配合Scientist和Engineer,当业务需求使用某些方法的时候,他们就是一线操作者,当scientist要数据,他们要收集清理数据,当客户或者子公司要数据,他们也要收集清理数据。得出最终的分析报告给产品组工程组或管理层。 所以从这个角度讲,analyst只是非常纯粹的在和数据打交道罢了。

Data Scientist 数据科学家

数据科学家是数据领域非常具有复合型的高级岗位,往往需要具备能够独立完成一整套数据分析过程的能力:从数据提取,整合、并进行分层,进行统计或其他复杂的分析,创造引人注目的可视化诠释和效果,开发具有更宽广应用前景的数据工具。实际工作中主要的精力大概在分布式算法的实现和优化上,特别是后者,是极具挑战性的,需要资深的数据科学家来完成,因此需要非常强大的数学、统计、计算机背景,在优化问题上很有经验。

Data Architect 数据架构师

都说不想当数据架构师的程序猿不是一个好前端。因为一个优秀的数据架构师应该对所在领域的主流技术体系有一个全面清晰的认识,对某一种技术的原理、运作机理有深入的理解,是该领域的专家,同时具有将客观事物抽象出来的能力,关注当前技术前沿和热点,使用最高效的方式解决问题。他们的日常主要任务为创建数据管理系统,对数据源进行整合、集中、和维护。具体来讲,要求会SQL,XML,HIVE,PIG,SPARK等,对数据库体系结构有深入了解,擅长数据仓库解决方案等。

Data Engineer 数据工程师

作为一个新兴的职业类型, 数据工程师更倾向于掌握 “战术层面” 的具体数据技能,专注于使数据可用并能够在生产环境中对数据进行处理,如具体的编程语言、操作系统与数据库等;而数据科学家更倾向于“战略层面”的数据技能,如数据分析、数据挖掘、统计分析、机器学习等。他们的日常主要工作内容是用SQL来回答分析型问题,用脚本来做数据集成,清洗ETL(提取-转换-装载)任务和使用Hadoop生态工具等,对编程语言要求较高,SQL,HIVE,PIG,R,MATLAB,SAS,SPSS,Python,Java,Ruby,C++,Perl等等都要会。

Database Administrator 数据库管理员

数据库管理员和数据分析的关联不是很大,类似于一个IT职位,职责为管理数据以及支持数据管理的设施,确保数据库是提供给所有相关用户,正在正确、安全的执行,因此可能会用到SQL,hadoop及相关查询语言,如Hive和Pig。日常专注于优化数据仓库,负责数据的读写和管理。

第二类:以数据为驱动的商业分析类

Business Analyst 商业分析师

商业分析师和纯数据科学家都是使用数据的专家,但他们的工作内容是有比较大差别的。通常,商业分析师要对某专业领域具有深入的了解和深刻的认识,商业敏感度高,擅长于从某一领域的数据中挖掘信息,以此评估过去、现在和未来可能的经营业绩。确定最有效的分析模型和途径,为商业用户提供和解释解决方案。

这个过程一般包括先和客户沟通,确定客户的问题和诉求,之后定义业务问题,搜集原始数据,运用预测性、规范性和描述性分析来研究、解释和可视化这些数据,让它们变得具有价值且能为客户展示。在这一过程中与客户反复商讨需求,更新模型,最终利用数据模型理解、整合,得出最佳解决方案。

Data and Analytics Product Manager数据产品经理

管理团队分析师和数据科学家,除了要会一些必备的基础语言如SQL,R,SAS,Python,Java,Matlab和数据挖掘、数据建模等能力,还需要对产品有深刻的理解、熟练应用数据可视化工具,和良好的人际沟通能力。他们的主要职责包括但不限于搭建数据pipeline,做分析,实验场景,评估和实施分析结果,同时要针对结果针对数据逻辑提出需求,解答来自其他部门的问题,设计出更好的产品,留住更多的客户,产生更多的利润。

第三类:统计学家

统计学家顾名思义,需要熟悉统计理论方法,分布式计算,数据库系统,云工具,数据挖掘机器学习等,语言方面需要R, SAS, SPSS, Mtlab, Stata, Python, Perl, Hive, Pig, Spark, SQL,具体工作内容这里就先不展开了,因为之后会有统计相关专栏,届时会给大家详细讲解~~

我的梦想是——做一名科学家,会算数的那种!

欢迎来申请方预约咨询(a2-xiaoyu)。

|\n|\r

赞 (0)
分享到:更多 ()