Table of Contents
2021/8/14更新
关于上网课找工作的评论问题,我将不再回复。现在的工作行情跟我当时的情况已经很不一样,我对新生找工作的情况并不了解,大家最好问那些最近一两年刚找到工作的新生,得到更新的信息。
2020/10/02更新
我最近开设了一个YouTube频道,分享一些职业发展的心得和数据科学领域的知识。欢迎观看订阅!
写在前面
大概是免责声明吧,这里只是一家之言的心路历程,当然不是说这么做就一定会转行找到工作(那叫鸡汤文学),没有宣扬人人都可以做xx21世纪是xx的世纪,希望大家结合自己的实际情况,多跟业内外的人交流,多了解行业情况,对自己负责,切莫跟风:D
后续:工作一年半之后,我又写了一篇第一次跳槽的经验小结。
1. 前言
拿到了人生中第一份工作offer!从无到有,从编程小白到数据科学。希望自己的经历能够给其他正在探索职业发展的同学们一点点启发。
2. 探索
哥大的生物科学博士项目是一个综合的科研项目,项目内各个实验室的方向相差甚远,有做传统分子生物学,细胞生物学的,也有做计算生物,神经科学,和生物物理的。我所在的实验室是一个神经科学和物理的交叉领域,既有前沿神经生物的实验训练,也有少量的物理建模和计算。虽然我一直对神经科学的科研非常感兴趣,也很想继续在科学前沿进行探索,但是神经科学这个领域的竞争空前惨烈,大牛众多,跟很多博士后聊了之后,发现自己并不适合目前这样的科研环境,对一年到头写科研经费和管理学生也没有太多兴趣。作为一个自然科学的博士生,面对学术界越来越激烈的竞争环境,越来越意识到自己一来科研能力并不出众,二来这些年的科研进展也不算顺利,三来也是读书二十多年读得太腻,于是毅然决然地决定毕业之后不继续在学术界做科研了。
身边大多数博士转行无非是这几条路。1)药厂,2)教书,3)金融,4)编程,5)科学交流,6)咨询,7) 其他
2.1 药厂
大多数生物专业的学生去了药厂,前几年还是要做实验的,虽然可能工作时间和收入比做博士后好一些,但是我是不想再做周期很长的实验了。而更多的药厂职位,倾向于经验丰富的博士后,而非刚毕业的博士,这就意味着想要进药厂工作,还是绕不过博士后的几年。了解了就业行情之后,就放弃了药厂这条路。
2.2 教书
身边确实是有博士毕业之后去高中或者大学做讲师的,不过一方面我个人并不是特别喜欢教书育人,另一方面要想成为老师,也要做很多准备,比如积累教书经验,这对于在实验室长时间工作的博士生可能并没有那么容易。我曾经在博士二年级的时候去做了一个学期纽约公立小学的志愿讲师,虽然小朋友们都很可爱,但是我觉得还是更喜欢一些更前沿更具有探索性质的工作。于是也就放弃了教书这条路。
2.3 金融
略微了解之后发现并没有直觉上的好感,那些金融词汇听上去就像是另一种语言。试着看了看CFA(特许金融分析师)的书,也并没有觉得特别喜欢,大概是因为从小就没有被培养出财务管理的技能。
其他与金融投资相关的行业,比如行业研究员(equity research),可以用上一些自己的专业知识进行股票分析,但是听说工作时间特别长,而且压力也不小。更重要的是,这些行业分析和投资理财顾问更倾向于经验丰富的人,比如已经干了几年的管理咨询。毫无经验的菜鸟一开始就做这个,机会也不是很多。
所以很快就放弃了金融这条路。
2.4 编程
我第一次接触编程是本科时期的C语言,当时觉得简直就是在听天书,什么二进制、指针、二叉树,完全不理解它们存在的意义,于是觉得自己大概并没有跟计算机打交道的天分。这令人不开心的第一次接触,让我一直觉得编程语言都非常难学,并且很难用得上。在PhD阶段也几度打起精神学习编程,但是都很不幸地半途而废。先是学完了一遍Google的Python教程(https://developers.google.com/edu/python/),感觉很容易上手,却还是觉得什么都不会,不觉得这些基础的内容在自己的工作中会有什么用处,也不知道学会这个能干什么。自己科研中最多也就是用MATLAB处理一些图像,并没有专业系统的编程训练。编程什么的就这么搁置了下来。几年前隔壁化学实验室一个博士师兄自学编程,然后去了华尔街做金融量化分析师(quant),他当时还鼓励我可以考虑一下做金融工程,说是只要会编程数学好,金融专业知识不懂也可以做。我看了一下他的C++教科书,真是一句话都看不懂,马上就放弃了。而传统意义上的编程工作,基本就是软件工程师了。身边有一些博士转软件工程师然后去了Google的例子,不过大多都是在博士毕业之后又读了一个计算机的硕士,或者博士没读完就中途转了计算机的硕士,总而言之,都是受过专业训练的。而完全靠自学转软件工程师的真的是少之又少。于是我还一度想着要不要申一下哥大的计算机硕士专业,但是看到高额的学费,想到还要再考一次入学考试GRE,就打了退堂鼓。
2.5 科学交流
如果对写作特别有兴趣,也可以考虑进行科学交流(scientific communication)。身边已经有不少PhD成功转行到科学交流行业,从事科学写作。他们的工作内容跟科研紧密联系,虽然不用自己做实验,但是还是需要经常阅读科学文献,然后写综述,做PPT。需要的不仅仅是写作能力和技巧,还有信息搜集和概括的能力,以及把复杂的科学概念说清楚的沟通能力。我对于写作本身虽然有很大的业余爱好,但是如果是当成工作,大概也谈不上喜欢。在跟已经转行科学交流的学长学姐交流之后,作罢。
2.6 咨询
从第一次听说咨询(大概是博士二年级),到在Coursera上学习经济学、战略分析,到选修哥大商学院的课,参加一些社交活动,到2016年加入哥大咨询俱乐部,开始申请咨询的工作。咨询是我前期投入非常大的方向。身边有很多中国同学都拿到了麦肯锡或者BCG在中国办公室的工作,而想要留在美国从事咨询工作却鲜有成功的案例。咨询业的职位需求本来就不多,在国内在美国的竞争都非常激烈,毕竟咨询已经成为很多博士转行的默认选项,特别是top N的那些学校,也就是咨询公司常说的target school。非target的学校申请难度要更大。美国公司能够提供工作签证的就更少,想要在美国工作不仅要英语特别好,主要看气质。而所谓的咨询气质是什么,准备过咨询的同学应该都能理解,无法言传。
我在面试的过程中,发现自己的性格跟咨询业的整体风格和工作模式并不是很合得来,特别是在穿正装分析商业案例的时候,心中总是有很强的表演错觉,感觉那个人并不是真正的我。至于咨询业强调的领导力和解决问题的能力,确实很难客观地去衡量,以至于被拒都不知道为何被拒。有些人觉得咨询不用怎么准备,target school的同学练两个月case就可以面试了。然而,借用我一个朋友的话,“咨询确实不怎么需要学习hard skill,但是要重新学习做人。”技术可以学习,但气质和性格却是经年累月的。所以,咨询公司在面试时,case做得及格之后,性格和眼缘非常重要。关于hard skill和soft skill,我后来才发现,不只是咨询,很多行业包括数据科学都是如此。hard skill决定入门资格,而soft skill决定入门之后能走多远。
在申请咨询的暑假项目失败之后,不甘心的我去哥大的职业教育中心CCE做了MBTI性格测试,当然我之前也在网上测过自己的性格,CCE测出来的结果跟我在网上测出来的一样,更适合从事运筹工程之类目的明确,行动清晰的工作,所以我大概并不适合做咨询吧。于是,由于种种原因,摩拳擦掌近两年的我,在经历了无数难以入睡的焦虑夜晚之后,在2016年6月即将申请的时候,放弃了咨询这条路。
而这个时候,已经博士5年级的我马上就要迎来博士的第6年了。我还是不知道自己想要做什么。
2.7 其他
之所以说是其他,因为PhD转行的方向非常多,身边也有成功的例子。有去读法学院JD的,有去做专利的,有去医学院读MD的,有去医学院读医师PA的,有去做学校行政工作的,当然还有创业的,等等。我或多或少都了解了一些可能的方向,也都或多或少地谈不上喜欢,也不觉得自己能坚持下来。比如法学院,一想到要考LSAT入学考试,要回到啃书的日子,就觉得压力太大。
3. 发现
本科同一个实验室的师姐,神经科学博士毕业之后去了Facebook做数据科学家,跟她聊了之后发现这个工作非常有趣,用到一些编程,也用到一些数据分析,还需要解决问题和思考。在跟其他师兄师姐的聊天中,我逐渐了解了数据科学(data science)这个行业,也逐渐发现自己似乎找到了自己喜欢的方向。在网上(知乎,一亩三分地BBS,Quora)读了很多介绍数据科学的文章和如何准备之后,我踏上了数据科学之路。
4. 准备
说干就干。2016年的6月底,我开始了转行之路。
我个人比较推荐通过系统的课程学习数据科学,而不是速成或者刷题,不是看几页别人总结的cheat sheet,也不是跟着大牛们做几个kaggle项目刷个名次。系统学习的时间虽然很长,也可能学着后面忘了前面,但从知识掌握的角度,自己一步一步慢慢学,一边学一边琢磨,然后自己融会贯通自己进行总结,掌握基本的理论和概念,知其然也知其所以然。这样之后再去刷题,参考别人的cheat sheet,看kaggle上别人的项目流程和思路,不仅事半功倍,也能够更好地理解数据分析。说到底,数据科学是门硬功夫,需要持续不断地学习新知识,反思旧概念。如果不能付出足够的时间和汗水,而只看到所谓数据科学的光鲜外表,可能很难转行成功吧。
因为需要投入很多 (平时晚上和周末基本都要学习),所以决定需谨慎。
4.1 编程
编程的乐趣在于搭建项目,这样一来有成就感,二来有可视化的结果。
4.1.1 Python入门(1-2月)
对于零基础或者有一些基础但没有系统训练的人来说,Udacity的Python课程非常有帮助。
- Intro to Computer Science
- https://www.udacity.com/course/intro-to-computer-science–cs101
- 非常浅显易懂的入门课程,有大量的上手编程训练,最后的项目也非常有趣。
- Programming Foundations with Python
- https://www.udacity.com/course/programming-foundations-with-python–ud036
- 涉及到class的构建和使用,调用函数
4.1.2 数据结构和算法(2-3月)
软件工程师的面试算法和数据结构考的比较多,而数据分析的职位大多数并不在意算法,但是有一些公司还是会问简单的算法,比如二叉树和搜索算法。
- Design of Computer Programs
- https://www.udacity.com/course/design-of-computer-programs–cs212
- 难度中等,对于已经学了上面两门课有Python基础的人来说,是非常不错的算法入门课。特别是从来没有接触过算法的人,课上的例子都非常贴近生活,妙趣横生
- Essential Data Structures in C/C++
- http://www.cs.columbia.edu/~jae/3136/
- 这是哥大的一门课,老师Jae是个非常非常有趣的人。对于从来没有接触过C++也没有系统学过数据结构和算法的人非常有用。
- Introduction to Algorithms
- https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-006-introduction-to-algorithms-fall-2011/
- 这是MIT公开课的算法课。网上有很多算法课的资源,只有好好学完一门算法课,就可以了。
- LeetCode
- https://leetcode.com/
- 学完基本的算法之后,可以用这个来练一下手。
4.2 数据分析
在网上查了一圈之后,发现还是Udacity的课程比较全面,而且是项目导向,也就是说每上完一门课,就可以做一个项目。我最终选择的是Data Analyst Nanodegree (https://www.udacity.com/course/data-analyst-nanodegree–nd002)。
这个Nanodegree的课程包括以下几个领域。所有的课程都可以在Udacity上免费学习。而Nanodegree的好处是有人进行远程指导和项目反馈。
- Statistics
- Intro to Data Analysis
- Data Wrangling with MongoDB
- SQL For Data Analysis
- Data Analysis with R
- Intro to Machine Learning
- Data Visualization and D3.js
- A/B Testing
全部课程学习完成,并且把作业的大项目做完,基本要4-6个月。我个人非常推荐。
当然,nanodegree价格也不算便宜(跟学校的学分比起来也不算太贵)。是否值得投资,全看个人喜好。我跟Udacity也没有任何利益关系,只是分享下自己的学习经验。
4.2.1 概率和统计(~1月)
偏理论。Udacity的这几门课非常基础,适合入门。当然很多人本科已经修过概率和统计,所以看视频只是巩固一下知识,顺便了解一下一些专业的单词英文怎么说。
- Intro to Statistics
- Intro to Descriptive Statistics
- Intro to Inferential Statistics
- Time Series Forecasting
这些课可以应付大多数的面试,而少数公司比如Google(参看glassdoor和一亩三分地的面试经验),对统计知识的要求更为深入。
YouTube的这个英国助教的A full course in econometrics,一共有271个视频,我觉得讲得深入浅出,特别对于没有上过研究生统计课的人,帮助非常大。里面涉及regression assumption和time series的部分,在我面试的时候就用到了。
https://www.youtube.com/user/SpartacanUsuals/playlists
4.2.2 A/B testing (~2周)
根据公司不同,一些职位可能会要求懂什么是A/B test,怎么设计实验。这对于实验出身的博士并不是很难理解,但是涉及到一些网上实验的细节和统计的计算,还是需要多加练习。Udacity这门课是由Google的员工讲授,获益匪浅。https://www.udacity.com/course/ab-testing–ud257
4.2.3 Numpy & Pandas(2-4周)
如果使用Python进行数据分析,那么Numpy和Pandas这两个函数包是必不可少的。
Udacity的Intro to Data Analysis讲了如何使用这两个包,非常好学,好用。https://www.udacity.com/course/intro-to-data-analysis–ud170
4.2.4 R(2-4周)
一般来说,只要熟练掌握一门语言Python,就可以申请大多数数据科学的职位。之所以把R单独列出来,是因为R有很多统计相关的函数和包,在调用的时候比较方便。
Nanodegree里Data Analysis with R是非常不错的R入门教程。https://www.udacity.com/course/data-analysis-with-r–ud651
这门课只是介绍了基本的作图和探索性数据分析EDA,而不涉及其他的R的功能。所以如果想要深入学习R的话,还是要自己多加练习。
4.2.5 SQL(2-4周)
同样的,Nanodegree里Data Wrangling with MongoDB是非常不错的SQL入门教程。https://www.udacity.com/course/data-wrangling-with-mongodb–ud032
除此之外,SQL zoo也是很好的练习资源。http://sqlzoo.net/wiki/SQL_Tutorial
4.2.6 大数据(1-2 月)
有些职位可能会要求有大数据处理的经验。
- Intro to Hadoop and MapReduce
- Udemy有一些Hadoop的课也可以看一看。
- 其他类似于Spark这些技能如果找的职位需要就学,不需要的话可以入职之后需要再学。
4.2.7 机器学习(1-2月)
Udacity的机器学习课程偏操作,对于理论和计算的要求不高。而Coursera的课更偏理论的推导和数学。两门课同时学习,效果更佳。
- Intro to Machine Learning
- Machine Learning
4.2.8 人工智能(2-6月)
大多数数据科学的职位并不要求会人工智能,但是如果需要或者感兴趣的话,可以自学。
- Intro to Artificial Intelligence
- Deep Learning
- Udacity有自己的AI nanodegree,课程设计和内容都很充实,但是价格略贵,个人感觉性价比一般。
- Coursera的deep learning听说评价不错,我还没有上过https://www.coursera.org/specializations/deep-learning
4.3 商业思维
根据职位不同,有些数据科学的面试会有类似于咨询的案例分析,而有些则只是强调编程和数据分析技能的匹配。
强烈推荐咨询的案例面试。比如Victor Cheng的免费视频https://www.caseinterview.com/ 对于理解如何站在商业角度看问题,还是很有启示的。由于大多数案例分析没有所谓的标准答案,表达能力和思考问题的角度就非常重要了。
举两个例子:
1. 问:如何预测谷歌引擎2020年在比利时的搜索量?因为搜索量直接决定公司需要购买的服务器数量,所以预测很重要。
思路:这是很明显的时间序列预测问题。建几个time series prediction model 不难,但在涉及到任何实际数据分析之前,最好先进行案例分析。从大局着眼,分析问题,提出框架(MECE思想, mutually exclusive collectively exhaustive),最后再建模。毕竟建模简单,关键是思考的过程。以下是一些可能的思路。
1) customer 我们的用户是谁,市场多大,近些年趋势如何,客户用什么设备搜索(电脑,手机,ipad)。每月每周每天趋势如何,是否具有季节性或周末高峰?
2) competitor,其他搜索引擎。
3) company, product, cost。如果搜索有周期性,多余的服务器资源如何利用?租赁或公司内其他的服务?
4) 建模。estimate range,上面的因素如何影响到各个参数的设定。是overestimate还是underestimate更糟?为什么?
总结:案例分析是个讨论交流的过程,一定要避免个人独白。建模是最后一步,在此之前,还是要多多分析。
2. 问:如何提高某保单的销售额(revenue)?
思路:revenue在咨询中是个很经典的问题。准备过咨询的人可能可以很快地列出框架,没有类似经验的则可能想到哪儿说到哪儿,一会说要降价,一会又说要促销,一会又说要增加销售渠道。但从分析问题的框架来看,MECE思想,可以大体分为内因外因。
1) 外:该类保单市场多大?趋势如何?主要竞争者是谁?客户是谁?客户年龄收入等状况(customer segmentation)?价格敏感度如何?
2)内:该保单是啥?车还是人?在公司占比多少?是主打产品还是副线?该产品特色如何?是价格还是品质?与其他保单是否冲突?
3) 要提高销售额,无非是提高价格或者提高销量。如果该产品价格敏感度低,而且属于独特的刚性需求产品,可以提价。如果该产品是generic,也可以通过降价提高销量,但要考虑是否有其他竞争者的价格战。也可以针对不同客户进行不同定价。
4) 行业相关。这里保单是保险业,如果对保险业或者任何面试的行业不熟悉,可以直接问面试官,保单的销售额是如何计算的?是保费投保人越多越好,还是说保费减去保险公司理赔的数量,算差价。这样就需要进行风险评估定价。因为我并没有深入了解过保险业,所以也不清楚这个行业相关的知识。但是如果你拿到了保险公司的面试,提前了解该行业的基本情况,特别是盈利模式,对面试很有帮助。
总结:如果实在不懂,一定要问面试官。在进行任何建模和数据分析之前,一定要确认自己理解对了问题。不然就南辕北辙了。
此外,大多数博士并没有什么商业的实践经历,如果有可能,可以参加一下data hackathon或者case competition,了解一下思考问题的一些方法。
5. 做项目
除了Udacity的项目,也可以自己在Kaggle(https://www.kaggle.com/)上做项目。总之是要有内容可以写,面试的时候可以聊。
订阅一些数据科学的邮件,比如https://www.datascienceweekly.org/,里面经常有其他人做的项目,可以借鉴一下。
如果有时间,可以参加数据科学领域的线下聚会https://www.meetup.com/,我就在一次线下聚会的时候遇到了神经科学转行的同志。
项目是简历的重中之重。
然而,我个人不建议在基础没有打好的情况下去刷项目,因为那样很容易陷入调参的大坑。毕竟有时候机器学习是玄学,参数模型选对了,准确率刷得很高。然而,从知识的角度,只刷项目并不能很深入地理解。在学习课程之后,再有针对地刷几个项目,了解工作流程和思路,比不停调参有意义得多。
6. 简历
网上和学校的职业教育中心已经有很多教如何写简历的攻略了(https://www.careereducation.columbia.edu/topics/resumes-cvs),Udacity的Nanodegree也有教人写简历的课程和反馈。这里就强调一下可能会被忽略的几点。
- 格式
- 一页PDF。
- 避免用花哨的格式,比如竖列的格式,看起来虽然新奇,但是确实没什么大用。
- 避免用图标和新奇的字体,避免在电脑自动筛选简历的时候无法识别格式。
- Summary
- 大多数应届毕业生并没有太多的东西可写,也很难通过自己的经历体现自己的优势。在一位职场达人学姐的指导下,我在简历最前面加了Summary的部分,针对所申工作的要求,高度概括总结自己的优势和经历。这样在HR筛简历的时候,可以一目了然地看到优点。
- Projects
- 量化。数据量有多大? 用了多少个特征?用的是什么具体的模型?结果提高了多少?改变了什么?
- 独立项目还是合作项目?个人做的内容是什么?
- 细节越多,越独特,也越能够吸引人。如果写得很宽泛,就显得缺乏个人的思考。
这里附上一个简历的模板和一些分析 resume_template 密码datascience 这份简历是我当时申请insight时用的,未必适合申请工作,大家酌情参考。
7. 软实力
7.1 沟通能力
推荐一本书吧,卡耐基的how to win friends and influence people。
https://www.amazon.com/How-Win-Friends-Influence-People/dp/0671027034
不少人说这是一本鸡汤软文,充斥着传销一般的励志故事……我之前也是这么想的,所以一直不想读。去年一个我认为人际能力很好的朋友推荐我去读,他表示自己刚来美国的时候也是没啥朋友,后来就按照书里的一些建议改变自己的行动,刚开始就是跟人尬聊,碰上路人或者街边的流浪汉都尬聊,给予对方最大的注意力和兴趣,后来逐渐就自然起来。我读了之后,真的是获益良多。最大的收获是,大多数人做决定,并不是100%理智的,相当多的时候,瞬间的决定取决于当时的情势,自己的喜好,和运气。人性并不是我们想象中那么直截了当,不是跟数学公式一样精准科学。
7.2 英语
交流起来应该没啥问题,口音的话推荐一下American Accent Training 里面讲了很多中国人发音的问题,美式英语的特点。如果对自己的口音很在意,可以用这本书短时间强化一下。
https://www.amazon.com/American-Accent-Training-Audio-CDs/dp/1438071655
8. 申请
8.1 投简历
大概10个月-2年之后(取决于个人的进展),就可以投简历找工作了。
2018年的暑假实习基本2017年的8月就有公司开始招人了,一直持续到2018年年初,取决于公司的招人情况。而全职工作很多公司都是全年招人,应届毕业生的招收主要集中在校内的秋招或者春招,把握好时机。
如果有可能一定要投实习,积累业界经验,这样在找全职工作的时候也更加有所准备。如果实在没办法实习,那就尽量做一些项目。在投简历的时候尽量内推,增加自己获得面试的几率。不管是通过LinkedIn直接找校友,还是在论坛上找人帮着递简历,在不惹人烦的情况下多多联系。
当然,很多公司可能还是会自己网上海投。如果可能,最好能够联系公司里的员工出来喝茶进行informational interview,了解一下公司情况。海投的话,建议广撒网,反正投简历不收费。
8.2 培训项目
除了投工作的简历,还可以申请一些免费的培训项目,这些项目基本都是针对转行的PhD,进行3-4个月的高强度培训,做项目,然后跟其他公司直接面试。
- Insight Data Science
- http://insightdatascience.com/
- 我所接触的Insight fellow对项目的评价都很高,也基本都通过Insight找到工作了。当时我同时拿了实习公司和Insight的offer,因为考虑到实习可能有return offer以及是真实的工作环境,最终并没有参加Insight的培训。
- 我个人的面试经历是,Insight确实是要求申请人本身有一定的编程和数据处理经验,最好已经会用Python,R,或者MATLAB。除了PhD的项目,申请人最好有自己的小项目,比如很多人做过的twitter自然语言分析,纽约citi bike之类的。如果只是写自己PhD阶段处理过的数据和项目,其实并不是特别充实,也不太容易过简历这一关。
- 面试的时候,需要申请人自己讲述一个数据处理的项目。这个项目不一定要非常复杂,或者非常高深。我之前有听别人说一定要有很炫酷的机器学习或者自然语言之类,但根据我个人的经验来看,Insight更看重申请者个人对数据本身的热情和对问题的思考,特别是表达能力。如何把一个项目讲得绘声绘色,让听众也能够很感兴趣,非常engaging,如何把一些复杂的编程语言说清楚,如何解释自己编程的逻辑(比如为什么选择决策树,而不是其他机器学习的模型)。如果只是进行一个简单粗暴的grid search,用TensorFlow建个神经网络跑几百个epoch,却不解释清楚“为什么”选择一个metrics,“为什么”要多次抽样,甚至于“为什么”对这个问题感兴趣,那么可能即使你的机器学习项目最后的准确率非常高,但也很难过得了面试。
- 我当时把面试的项目整理成三篇博客(http://www.juyang.co/shared-ride-efficiency-data-wrangling/),项目基本是数据探索和解释,并没有预测分析和机器学习。在面试的时候不仅给面试官展示了Python代码,也讲述了一个完整的故事,得到了一个比较有用的结论,申请的同学们可以作为一个参考。
- Data Incubator
- https://www.thedataincubator.com/
- 在Insight之前,我也申请了这个项目,但在code challenge环节被拒。后来想想被拒的原因非常明显,我的项目做得不好。就如我上面所说,我本以为一定要做炫酷的自然语言分析啊机器学习啊时间序列分析啊神经网络啊,这些看上去很“高端”的项目,却忽略了自己本身的技术和专长,以及时间和资源。俗话说,没有金刚钻,别揽瓷器活。我当时想做的项目是用自然语言分析纽约地区Yelp上的餐厅review,从而给用户推荐个人化的餐厅。这个想法可能是好的,但是项目工程太大,而且数据并不能简单获得,Yelp的API限制下载流量,所以我花了大半天才下好数据,然后发现这个API并不提供完整的review,而只是一句话简介。而我本身对自然语言(NLP)的了解只是停留在知道怎么用的阶段,并没有深入的理论学习,在分析数据的时候并不能很快地抓住重点。最后,因为时间有限加上数据不完整,这个项目我做得非常仓促。不过在Data Incubator失利之后,我吸取了教训,好好准备了Insight的项目。
投完简历就是面试了!这个时候的你,对数据科学行业有了基本的了解,自己的技能树也打好了基础。面试就是另一个阶段的事情了,以后有机会再写。
9. 结语之前
据我有限的道听途说,今年data scientist招人基本都是跳槽的experienced hire,新人大多要求博士学位。之前跟一些统计硕士聊过,他们抱怨说自己专业对口,花了几年时间专门学统计,难道还比不过那些个从物理生化机械转行的博士么?而现实是,除了某些打着data scientist名号把data scientist和data analyst放在一块招的,大多数data scientist真的倾向于博士,哪怕专业不那么对口。至于原因,问过一些面试的人,大概是说data scientist整体因为算是个不太成熟的领域,很多东西都要自己去探索,去research,自己去想idea,然后设计实验,分析结果,解释不清不白的数据,还要做ppt报告,几年博士的训练在广义的科研能力上可能更加适合,特别是在失败和不顺时候的韧性。当然就不提大多数博士年龄比硕士大,所以在人情世故上可能更通达一些。至于知识啥的,他们觉得你博士都读下来了,智商应该够,啥都可以以后再学。所以我其实觉得quit phd可能是比较冒险的行为,如果可以的话,最好是一边读phd,一边学习转行技能。说到底,学历还是很重要的。
在市场竞争激烈的现在,申请的时候别管工作名称,data scientist和data analyst,business intelligence,如果编程算法能力不错的话也可以申一下engineer职位。总之能申的都先申了,入门再说。与其抱着不切实际的理想,不如脚踏实地地从头做起。
【补充】:关于签证和身份问题,请咨询律师和学校的国际生办公室,我无法给出答案。但我觉得先不要想太多,拿到offer之后再考虑这些问题。即使最后不能在美国工作,也可以回国做类似的工作。
10. 结语
感谢这一路上帮助我的家人、导师、朋友、同学、同事,以及在我焦虑崩溃的找工作过程中坚持不懈打Dota2并一直陪伴鼓励我的PT。
火钳留名
大吉大利
非常谢你的经验分享,茫然不知前路的时候多了一盏灯,找准方向、踏实努力。
也希望你以后工作开心?
谢谢!也祝你好运:D
太厉害了!这一路走来,可能只有博主自己才能体会到里面的努力,与辛苦。结局是好的,恭喜!
非常感谢分享的经验,思路非常清晰。每一个时间点和和任务点都是干货满满,希望我也能沿着这个轨迹收货自己的offer。
博主大牛!恭喜~而且这篇文章是我看过的,关于生物phd出路介绍最全面的。
感谢博主分享啊,真是我PhD道路上一盏指路的明灯啊!相信博主“浴火重生”以后一定会顺风顺水,开启人生新篇章的!
来给大佬点赞!转了金融的加班狗表示,“工作时间特别长,而且压力也不小”这句话应该加粗加下划线…博士毕业的时候曾经拿过某知名consulting co.的data analyst offer,但最后还是觉得不太适合,放弃了…转行本身就成本颇高,所以一定要选择适合自己的…
适合自己的,累并快乐:D
谢谢分享,这是我看过的最有条理最有帮助的转行攻略文,跟我的经历很有共鸣,很有借鉴意义,收藏了。我也是生物phd(不过学校排名靠后), 入门data science也是从udacity nanodegree开始的,对udacity挺有感情的哈哈哈
感谢博主的分享,请问博主,这里贴出的简历就是当时投简历时候用的么?自己最近在投实习(master 第一年),觉得做过的项目和博主挺像的,但几乎没有收到什么回复,就有些迷茫是不是自己做的项目太简单。
我一方面应该是运气好,另一方面主要是内推和学校校招,自己投的也没几个理我的。最近市场偏好有科研经历的理工科博士生,master第一年刚来可能不是很有优势。至于是不是要做很复杂的项目,我也不太清楚,但该有的知识点和技能突出总是没错。
同第五年neuroscience转data science+老乡…和小姐姐共勉
太感谢楼主的分享了
我去年硕士毕业,读的石油工程,无奈没有合适的工作也对石油不太感冒。
后来发现data scientist是个很有意思的方向,这段时间一直在修coursera上的课,还是云里雾里。公司招人的时候要求不少,很多需要会,一直没理出个头绪那些重要必须会,哪些可以后期学。很开心看到这篇文章!!!!
我刚才看了那个data analyst的nanodegree 需要499美元哎 term2 要699美元
我也是石油方向,请问你现在转data science 已经成功了吗,拿到相关的offer了吗?
楼主真是用心良苦。感谢分享。特别赞!!
敬佩po主转行的勇气!之前被生化phd亲戚劝着要转行还不听想一意孤行读phd,这段时间经历了各种事情真的认真在考虑这件事。可能会走genetic counselor这条路!感谢po主分享,给了我自己很大的勇气
博主您好,请问您上的课基本都是online远程课程吗?您在找工作的时候有没有CS方面的学位证书?我也是物理系的PHD,正在考虑转行,但是不知道这些网络课程学习之后能不能获得承认,以及怎样才能找到实习和project的机会。谢谢!
有网课也有学校的课。我没有cs的学位证书。网课能不能被承认有多重要这要看公司。project可以自己做,kaggle和网课的项目都可以。至于如何找实习,你可以多搜一下论坛里其他人的分享。
对于面试data science的同学,其实SofaSofa.io上的面试题库还是很有帮助的。
看完博主的文章很受鼓舞。写的很不错。但还是想跟博主确认一下:
在拿到现在这份工作之前,数据分析/数据科学方面的知识经验积累,您除了靠参加网上课程的自学, 没有参与过任何实习(practicum / co-op)的机会,对吗????(当然是指在业界的employers 而不是培训机构的实习机会。做的是真实的业界项目)
谢谢
这份全职工作是之前暑假实习的return offer。就我的体验来看,没有实习找全职工作非常困难,而实习的面试相对来说比全职容易一下。所以我非常推荐大家去实习,这也是我为什么没有选择insight的培训,而选择实习。当然前提是能说服phd的老师。
谢谢回复。
自学数据分析,几种在线课程, 包括 coursera / Udemy / udacity 等等 , 你觉得哪一个比较值得推荐? 原因是?
我已经在文章里推荐了我觉得比较好学好用的几门课。不同的学习途径各有各的优点,因人而异。这都需要自己亲自把每个课程都稍微了解一下,看哪个适合自己的学习节奏,适合一个人的未必适合另一个人。我自己基本每个网站都用过,也没有说非要选一个。想来技能也就那么有限的一些(很多论坛都有总结),只要有目的地把该学的都学会了,项目都做好了,从什么途径学无所谓。
我觉得po主应该不是普通人吧。。转行pa路过 希望po主翻牌回复。毕竟不是每个人都能像你自学成功的。如果能说明背景更好了,避免后来人盲目跟data science风。
非常同意绝对不能盲目跟风,兼听则明,其他人的经历都只是参考,我们不一样,每个人都有不同的境遇…这里只是分享一下自己个人的经历,正如文章开头所说,希望给大家一点参考。
[免责声明]这里当然不是说这么做就一定会转行找到工作(那叫鸡汤文学),没有宣扬人人都可以做xx21世纪是xx的世纪,文中的内容都不是充分必要条件,希望大家结合自己的实际情况,多跟业内外的人交流,多了解行业情况,切莫跟风。
并没有特别的背景,除了付出该有的努力,确实是运气好。
满屏干货的文章!感谢您能记录学习研究的过程和心得为后辈们提供一些帮助!三年级数学phd挣扎于学术和业界到此一游。。。现在开始想着学一些编程转行了嘿嘿。。
请问现在你转行了吗?我也是三年级数学phd在挣扎。
谢谢楼主的建议和经验。
非常佩服您,我也是按照这些建议一步一步来的,目前还在不断努力中。
楼主您好,可以请教一个不太相关的问题么?
简单浏览了您的各个博文后,我非常喜欢您的博客和它organize的样子,也很想像您一样建个个人网站用来记录和总结自己的生活。可以请教一下您的个站是用什么搭建的、需要学习了解什么么?
谢谢!
你可以自己搜一下个人网站的搭建攻略,我用的是wordpress
谢谢!我这就去搜索。
非常感谢博主的分享,非常有借鉴意义。
我是国内在读的医学博士,做的是神经影像学方面的研究,因为分析MRI数据需要,也接触了一些基本的命令和shell脚本,进而对编程和数据产生了兴趣。
因为国内医疗环境恶劣,一直在考虑转行。楼主po的转行方向都非常切实,减少了许多迷茫,非常感激,祝工作顺利!
非常感谢分享!和博主相似的背景,在生物化学的坑里面被摧残的准备爬出来。光是边做实验边准备这些课程就真的让人很佩服了!
谢谢您的分享,我现在生物硕士毕业,在一个生物制药公司工作。
跟您之前提到的情况一样,依旧要做很多实验室的工作,从本科开始到研究生都是实验室实验室,其实早就厌烦了。但是在美国找工作,如果没有相关的教育/经历背景转行并不容易。所以只能拼尽全力找了药企的工作。但是一直对数据科学很感兴趣,所以最近下定决心,利用下班的时间来进行转型之路。
与你共勉。
非常感谢分享。从1月份开始到现在也自学了一些data science的东西。有一个担心就是如果拿一个自然科学的博士学位,去找一份DS的工作,以后申请H1B会不会因为专业不符被拒?身边好几个因为专业不服被拒掉(不是数据科学类的工作)。在去纽约上datacampe还是重新去申请一个CS之间摇摆,datacampe就是周期短半年高强度学习,但是最后只是有一份证明。CS周期长,但是至少不会被专业不符拒掉。楼主有什么建议吗?谢谢。
这方面我不是专家,而且工作本身有太多不确定性,你可以咨询一下律师或者国际生办公室。
楼主转行以后感觉就是化身程序员吗?本人女,土木工程学博士在读,很想转行做金融,but有些担心程序员是不是女生会没有优势呀。。T T
世界上第一个程序员,爱达·拜伦就是女性,哪里来的“没有优势”???
博主你好,非常感谢你的分享。这里的内容给我很大启发。你很诚恳地与我们分享了你的转行历程。同为在读phd想转行的我也下定决心开始了我的转行之路。有个冒昧的请求,我可否参考一下你之前的resume template,比如summary怎么加上去,怎么处理自己的research area 与data science 之间的差异,等等。我想,因为我的情况和你相似,所以这个模板和你的感想更符合我现在的需求。可否删掉你的私人信息将template发到我的邮箱呢?非常感谢。如果不方便,也请你原谅我的冒昧,实在是不好意思。祝一切顺利。
我把链接放在文章里了,你参考一下吧
谢谢你 : )
你好,您po的简历的链接需要password才可以访问,想问下password是多少呢?
文章里有写密码
Hi 博主你好,十分感谢你分享经历,感觉很有帮助。有一点想跟你再请教一下,就是关于R语言的问题。在 4.2 数据分析 这一节中,你推荐了 Data Analyst Nanodegree,并提到了这个课程包含Data Analysis with R;我刚才看了一下这个nanodegree的介绍,发现说的是Data Analysis with Python and SQL,感觉意思现在不讲R语言了 (?)。另外你最近的blog,Which language do you use at work? 你也提到自己工作中用到比较多的是SQL。那我想请问一下R语言在工业界中的具体应用,比如是大概哪些行业/公司在运用呢? 我自己做ecology,会处理很多数据,很多人都用R语言,比较好奇在商业工业界,R语言的情况。
另外就是如果自己学习/工作中用了很多R/SQL之类的,但是是理科degree,所谓的暴力转行找data方面的工作容易吗?方便问一下比如你的公司,或者你知道的业内这些公司,对于没有类似math/stat/CS学位的应聘者,有哪些需要补足的地方?
先谢谢了!
现在的nanodegree可能跟我当时修的课程不太一样,所以我也不清楚。
我个人不怎么用R分析数据,主要用python,但有些同事在用R,一些大公司也在用,具体哪些行业你可以自己研究一下。如果你熟练使用R,完全不会python也不是问题,语言不是重点,只要能够做出结果就行。比如我现在虽然用python做prototype,实际implement用的是scala,而我以前并不会scala,这都可以以后学。
找工作都不容易,不管是转行还是本行,如果已经用到R/SQL会有帮助,毕竟这都是基本的requirement。如果不会还得花时间自己学。
很多ds的应聘者都没有你说的那种背景,很多cs都去申请sde了,math和stat也很多去做了quant。不管什么背景和专业,面试考察的点都是一样的,自己查漏补缺,“需要补足”的地方也因人而异。比如如果你用R和统计知识很熟练,可能就要多复习巩固一下数据结构和算法。不过这也跟公司有关系,有些公司的ds完全不做big data engineering,也不考算法,只问统计分析和数据处理。
谢谢你的回复!你说的对,我自己感觉有点贪多嚼不烂的感受,估计是有点焦虑吧,看论坛上各种分享背景啥东西都会,感觉有点overwhelming,不过仔细一想,工作这个东西,基本功只是个敲门砖,真正发展的咋样,或者说做到什么程度,估计还是有很多非技术的东西的支撑的。能不能再问一下,你的回复和下面的回复都提到了,“找工作都不容易,不管是转行还是本行”,这个我相信是基于你自己的观察和实践的,那这个来源你觉得大概是为啥呢,学的人多了供大于求了吗?如果我们国际生没有了身份的顾虑(意思不给sponsorship的公司也可以去的话),会把机会大门提高百分之二十甚至更多吗?
找工作都不容易,不管是转行还是本行,这个我觉得倒不是供求关系的问题,事实是,不少人真的没有做好准备。不下功夫的话是很难找到工作的。当然,最近的job market确实对new grad不太友好,很多职位都只招senior,但如果你有能力(加运气好)的话,总是可以找到的,身份对机会的影响我不说你也能知道,但这都是我们无法控制的因素,做好自己该做的就行,别的先不要担心。
非常感谢你的分享,给了我很大的转行勇气!我是2015年入学的物理博士,大约在2020年Spring毕业,现在也想毕业之后转Machine learning和Data Scientist的方向,不知道还来不来得及?
这个很难回答,只能说“什么时候都不晚”,但job market未必乐观
很全的一篇文章, 谢谢博主的分享, 很受用。祝博主工作一切顺利~
大神V5~写得相当实在~
一切顺利!
多谢尚哥!
大神当时刷题花了多少时间和精力 ? 面试问道刷题的多吗
ds没有太多题库,不少公司也不怎么考算法。如果你说的是leetcode的话,我大概刷了一个月的easy和medium
非常佩服,非常感谢!
感激!master在读还有一学期就毕业了。本来一心想做科研申请phd,但master阶段认清自己对科研没有那么感兴趣。而对数据分析一直很有兴趣,准备自学上网课,希望能在1年内入门吧!感恩作者的分享!
感谢大神分享经验!
有三个问题想请教一下。一个是请问博主在读phD的时候导师对你参加课外活动或者自学各种课程的态度如何?你是如何兼顾phD工作和课外学习的?我也是生物专业,想自学些统计编程类的东西,上学期选了学校的课还报了udacity的nanodegree。然后就收到导师写给我们系里的信,说我干太多课外的事实验进度不理想(虽然我自己觉得我干的活其实不少……不过被老板看到过我在实验室做udacity的project可能留下了不好印象),还说如果继续下去会考虑停止我phD……给我吓的够呛。后来就没敢再碰udacity,圣诞假期那两周才集中时间把nanodegree修完。感觉申请实习之类我导师也不会很支持。
第二个问题是我感觉学习和真正用起来以及展示出来并不一样。我还挺喜欢学新东西的,比方说python在Udacity学+不会就google,感觉不特别难,nanodegree的project也挺容易的,但我不觉得我能把这些project非常有趣地展示出来(比方说在面试的时候)。不知道是我对ds的兴趣没那么深,还是我还没做到真正有趣的东西,或者缺乏沟通和展示的能力。
最后,请问博主大概学了多久ds、距离毕业前多久开始找实习,以及实习怎么找能简单讲一讲么?
谢谢了!
1. phd顺利毕业比什么都重要,而顺利毕业的前提是过了导师那一关。就算是自学也不能在导师眼皮子底下吧,不仅不能在实验室上别的课,还要在实验室更加刻苦做实验,争取早日毕业。编程课外学,就是做完实验回家学,周末学,放假学,别人都在喝咖啡逛街,你自己在家在图书馆一个人看视频,写代码。我自己的udacity的课和项目都是在家完成的。在导师面前,还是一如既往地科研,说起未来的打算,也是表示在考虑做postdoc,不过也得看paper发的怎么样等等。如果明目张胆地跟导师说要转行,将心比心,导师肯定不开心。至于实习,先拿到offer再跟导师说,没有offer说啥都没用。有了offer,再来晓之以情,动之以理,就算最后导师确实不同意,还是那句话,顺利毕业还是第一位。
2. 如果觉得udacity的课很基础,那你可以抽空看一下这本书,the elements of statistical learning,就会有比较深刻的体会了。至于展示能力,你得先有实战的面试经历,才能了解自己。可以先申请几个小公司练一下手。你也可以找人做一下mock interview,看看别人怎么说。展示沟通能力都是要跟别人练出来的,自己一个人确实很难提高。
最后一个问题,这个很难说,因为ds不只是学几个machine learning算法和python sql,上完udacity的课就完事了,很多时候还要有统计、微积分、线性代数、物理、商业常识、社团活动、社交能力等等的积累。如果说是从第一天学python,那距离我找到实习也不到一年时间,但如果算上对不同职业发展的折腾和尝试,那可以说是从phd第一天就开始了。我毕业前两年左右开始考虑申请实习,直接网申。你要是认识人也可以让别人内推。
路过答一下:)关于处理跟老板的关系,还有一种方法是把统计编程的东西用到自己的研究里面。老板的主要目的是科研产出,而统计编程和ML的东西往往是可以直接转化成科研成果的。所以,如果你课外自学的东西对科研也有一些帮助,就比较容易跟老板沟通。最简单的方法之一,就是把自己的研究方向往生物信息或者计算生物领域靠一靠,把自己学到的ML技术用在科研里。
我读生物博士前几年做的东西也基本和编程无关,但是偶尔自己写了一些程序处理图像什么的,老板反而还挺鼓励的,觉得会编程是件好事(这个跟老板的性格也有关)。再后来就主动找老板说我们可以做一些生物信息的东西,对发paper很有帮助。老板同意了之后,就可以名正言顺的写代码和学习一些统计ML的东西,最后做出来的数据也确实可以发表,对实验室很有帮助,而且可以以此为理由上CS系的课。总之就是尽量主导自己的研究方向,而且学会说服老板自己这么做对他也有好处。当然,除此之外还需要自学很多东西,因为跟科研直接相关的技术往往跟工业界的需求不太匹配,只有自己研究领域的project是不太够的。
非常赞同!
謝謝博主分析經驗!學到了不少。其實我也有類似的問題。我是大二在讀流體力學的PhD,但情況不大一樣 我教授沒錢所以讓我每個semester都做TA,好處是他也不管我實習;壞處是這樣子下去我自學,做project +實驗+TA起來也非常難受 感覺三樣都做不好。實驗也都零計算 導師非常偏實驗+理論範疇的。就算他人夠好讓我畢業了我也感覺啥也沒學到 我想問到時候申請時只有PhD文憑本身(沒有太多paper),加一兩個實習和刷的項目課程真的足夠嗎?(當然他也很有可能不讓我這樣草草畢業。)
我也在考慮轉去STATS,Data, ORIE這些的PhD program,不知道會不會時效更高呢 雖然不大可能 也好像沒人會怎樣做(大概因為決定找工作的話讀這些的PhD浪費時間)?畢竟我還有轉的時間 所以也想抓緊時間該轉早轉。老實話,我也不抗拒放棄PhD直接轉去Data OR Master這些degree (考到了康村的PhD,說實話 不讀出來感覺也是略可惜)。只是感覺現在分析行業也在縮窄,真的不清楚未來會怎樣。所以最後想聽聽博主對我情況有沒有什麼建議。
再次感謝博主提供的資源和任何建議。
我想問到時候申請時只有PhD文憑本身(沒有太多paper),加一兩個實習和刷的項目課程真的足夠嗎?
– 是不是【足够】我也说不准,都是分人的,你可以看看其他人的简历或者linkedin。如果有实习经历的话,确实会非常加分。但完全不看paper的多少
我也在考慮轉去STATS,Data, ORIE這些的PhD program,不知道會不會時效更高呢 雖然不大可能 也好像沒人會怎樣做(大概因為決定找工作的話讀這些的PhD浪費時間)?
-不知道哎,这些专业的phd也是得自己出来申请实习找工作的,他们毕业的压力也不比其他专业小。如果你现在就能找到实习,我觉得不用转。除非你想做特别研究型的ds
老實話,我也不抗拒放棄PhD直接轉去Data OR Master這些degree (考到了康村的PhD,說實話 不讀出來感覺也是略可惜)。
– 我不建议直接quit phd转master,毕竟名校的phd还是很值得的。如果能一边读phd一边拿master就最好,虽然我不知道怎么操作,是否现实
只是感覺現在分析行業也在縮窄,真的不清楚未來會怎樣。
– 确实如此,所以我的建议是赶紧做项目,找实习,先入行再说
很感謝博主的回覆!其實我也想完成這個PhD, 但真的要兼顧 科研,每個學期 的TA,實習,和刷課程project的情況下感覺很難畢業是真的。也怕讀完之後 data的市場面貌就已經完全改觀了。所以想著像您說的趁早轉去data master入行。再次感謝博主的意見。
环境phd在读,彷徨中在申请data science intern的时候,看到了大佬的这篇博客。
真的是受益匪浅。希望能够有机会可以和大佬认识一下。
也看到这一篇文章发表了一年多,作者还是可以回复我们的评论,真的是万分感谢了!
要是以后有机会来到旧金山湾区,一定要来找我吃个饭(现在在Berkeley)!!
Hi, Ju
你在文中提到你也参加了Udacity Data Science Nano Degree的课程。你觉得如何?我刚刚完成了Data Analyst Nano Degree, 在考虑是否要参加Data Science的课程。
谢谢!
Jingle
用来入门挺好的,尤其是里面的项目
hello,请问您觉得现在的data analyst nano degree 的收获大吗?貌似课程和之前的相比有改版了
改版后我也就不了解了
谢谢分享!我也在纽约工作:-)
大神刷题用的什么语言? python吗
嗯,主要用python,有时候也会用C++
太感谢楼主写了这么多,每一点都对我很感兴趣。我有两个方面的问题。
1,关于神经科学。我是心理学背景的,现在还是硕士,想往neuroscience方向走,做EEG的,自己设计实验,人类被试,分析EEG或者用别人的数据的那种。也尝试做一些建模,计算,脑机接口方面的东西。现在我有几个方向,学习有点学不过来,一个是做专注心理学的实验,然后做些建模和computation方面的;一个专注EEG信号处理,做BCI;一个是做认知或者行为的Bayesian modeling。这几种不知道您是否了解或者做过相关的东西,能否给我一些建议。据我所知,偏生物方面的确竞争激烈大牛众多,我不知道我所说的是不是也一样呢?
2,编程方面,我对具体的算法和数据结构的有兴趣,但我感觉我学的也不是很好。但是概率统计和机器学习中,我对理论和计算和推导都很有兴趣,自学了测度论和随机过程,现在对行为和认知的Bayesian modeling很有兴趣。我喜欢推公式,但是已让我做,我就不太愿意做,感觉很繁琐,而且对商业思维一点兴趣都没有。这样的情况,适合做data science吗?
1.“偏生物方面的确竞争激烈大牛众多”,其实偏计算方面的确竞争激烈大牛也非常众多,很多computational neuroscience都是CS和stats的phd在做。我对心理学不是很了解,你可能还是需要跟相关专业的博士生和教授聊一下
2.ds很少有需要推公式的,除非你是非常理论的research,大多数ds只要求懂原理,会应用。商业思维也看不同岗位,有些偏analytics的ds可能需要有多一些的商业,偏engineering的ds就不要求什么商业思维,但对算法和数据结构要求比较高,偏research的ds很多时候也不怎么要求商业思维。适不适合做ds你得多跟已经做了ds的人聊,因为不同岗位相差非常大,不是说推公式+数据算法+商业思维 = ds。
谢谢您的回复。我周围的人同质性很大,一本就是读博,然后博后,很少有工业界的。对于科研方面的信息,大部分人给我的信息都是比较正向的。我觉得的确应该多招点人聊聊这些。
非常感谢楼主的分享,我是环工在读phd,年底之前毕业。之前自己选修过python课程,申请了今年fall本校DS的相关学位。
有几个问题想请教前辈,
1. 坦白讲,绝大部分转行的phd可能确实在本行业成绩不是很突出,或者一直找不到好的机会。前辈在找工作的过程中,有被刻意问到这类问题吗?比如,为什么放弃你原来的专业。
2. phd学位有对你找工作过程产生一些积极影响吗?除了你提到的,雇主认为phd解决新问题的能力可能会强一些。
1.很多面试官也是转行的phd,所以对科研环境僧多粥少的情况也都了解,转行的phd也不在少数,做跟原来专业不相关的人也很多。面试有时候还是会问为什么想转行,你可以搜搜网上别人的答案,真诚的回答就行,如果能跟自己的科研扯上一点关系就更好了
2. 可能也就是我提到的那点了吧,科研能力和思辨能力。其他我还不太清楚。招phd可能比master更贵,很多ds职位可能用不上phd,也可能因为overqualify被拒。
大神当时enroll了nano data analyst program 吗 ? 还是自学的那些些课程? 现在program 改版,很多课没有了。 现在只后 Intro to data analysis,practical statistics,data wrangling, and Data visualization 。 很犹豫是不是应该报这个program
嗯我当时是这个program,现在跟我当时不太一样,所以我也不知道怎么样
楼主你好~我是商科转DA的小白,看了你的文章受益匪浅,非常感谢~因为最近也在努力找工作,所以有几个问题想请教:
1.已经自学了python,SQL,R和Tableau,主要在刷sql题目(因为想找entry level的DA所以觉得SQL应该是最重要的),想知道我努力的方向是否正确,sql是否是我应该着重练习的部分?
2.我之前的实习经验都是marketing方向,我想知道在简历书写方面如何更贴近的帮助我找到DA的工作呢?
3.想知道楼主花了多久时间投简历最后找到工作的~已经奋斗了一个月每天5份海投却还是看不到希望,想要放弃了~~谢谢回复!祝一切都好!
1. 对,da的话SQL确实是考察重点
2. 强调自己的数据分析能力,比如用sql和python做的项目
3. 我当时也是投了很多很多简历,基本看到有职位就去投,也有很长一段石沉大海。5份每天也不算多。加油。
Data Wrangling with MongoDB 这门课楼主觉得重要吗? 我跟着学了一段时间感觉比较晕,视频貌似说的也不是很清楚。请问在实际运用中很重要吗
SQL还是很重要的,mongodb这个平台倒不是每个公司都用。只是学sql的话也可以看一下sqlzoo之类的练习网站
博主你好,我是社科的phd,学过一些统计的知识,现在也在自学python和商业分析,我是报名了万门大学(国内的online course,老师都是美国大公司的,讲的很不错,有个缺点就是没有项目,只有老师上课带的例子)。现在有个问题就是,想找项目练手。你提到了udacity上的项目,但我不想再花钱报名上课了,请问怎么找项目来练习呢?kaggle吗?能具体指导一下吗?感觉那上面东西太多了,我有点摸不着头脑。另外,找实习时,就强调做的这些projects,是吗?我之前找实习说自己的research经历,感觉很鸡肋,也没拿到实习。。。谢谢你的分享和回复。
项目我当时就是通过udacity和kaggle做的,你可以搜搜参考一下别人的项目。我实习简历里就是这些项目,重要的不在于数据有多复杂技术上有多先进,重要的是基本的数据处理流程和方法,以及对算法本身的了解和解释。research提一两句就行,除非你用了很多数据处理的方法。公司看中的是你的实战能力和个人的initiative。
楼主好,跟你的心路历程好像。读博读到一半就想转行,觉得自己不是做科研的料,但后期由于怀孕+找工作+生小孩实在是分不出精力。博士的专业也涉及到很多编程、统计、转模式,现在做和本专业相关的软件开发工作,但工作经验有限。有点迷茫,感觉自己高不成低不就,什么都接触过一点但没有很深入的钻研下去。而且博士专业比较冷门。感觉data scientist的界定很模糊,转software engineer的话就要把计算机相关的课学通再加刷题,对自己信心不足。还是得从提高自身开始,努力把短板补起来。
你好,想请教一下,你推荐的那个Udacity的Intro to Data Analysis课程。https://www.udacity.com/course/intro-to-data-analysis–ud170,里面用到的资源(the data files from the Resources section),是在哪里下载啊,这个课程里没找到下载的地方啊
不好意思,时间久远我不太记得了,你可以在课程forum里发帖问问
想问一下这样转行的话身份问题怎么办opt ext,h1b现在都很严很难办下来啊。楼主找工作时已经拿下绿卡了么
这个你需要具体咨询律师。我phd期间修过cs和统计课程,而且phd的项目也比较偏计算,所以签证都不影响。
多谢分享!目前在读phd,但是老板说我论文讨论那一章写的不好一直不让过,联系的工作都被迫取消了。我自己也想过quit,这么多年下来老板基本不关心我的论文项目,好不容易我坚持做完项目,以为春天要到了,结果各种不满意,我的学术热情都快被磨光了。但如你最后一章所说,都读到这个阶段了,quit太不划算了。你的经历对我非常有启发。我现在也在严肃的考虑一边慢慢修改论文拿学位,一边自学一些data science,然后去找一些industry的工作,尤其是research方面的。
谢谢热心小姐姐分享。我现在正在做博后,对现在的研究不是很感兴趣,所以想转industry工作。想问下小姐姐您当时博士实验的数据都发论文了吗?如果没有,怎么和导师商量的呢?
顺利毕业是一切的前提,跟导师是否supportive和每个专业的要求有关。每个人的情况都不一样,也不太有参考意义。
你好,
请问你有没有考虑过身份问题呢?因为我觉得以后如果申请绿卡什么的话,可能会要问到研究的方向和工作的内容。如果两个方向不一致的话,到时候申请的EB1A甚至是NIW都会有问题的,这个你是怎么解决的呢?我自己对data science也还是蛮感兴趣的,就是在这个方面担心怕过不了。
谢谢
我文章里已经写了,这个你需要咨询律师。
您好,想请问一下文中提到的身边很多朋友已经拿到Ph.D 后去读了CS master,是重新申请学校和program吗?不知道还需不需要语言成绩等?我看很多master program的申请都需要elementary knowledge in CS,不知道您知不知道有什么学校的program可以不需要计算机背景呢?非常感谢
这些细节我确实不知道,你可以在网上搜搜
读完你的文章受益匪浅,我想让更多的人看到这篇文章,请问我可以把它转载到其他平台吗?我会标明出处和作者。
谢谢你的回复。如果你想要分享,请直接分享文章的链接,但请不要转载文章本身。我开设这个博客进行写作而不是用其他平台的一个原因,就是为了有一个固定的平台能够直接跟同好和读者进行交流,转载的话就失去了交流的途径,希望你能理解。
谢谢分享,感到收获很大!我刚结束申请,本来明年去美国读神经科学phd。但是对于之后是否要走学术道路感到很犹疑,打算defer一年探索一下别的可能性。有两个问题想请教博主:
– 跟神经科学更相关一些的转行方向有探索过吗?
– 既然最后离开了学术圈,做的事情也跟phd期间工作无关了,还有必要花时间读phd吗?如果可以选,是不是本科毕业直接开始做data science方向会更好一些?
– 跟神经科学更相关一些的转行方向有探索过吗?
不知道你具体指的是什么,计算神经的话其实更倾向有CS背景而不是神经背景的,而像deepmind或者openai这样偏学术研究的机构对文章的要求比较高。
– 既然最后离开了学术圈,做的事情也跟phd期间工作无关了,还有必要花时间读phd吗?如果可以选,是不是本科毕业直接开始做data science方向会更好一些?
这个见仁见智吧,有的人觉得phd的训练和title更重要,有的人觉得工作经验的积累更重要。
最近正在申请Data Science研究生专业,多谢楼主分享!
已收藏,准备按照步骤学习,谢谢!
非常非常感谢作者的分享,虽然我来晚了:)
谢谢分享啊,写的非常用心!也给了我很多启发
我本科统计,干了2年多BI,现在在读DS相关的硕士,快毕业了,但是求职的时候还是觉得这一行基本上要求挺高的,就像你说的,项目经验真的非常重要。我觉得最难的部分还不是技术,是对项目的商业逻辑的理解和思路,也是在寻找一些解决办法。
加油!祝工作顺利
感谢分享!还想请问一下,硕士如果想转到咨询行业的话可行吗?会不会资历不够呢?要做哪些准备呀?谢谢!
当然是可行的,至于要做哪些准备,你可以先看看这个网站,https://www.caseinterview.com/ 然后多跟已经做咨询的人聊一下,因为我自己不做咨询,所以这个问题我不好回答
目前博一刚结束,欧洲纯数学PHD,一共4年将来还想往美国找工作。目前的想法是SDE和quant转一个,但是看了博主的data scientist,又困惑了。
目前在自学PYTHON,只是想干一个稳定点的工作,不知道从我专业和学历来看,是不是quant是最合适的呢?只是想做一个朝九晚五的稳定工作,不想在工作中有大的风险。
你可以多去一亩三分地论坛看看各行各业的讨论,sde, quant,和ds三个工作各有优劣,是不是朝九晚五其实也要看公司。至于稳定,都是相对的,这三个工作都算是依托于tech或者金融,比如这次疫情,有些看起来很稳定的公司也会裁员。我觉得也不太需要刻意追求稳定,还是要提高自己的核心竞争力和持续学习的能力。
感谢分享!现在学到了COMS W3136 Essential Data Structures in C/C++,但是没有找到资源,请问这课是只有哥大的学生才能上吗?
可能是吧,就像我正文里所说,随便上一门算法课都行,比如mit的网课,不一定非要是哥大这门课。
楼主你好,neuroscience 同行握手!看了你resume真的很受启发。我自己是cognitive sciences 的phd做eeg 和fmri 的, 属于mathematical psychology, computational neuroscience 和biomedical engineer 的交叉。导师是bme + neuroscience,所以大部分都是signal processing 和bayesian的行为建模,也有用到一些neural network 和reinforcement learning. 还有一年graduate 统计的 core courses,所以也算比较quantitative. 请问按照你的经历,我的简历写phd in xxx 以上哪一个/哪几个title 会比较容易得到面试机会呢?博士第三年刚开始, 希望找找intern 试试看。先谢谢你~
可以写computational neuroscience
写得很好
特意回来感激博主!
因为博主的这篇博文,给了我转data science的信心和方向。对我顺利找到data scientist的实习和全职起到了很大的作用。
恭喜恭喜,共同进步!
开了YouTube频道,马上关注。这个博客真的特别有帮助,再次感谢!
谢谢你这么详细地分享你的转行经历,你真的很努力, 做了这么多不同的探索, 最终找到适合自己的career path, 非常鼓舞人心。 看好你的youtube channel哦!
非常感谢分享 非常有帮助
感谢分享,真的是非常仔细和Inspiring! 开了YouTube频道,马上关注
每次来都能有新的感受,谢谢小姐姐的分享。
感谢博主的分享!太实用了。
请问,转行计算机可以不用上学拿个学位?就像您一样只上网课加做项目就可以了?
谢谢!
学位的作用主要还是帮你通过简历关,简历过了之后,面试的话就全靠个人能力了。现在竞争很激烈,如果你没有专业学位,就要问问自己,为什么人家不招专业出身的学生,而招你。如果你觉得自己的优势足够明显,那么可能不需要专业学位。所以这个也要看个人的情况。我申请的时候是4、5年前,那时候转CS和DS的人没有现在这么多,我身边还有又不少专门去读CS学位的。我也是幸运地直接转行成功了。
谢谢您这么快的回复!了解了!
祝您事业更上一层楼!
谢谢小姐姐的分享。近期也在考虑转data science方向。就您的经验和在这个行业呆了今年的感受,您觉得这个行业现在快要饱和了吗?未来的发展前景如何?因为周围出现了越来越多的学习data方向的同学,所以想借鉴下您的看法。感谢!
确实现在竞争更激烈了,未来前景是好的,但是不是饱和我也不太清楚
感谢楼主的经验分享,从今年年初到现在看了好几遍,每次看都有新的体会。
有几个问题想问您一下,如果您有时间的话。
我是天坑专业phd,今年八月毕业,之前没有任何编程经验。今年一月决定试试转data,然后看了您的帖子开始学习,我现在已经把Udacity的Data Science with Python, Data Analyst, Intro to Machine Learning 都啃下来了,现在在上Data Scientist的课,估计再有半个多月也啃下来了。虽然拿到了这些nano degree,但是我越学越没信心了,总觉得学的越多觉得不会的东西越多,要学的东西也越多。
目前我打算四月中旬结束Data Scientist的课之后,申请Data Incubator的bootcamp,虽然觉得希望不大,但是还是想试一下,之后的话就去kaggle上做做project,看看能不能完善一下简历。如果四月之后没有bootcamp可以上,我想试试数据应用学院的课程,我搜集资料时在youtube上看了一些他家的公开课,他家会有一些project可以写在简历上,只是不知道质量怎么样。
这是我现在的情况,想问一下您觉得我这样规划有没有什么问题,以及有没有什么建议,谢谢!
东西确实很多,这篇文章写的时候分工还没这么细,现在领域分工比较细,DS偏统计和商业,MLE或者SDE in ML的方向偏建模和编程,所以你学起来会觉得什么都要学。我过些时间有空会更新一下行业的细分。
我觉得你可以尽早开始申bootcamp或者找实习,如果能找到contractor的工作也可以先干着,还可以去学校看看有没有跟DS相关的科研工作或者教学工作。最好是能尽快有一些实战的工作经验,先入门。
非常感谢楼主的分享!我也是neuroscience PhD在读想要转data scientist,看了你的博客感觉超级鼓舞! 请问楼主学习做笔记(方便回顾整理)用的是word,laTex,还是google doc(记得楼主好像在哪里提过),或者楼主有好的软件推荐吗?
对,我一般就用google doc,比较方便搜索
Thanks for sharing!!! very useful.
I finished the data science ND from Udacity but did not get any interview chances.
Now I know this is just the beginning:)
Looking forward to hear about the most updated frontier of data science:)
and of course the advices on how to prepare:)
I want to follow your path: from DS to MLE.
我是物理化学博士,有一点数理背景,基本编程能力。
我有个问题就是最近有华人开的培训班跟我联系,号称很多学员拿到offer, 也有分享youtube.
但是价格偏贵(7-8k)。
我看了他们的课程大纲,并没有比udacity 多很多内容。
我估计去了也就学习一下面试 工作经验,
学姐觉得值不值得去呢?
是不是把时间更多得花在做项目上?
谢谢。
我没有参加培训班的经验,所以没法回答这个问题。现在entry level DS的就业行情跟几年前不太一样,我之后有时间会专门讲这个。从面试的角度,实习/实战/ > open source project > bootcamp >= online courses. bootcamp更多的可能是提供network和内推的途径,至于面试的技巧和一些职业发展的东西,网上免费的资源也有很多。
非常感谢博主分享的经验,给大家转行提供了一个参考价值很高的范本。我想请博主给点关于转行的意见。我博士毕业三年了,在做博士后,时常会接触一些编程,但是都是用MATLAB,和比较老的编程语言FORTRAN。Python最近过了一遍,还没有大量练习。我博士专注于概率论方面的知识和传统的土木工程学科结合,比如运用Monte Carlo simulation,random field,等一些零碎的随机理论和概率统计的知识。我想转data scientist,但是不知道需不要需要系统学习一个MASTER IN DATA ANALYTICS。这样会不会更有助于找工作,毕竟现在的行情竞争更加大了。另外不知道你是否清楚网上的那些bootcamp或者Udacity网站这样的Nanodegree的市场接受度高不高?
现在的工作行情跟我之前不太一样,所以是否需要学习一个master和bootcamp的情况我不太能够回答
非常感谢小姐姐的分享!作为化工phd很受用~希望能成功转行,如果你愿意可以把这些分享搬到小红书上,相信会有很多人喜欢的 ♥
请不要转载搬运到其他平台,谢谢
楼主牛人,楼主是年龄多大转的程序员呢, 年龄偏大后还有优势吗? 我和楼主差不多情况,目前在考虑,36岁转算大龄吗?
我觉得年龄和转行没有直接关系,看心态。转行之后从entry level做起,身边的同事或者老板可能比自己年纪小、工作时间长。只要你自己开心就可以
来的太晚了, 有些链接都失效了,????。。。一开始Python那俩点进去都没东西了。。。顺便问下楼主, 推荐的这些课程有些免费,但大部分是需要花钱买的是吗?
嗯,这些课之前都是免费的,现在可能下线或者收费了