MacTrack 2019-11-03
全文共3013字,预计学习时长6分钟
来源:Pexels 上传者:Lukas
数据科学职业生涯中最难的无疑就是起步阶段了。开始涉足数据科学工作并非易事,对于没有博士学位的人来说尤为艰难。如果在网上搜索数据科学入门级工作相关信息,你会为其高要求而感到绝望——几乎每一份工作都要求博士学位或者3年以上机器学习经验。那么问题来了:“没有相关经验如何获得数据科学工作?”
成千上万的人在互联网上或者大学里不断学习数据科学课程,这对于技能提升很有帮助,但对于找工作却没有什么竞争力。通往数据科学的道路并非只有一条,无论你是即将毕业的学生,还是想要转行到数据科学领域,都有很多获得相关经验的方式。
在学术论文研究中与他人合作是获得数据科学相关重要领域经验的一个很好的机会。但这个方法的缺点在于薪酬不高,且不涉及机器学习。尽管如此,还是强烈建议进行数据科学研究以丰富自己的简历。
为什么这是一份很好的经历
进行研究的吸引力来源于两个方面。首先是数据处理的机会。出于研究的性质,你有机会参与数据的整个生命周期。其中一些可能在以后的工作中并没有用处,例如数据收集。但还有一些是很有价值的技能,比如分析和解释。在分析的基础上解释数据并得出可靠结论有着重要价值。由于其作为一项技术技能很难评估测试,因而这项重要技能有时会被忽视。一个真正的数据科学家和一个只会在sklearn.ensemble中输入随机森林模型的人的差别之处就在于能否对结论进行解释。从事学术研究要求根据数据得出结论,同样,在工作中,需要根据结论做出决定。
其次,学术研究教会你如何做实验。你对实验的影响程度取决于与合作的人及小组人数。提出有价值的问题并通过实验得出结论是所有学术研究所必不可少的步骤。这种技能在数据科学领域同样能够得以应用。你需要提出问题,通过机器学习来进行试验并得出结论。获得相关推动研究的经历有助于你成为一名数据科学家。在没有人告诉你解决什么问题或者如何解决问题时,你仍然能够自主而高效地工作。
如何实现这一点
学生和非学生群体寻求研究经历的方法不同。找一个研究你感兴趣领域的人至关重要。你需要将你的兴趣延伸至机器学习之外,因为研究机器学习领域的人相较于其他学科领域的人少之又少。一旦确定了研究方向,你需要将有相关兴趣的人列出。
学生与非学生群体的不同之处在于,如果你是学生的话,可以在学校里找一找。通常,你能够找到一个研究助理的职位,并获得相应薪酬。当然这并不是说你不应该去找那些不公开招聘助手的教授们。毕竟,进入一个有50位研究助手的实验室和与教授一对一进行研究的体验是不同的。
如果你不是学生,那建议你可以联系任何一个你感兴趣的人。给他们发邮件介绍自己、为什么对该实验感兴趣以及能提供的帮助。即使找一位教授跨国远程合作来进行研究也可以,重要的是你要找到合适的人和感兴趣的研究。
重新撰写职位描述
从事数据分析领域并不意味着你必须找到一份有数据科学家头衔的工作。无论你在哪里工作,全职或是实习,找机会尝试一下机器学习。
为什么这是很好的经验
没有什么经验比切实从事数据科学工作更好了。无论你现在的工作是什么,只要你能将它与数据科学联系起来,那么,这基本上等同于从事数据科学工作。如果你可以证明自己用机器学习解决过一些问题,没有人会在意你的职位是什么,他们只关心那个项目。
另一个原因是这可以体现出创新能力和解决问题的能力。在工作中,没有人会告诉你用机器学习来做什么或者如何解决一个问题。这一点与做实验的经历十分相似,你可以向招聘者展示你独立自主识别问题与解决问题的能力。
如何付诸实践
怎么做取决于你的具体工作以及你的经历。下面是具体的建议:
1.不要为了自己想做的事情而拖延工作。
2.及时向经理汇报工作内容。
3.尝试发现有助于增加企业价值的问题,而不是仅将其当作机器学习的平台。
4.如果第一次尝试没有成功的话,不要轻言放弃。找到适合自己的方法。
独立完成项目
虽然很多人都说过在空闲时可以自己做数据科学的项目,再提及似乎有点啰嗦,但这真的是一个很好的方法。独立完成一个项目可以体现出你对数据科学的热情和能力,这与Kaggle等数据科学平台或者学校的项目是完全不同的,会给你带来无与伦比的体验。
为什么这是很好的经历
最优秀的员工通常都是那些做自己喜欢事情的人。招聘官通常喜欢招收那些喜欢攻克艰难问题的数据科学家。真正热爱数据科学的人在闲暇时间也愿意编程和构建机器学习模型的。如果独自做项目对你来说是件苦差事,你只是想通过它找到一份工作而已,那你可能需要好好考虑一下你是否真的在做喜欢的事情。如果喜欢自己做一些小项目,并且建立起很棒的个人作品集的话,招聘者会看到你的动力和能力的。
个人项目是展示专业技能很好的方法。你应当不断学习新技能,并且做一个与正在学习的知识相关的项目,这既能巩固知识,又能展示才能。随着你做的项目越来越多,你的技能会逐步提升,你能够做更有挑战性的工作并且不断丰富你的作品集。然后,你可以将Github添加到简历中来展示你的个人经历。
怎么做
一个项目的起步阶段是最艰难的。一个项目由三大部分组成:数据、模型和结论。首先,搜集其他项目中没有使用过的数据,这些数据能够对你有所启发。尽量避免模仿别人做过的项目。找到数据后建立模型进行评估,得出你的结论。请以一种有趣的方式来陈述你的结论,可以发一篇博客,写在一个漂亮的笔记本上或者使用幻灯片进行展示。一种友好而简单易懂的方式同样重要。
展示你的经历
在获得数据科学相关经历之后,你需要在找工作时很好地表现出来。同一份工作,你既可以将它描述地非常枯燥,也可以将它描述地有趣而独特。以领英的个人资料为例,假如你决定和教授做一些关于防晒霜是否能预防皮肤癌的研究并发表论文,现在你需要将这份经历按照如下步骤添加到领英资料里:
研究助理
• 我参与研究了防晒霜在预防皮肤癌方面的作用,进行数据分析和论文撰写,发表在《美国防晒霜杂志》上。
这样的描述完全没有问题,但是这并没有体现出你已经具备数据科学工作的资质了。想要通过这份经历找到数据科学工作,你应该这样写:
• 作为一名研究助理,我参与提出并验证关于防晒霜和皮肤癌的假设,积极参与数据收集工作,并展示了通过线性回归得出的结论。即使一个没有统计学背景的人,也能够理解我这篇研究报告的重要结论。通过这次实习,我培养了实验思维,能够运用到以后的数据科学工作中去。
当然,这并非最完美的版本。我想要表达的是,如果你有关于数据科学的实习或者工作,大胆地将它写出来。你要明确地表现出你有意寻找一些数据科学相关经历来使你成为一名优秀的数据科学工作者。
结论
在工作前你有很多方式去获得数据科学经历,不要只着眼于课堂项目和Kaggle竞赛,发挥你的创造力,用你热爱的数据分析技能去做一些更有意思的事情。有了相关经历之后,要呈现出来让别人都看到。不要害怕申请一份要求两年以上工作经验的职位,你可以自信地说你已经具备这些经验了。
推荐阅读专题
留言 点赞 关注
我们一起分享AI学习与发展的干货
如需转载,请后台留言,遵守转载规范