3个月里修了12门数据科学课程后,我学到了什么?
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:目前,数据科学已经发展到可以实现任何事情的程度。怎样才能学好数据科学呢?学习任何一门课程的效果都取决于你是否有充分利用它的能力。作者就学习数据科学课程之前需要具有怎样的洞察力、以及如何最大化数据科学课程的有效性给出了以下5点建议:(1)对无限的可能性保持开放的心态;(2)需要接受标准的教育;(3)要提前熟悉Python,为机器学习和分析打好基础;(4)提高沟通技能;(5)加强人际交往。本文来自翻译,希望对您有帮助。
作者咨询了学过不同数据科学专业课程的人后了解到:为了精通数据,您需要提前熟悉一些自己能够发现的与数据科学教育相关的最好的资源。
数据科学不仅仅是一个随机的计算机专业。我读过很多与数据科学相关的文章,也听过播客,看过如何通过基本的计算机知识来掌握数据科学的视频。
一个IT或计算机科学学位是很有用的,但如果想深入研究数据科学,仅仅获得一个学位是远远不够的。还需要有相关的经验、联系、实践,以及具有现实生活用例的项目。
据研究,要想从技术专业中获得最有用的知识,学到的必须超越自己的学历水平。幸运的是,可以通过学习几门与所学领域相关的课程,来获得超越学位水平的知识,这是最好的方法。
有大量的数据科学课程在那等着你去学,想多学几门根本就不是啥问题。问题是要在上课之前做好准备。
学习任何一门课程的效果都取决于你是否有充分利用它的能力。本文将为你介绍在学习数据科学课程之前需要具有怎样的洞察力,以及如何最大化数据科学课程的有效性。
1. 对无限的可能性保持开放的心态
目前,数据已经发展到可以实现任何事情的程度。
这是一个一切皆有可能的世界。
大约20年前,分析本地企业的交易往往是一个漫长的过程。首先,收集和整理过程具有挑战性且浪费时间,主要的分析资料是传统的票据和资产负债表,还要做成幻灯片将相关信息展示给管理层。
今年年初,我在一家快餐店做分析师,其财务分析是典型的日常交易分析,不得不说,当时使用的数据分析方法和分析技术与现在的有很大不同,也没有那么复杂。
我想说的是,学习数据科学需要心胸开阔。要做好准备,将自己在学习数据科学课程时读到、看到或听到的任何东西都消化吸收。
如何去做:
大多数人都已经掌握了一些数据科学概念的知识,这还不错,但是,系统的课程可能会提供一种不同的方法或更好的方法来实现自己之前已经了解的内容。
学习课程时你需要理解新的概念,并将它们与自己之前学到的知识联系起来。
你会遇到不同的数据专业人士,他们可能各有不同的教学方法,与其比较哪一种更好,不如两种方法都去了解。那么你就会有两种方法来解决同一个问题。
把自己变成易教的人。
2. 需要接受标准教育
真不想让你觉得自己不够优秀。但事实是,88%的数据科学家拥有硕士学位,46%拥有从统计学、数学到计算机科学和物理科学等领域的博士学位。这些数据证明,需要有良好的教育背景,才能理解数据科学和大数据分析中使用的术语、概念和模型。
在成为数据科学家的早期,我曾向许多需要数据分析师的初创公司和企业申请过职位。我的简历上罗列着许多项目还附有一份精雕细琢的作品集,唯独缺少一样东西:就是一个大学学位。在我申请过的众多机构中,没有任何一家录取我,尽管有些机构很好心地给我发了回复:
“你很聪明,但你得完成大学学业”
“你忘记在简历中添加自己的大学信息了”
“你经验尚不足”
这些话语在某种程度上听起来很像父亲的叮咛。但事实上,他们说的都是对的。我需要接受良好的教育。在攻读学位期间学到的技能将提高自己的熟练程度,还能帮助自己过渡到任何数据分析领域。
如何去做:
这很简单,如果你还没有获得大学学位,那就去拿一个吧。如果你已经有了第一学位,可以考虑去攻读硕士或博士。继续学习,让自己从众多的数据科学家中脱颖而出。
我不认为“获得学位”是必须要做的事情,但如果真的握有数学、统计学或计算机科学等方面的学位,这对个人前景发展当然会有很大的帮助。
3.要提前熟悉Python,为机器学习和分析打好基础
你可能会问,为了数据科学,我真的需要学习编程吗?
根据《数据科学学位》(Data Science Degree)的这篇研究文章,数据科学行业对编程的需求程度之强,不可形容。随着越来越多的雇主逐渐地意识到了这一点,社会上对具有高级编程技能的数据科学家的需求也直线上升。
除了Java和R, Python是科技行业最常见的编程语言。这并不奇怪,因为使用Python你可以有效和轻松地执行大多数涉及到数据分析的过程,显然,Python也是开发和维护端到端项目的首选。这就是为什么O'Reilly采访的40%的受访者使用Python作为他们的主要编程语言的原因。
我学过的大多数数据科学课程,选修的学生必须在学习之前就具备Python知识基础。
在课程的某一进程,可能会有关于某些模块的描述,告诉学生在学习课程之前要先学习Python。这只是一种方式:告诉数据科学家、专业人士或业余爱好者,Python将减轻其在整个数据科学职业生涯的旅程。
如何去做:
开始去使用python。它的功能和效果会令人兴奋不已而不容错过。
这可能需要考虑安装Anaconda发行版,因为它可以提高你的代码质量,并简化Windows和OSX上的Python包安装。
如果你正在寻找一门Python入门课程,Datacamp是不错的选择,它可为初学者提供广泛的Python培训。
4. 提高沟通技能
分享一个有趣的事实:所有的课程都是由讲普通话的人来教授和解释的。
这听起来虽然很好笑,但却是事实。最好的课程对每个模块中包含的概念进行了深入的解释。大多数课程都是技术性很强的,少说多练。他们也可以学到理论,多说少练。无论课程采取哪种形式,你都需要首先为任何事情做好准备。
教授数据可视化方面内容的导师让我大开眼界,看到了数据行业中一些非常微妙的东西。他说,“最好的数据科学家是那些能够完美平衡人类交流和技术交流的人”。
他说的那几句话让我一直坚强不息。在人类交流和技术交流之间创造完美的和谐对自己的成功至关重要。不幸的是,大多数数据科学家往往忽视了高质量沟通技能的力量。他们认为,一旦能够部署模型、编写代码、对变量排序、编写Python脚本和操作数据,就可以解决问题了。
而我的想法是,当能够整理并平衡自己的编程技能和沟通技能时,才能在数据科学领域站稳脚跟。
如何去做:
阅读与数据相关的好书或研究文章。从作者的角度出发去获得见解,并认识到作者试图传递的要点。
如果你不喜欢阅读,多听演讲者的播客或互动视频也会帮到你。阅读和观看的主要目标是获得详细的想法,并用自己的话恰当地总结出来。
5. 加强人际交往,可以消除业余错误
人脉基本上是指在同一行业中与其他有共同兴趣的专业人士建立联系。根据Gray Group International的观点,要想在任何行业获得成功,很大程度上取决于自己多年来建立的人脉和经验。
今年,我第一次选修了数据科学课程,坦率地说,这段经历与我预期的不同:并未顺利进行和取得进步。3周后,我开始了第二个星期的学习,也不怎么积极,糟糕的经历和第一个学期一个样。
“需要帮助无需多看一眼,但请求帮助总是看起来很美。”
——布列塔尼勃艮第(Brittany Burgunder)
在花费了时间和努力之后,我却一无所获,决定与同一机构的同事们分享我面临的困难。我们聚在一起,仔细地浏览着我的课程模块,并分享着理解课程不同方面的独特方法。
现在听起来这像是在工作,但一旦你付出了一次性的牺牲,你就会在整个职业生涯中都享受到它给你带来的益处。
如何去做:
每一次会议、峰会、工作或休闲聚会都是建立新关系的机会。
别让这些机会溜走。
除了加强线下的实际联系,还要建立一个活跃的在线形象。比如加入最好的数据科学社区和论坛。
适用的要点
数据科学的美妙之处在于总有改进的空间,我就喜欢这一点。你可能会在编码或分析时犯了一些错误,这肯定会伤害到你。但是可以通过重温大量的优质资源来提高技能。
要做好充分的准备和拥有良好的学习心态,坚持不懈地努力,这样就会走上通往专业最高水平的道路。
译者:甜汤