linux工程师,RHCE
分类: 系统运维
2020-08-23 19:38:59
尽管关于这个话题的文章不计其数,但文本作者想要找寻那种为大部分数据科学家所用而又有特色的工具及其认证。这些认证有的是免费的,有的比较便宜,但都值得尝试。
作者:大数据文摘|2020-08-23 12:26
大数据文摘出品
来源:medium
编译:李雷
尽管关于这个话题的文章不计其数,但文本作者想要找寻那种为大部分数据科学家所用而又有特色的工具及其认证。这些认证有的是免费的,有的比较便宜,但都值得尝试。
不过,这还是要取决于你在数据科学领域的关注重点和发展方向。在数据科学从业的道路上,每个人想要获得证书的原因有很多;有的证书可能很直白,例如数据科学证书,有的可能没那么直白,例如Python编程证书。随着课堂教学的减少,在线学习的地位与日俱增,逐渐成为数据科学从业者的必备良品。过去,在线课程和认证总让人觉得不靠谱,而如今,不光老板们越来越期待它们给企业带来提升,你也可以向利用它们老板证明,无论处在什么职位,你都可以提高自己的技能。
作者拥有南方卫理公会大学数据科学教育理学硕士学位,尽管这是通过线上获得的,但没有哪个雇主认为它会比普通的硕士要低级。同样,当他在面试时拿出数据科学证书和其他通过非传统教育形式(如网课)获得的证书时,几位招聘经理也十分喜欢,并且给他们留下了深刻的印象。除了具有不同形式的学习经验,他还具备数据科学家的专业经验,而这正是雇主们所期待的。此外,作者对一些工具和平台非常了解,这也给他的日常工作带来很大的帮助。
在下文中,作者将介绍五个可以提升数据科学职业生涯的认证。
TensorFlow
TensorFlow 是一个被数据科学家和机器学习工程师广泛使用的开源机器学习框架,其中包含各种功能强大的代码库,可以协助机器学习模型的构建过程。TensorFlow的典型使用场景包括:
TensorFlow认证的名称是:TensorFlow开发人员证书。
该框架包含计算机视觉(CV),卷积神经网络(CNN)和自然语言处理(NLP)等各种模型。因为认证考试费用为100美元(较贵),因此建议你去找老板报销(说不定能成功呢)。如果你关注的是机器学习或深度学习,那么这个证书会很有用。证书本身不是一个教程,只是对你使用TensorFlow能力的认可。但是,作者建议通过Coursera平台提供的TensorFlow in Practice系列课程来学习,因为它涵盖了TensorFlow的所有内容,并且还是免费的。只要你觉得100美元的考试费不贵,或者可以通过助学金计划免除学费时,那么就去考吧。据说学习了该系列课程的人:
如此看来,这个认证及相应的证书可以很好地展示你的技能,同时在TensorFlow这个广阔的平台上证明了你的竞争力。
SAS
SAS可能是数据科学家最不常用的平台。但是,这也可能变成你的优势,因为可以确定的说,你的SAS技能是真正独一无二,与众不同的。你能做的事,大多数数据科学家无法做到。与Python和R这些数据科学家和机器学习工程师都使用的编程语言不同,SAS是一种类似于统计信息专用的SQL语言。作者在读数据科学硕士学位时,这个平台是他接触到的第一个数据科学学习平台。
SAS的全称是Statistical Analysis System。作为一个数据科学家,你在进行机器学习的时候可能会进入一种黑盒状态,无法得知机器到底是怎么学的。但是,如果你使用SAS,则会得到非常详尽的统计信息。这在面试数据科学职位的时候特别有用,当招聘经理向你询问复杂的统计问题,只掌握Python数据科学库是无法回答这些问题的。使用SAS的优势是可以使用Q-Q图,直方图和残差图等方法测试正态性,还可以执行ANOVA和MANOVA(方差分析或方差多重分析)之类的测试。
这个证书的名称是:SAS程序员专业证书。
这个认证在Coursera平台上也有相应的课程,可以免费注册并且在完成课程后获得收费证书。
请记住,即使这些是认证和课程可以免费,但考试或实物证书通常还是要花钱的。不过你仍然可以免费地学习部分甚至全部课程,而且如果你的老板或者面试公司认可你对相关课程学习,那你也就无需付费考试或者购买证书了。
在该课程中你将学习SAS编程语言以及不同数据类型处理。这个证书及相关课程对职业发展有着极大的作用:
IBM数据科学证书-Python
前面的证书及课程侧重于数据科学的特定方向,而这个证书涵盖了整个通用数据科学体系。证书的名称是:IBM数据科学专业证书。
与前面的证书类似,Coursera平台上也有这个证书的相关课程。该证书的涵盖面很广,作者列出了所有的九门课程:
如上所述,该认证几乎涵盖了数据科学乃至机器学习的每个部分。根据你的目标和申请地点,本课程甚至可以完全替代学位,证据如下:
多么令人惊叹的数字,它将是你获益最多的课程和认证之一。如果你想全面了解数据科学,作者推荐本课程。大约有100万人浏览了课程主页,足见该课程的受欢迎程度之高。
Tableau
这个证书可能有些人会不同意,不过你还是应该认真考虑一下。Tableau是描述指标和统计数据的可视化工具,因此可能更像是数据分析或商业智能方面的技能。但是,数据科学家掌握Tableau也有一些好处,包括:
通常,如果你是个数据科学家,你需要陈述你的发现,那么Tableau是一个简单易用的工具,可以帮助你描述模型状态和指标,以便你的同僚可以每天查看数据业务问题的进展情况。
Tableau包含几种认证,但重点介绍一个:Tableau Desktop专家。
该证书重点放在Tableau的基础知识,这对于入门级别的你可能很重要。作为数据科学家,我们假设你已经具备出色的问题解决能力,因此,一旦你掌握了Tableau基础知识,就可以学习更复杂的功能。此项认证的费用为100美元,考试一共包含30道题目,时间60分钟,包括多项选择题,简答题和实践题,系统自动评分。Tableau还提供了几门课程,可以帮助你更快地学习。
与其他的课程和证书更加专注于数据科学和机器学习相比,获得这个证书可以让你与众不同,即如何使用Tableau来展示你的数据科学发现。
谷歌机器学习认证
最后一个认证(也许是最困难的)是来自谷歌。如果你是一名机器学习工程师,那么那你最好有这个证书。如果你是仅专注于模型的数据科学家,那么该证书也可以使你进一步进行部署和工程设计。这个认证将检验你对以下主要复杂概念的理解:
你可以选择beta版认证,通过了即获得Google Cloud认证,可以节省40%的费用,同时还可以获得Google独家定制服装。这个证书的名称是:专业机器学习工程师BETA。
考试的主要目标都是些非常有用的概念,每个考过的数据科学家或机器学习工程师最终都将受益匪浅。其中一些关键目标是:
由此可见,这个认证非常复杂,涵盖了数据科学和机器学习的高难度核心领域。
总结
要成为一名优秀的数据科学家,你并不需要读完所有这些课程或考取全部证书,但这些认证都能以不同的方式给你带来巨大的提升。以下是所有五个顶级认证的内容及其各自的链接:
当然,数据科学还有更多其他的课程和证书。但是,对于你而言,最重要的事情是选择这些证书(或其他类似证书)中的任何一个,并努力提高自己作为数据科学家的水平。想象一下,如果你获得了这几个认证中的任何一个,一定会让你的老板眼前一亮(无论是现在和未来的)。这些证书不仅会让你在面试时脱颖而出,而且最终还将帮助你在数据科学职业上走得更好。学习不止,考证不断。《linux就该这么学》不错的linux自学书籍