Chinaunix首页 | 论坛 | 博客
  • 博客访问: 387344
  • 博文数量: 273
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 1430
  • 用 户 组: 普通用户
  • 注册时间: 2018-02-02 15:57
文章分类

全部博文(273)

文章存档

2018年(273)

我的朋友

分类: 大数据

2018-06-29 15:35:54

       一年一度的秋招已经打响了发令枪,从去年的薪酬排行来看,算法工程师和数据分析等工作排在前列,很多相关专业的学生一直在自学一些网络上的公开课并阅读一些专业书籍,比如“西瓜书”、“花书”等,如果你现在仍然什么也没有准备的话,然而还想从事数据科学领域这个似乎令人望而生畏的工作话,现在就要抓紧补补相关的知识了。在这里要提示一点,自我完善的知识不要局限于数据分析相关的知识,还要额外补充下相关领域的知识。另外,简历上展示个人技能的最佳方式是使用技能组合的形式,这样能让雇主相信你可以使用你已经学习的技能。为了展示这些技能,以下是你应该着重补充的5种数据科学项目组合类型:

1.数据清理

       数据科学家预计在一个新项目的清理数据处理上花费多达80%的时间,这对于团队来说是一个巨大的代价。如果你可以证明你在数据清理方面经验丰富,那么你将立即变得更有价值。练习这项能力的方法是创建一个数据清理项目,找到一些混乱的数据集并开始进行清理。

data_cleaning_1


       如果你使用Python语言进行编程,那么是一个很好用的库,如果你使用R语言编程,那么你可以使用数据包。你实践的数据清洗项目应该确保展示以下技能:
  • 导入数据
  • 加入多个数据集
  • 检测缺失值
  • 检测异常
  • 输入缺失的值
  • 数据质量保证

2.探索性数据分析

       数据科学的另一个重要方面是探索性数据分析(EDA),这是一个生成问题并用可视化方法对其进行调查的过程。 EDA允许分析人员从数据中得出结论来推动业务影响,它可能包括基于客户细分的有趣洞察,或基于季节效应的销售趋势。通常你可以通过探索性数据分析来得到一些有趣的发现。

2


       用于探索性分析的一些有用的Python库有。对于R用户而言,软件包将会很有用。你实践的EDA项目应该显示以下技能:
阅读(994) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~