Chinaunix首页 | 论坛 | 博客
  • 博客访问: 240258
  • 博文数量: 95
  • 博客积分: 400
  • 博客等级: 一等列兵
  • 技术积分: 906
  • 用 户 组: 普通用户
  • 注册时间: 2010-11-04 16:04
个人简介

人生意义在于积累,而不是日复一日的重复

文章分类

全部博文(95)

文章存档

2016年(2)

2015年(44)

2014年(35)

2011年(5)

2010年(9)

我的朋友

发布时间:2015-03-24 14:02:29

实力决定一切,也许偏激,但很现实。......【阅读全文】

阅读(406) | 评论(0) | 转发(0)

发布时间:2015-03-23 18:35:05

机器学习方法主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习就是分类,通过已有的训练样本去训练得到一个最优模型,然后利用这个最优模型将所有输入映射为相应的输出,对于输出进行判断实现分类,这就对未知数据进行了分类。监督学习中的典型例子是KNN和SVM。无监督学习与.........【阅读全文】

阅读(5555) | 评论(0) | 转发(0)

发布时间:2015-03-18 14:52:42

《数据挖掘概念与技术》《机器学习实战》《人工智能及其应用》《数据库系统概论》《算法导论》《Web数据挖掘》《 Python标准库》《thinking in Java》《Thinking in C++》《数据结构》......【阅读全文】

阅读(423) | 评论(0) | 转发(0)

发布时间:2015-03-18 14:39:43

转载:http://www.zhihu.com/question/19851900理论:是进行分析的基础1)基础的数据分析知识,至少知道如何做趋势分析、比较分析和细分,不然拿到一份数据就无从下手;2)基础的统计学知识,至少基础的统计量要认识,知道这些统计量的定义和适用条件,统计学方法可以让分析过程更加严谨,结论更有说服力;3)对数据的.........【阅读全文】

阅读(551) | 评论(0) | 转发(0)

发布时间:2015-03-18 14:04:19

转载:http://www.zhihu.com/question/19851900第一步:数据准备:(70%时间)获取数据(爬虫,数据仓库) 验证数据 数据清理(缺失值、孤立点、垃圾信息、规范化、重复记录、特殊值、合并数据集) 使用python进行文件读取csv或者txt便于操作数据文件(I/O和文件串的处理,逗号分隔) .........【阅读全文】

阅读(522) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册