Chinaunix首页 | 论坛 | 博客
  • 博客访问: 650928
  • 博文数量: 149
  • 博客积分: 3901
  • 博客等级: 中校
  • 技术积分: 1558
  • 用 户 组: 普通用户
  • 注册时间: 2009-02-16 14:33
文章分类

全部博文(149)

文章存档

2014年(2)

2013年(10)

2012年(32)

2011年(21)

2010年(84)

分类:

2010-04-25 10:59:59


入门 - 
测试数据 > mtcars

              mpg  cyl disp hp drat wt qsec vs am gear carb

Mazda RX4     21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4

Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4

........


#其下命令都 缺损为 xx(mtcars)
一般查看命令 > head ;  tail ; names #查看标题
数据编辑 > data.entry ; edit ; fix
查看单列数据 > attach #放开 数据列名字 ;  > cyl #就可以看到  6 , 6 ....

简单展现入手:
数据分布 >  table 显示结果 4出现11次,6出现7次 ....
茎叶图 > stem
直方图 > hist
画框图 > boxplit
箱线图概述:
   箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值第一四分位数、中位数、第三四分位数()与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。

> cc<-c(6,4,-10,8, 6, -2, 4, 4, 6, 6 ,8 , 8, 4, 4, 4, 4,8 ,8, 8,  4, 8 ,6 ,8, 4,10,20)
> png('test.png')
> boxplot(cc)
> dev.off()
查看图为 

平均值 > mean
计算截去 10% 平均 > mean(mpg, trim =.1)
分组 平均 > mean(mpg,cyl,mean)
         > mean(mpg[cyl==4])
四分位 > quantile 和  fivenum ;
上头的全部 > summary(mpg)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  10.40   15.42   19.20   20.09   22.80   33.90

> var #(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。
> sd # 是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。





阅读(1108) | 评论(0) | 转发(0) |
0

上一篇:很好的 nginx ppt

下一篇:R聚类谱系图

给主人留下些什么吧!~~