入门 -
测试数据 > mtcars
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
........
|
#其下命令都 缺损为 xx(mtcars)
一般查看命令 > head ; tail ; names #查看标题
数据编辑 > data.entry ; edit ; fix
查看单列数据 > attach #放开 数据列名字 ; > cyl #就可以看到 6 , 6 ....
简单展现入手:
数据分布 > table 显示结果 4出现11次,6出现7次 ....
茎叶图 > stem
直方图 > hist
画框图 > boxplit
箱线图概述:
箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:
最小值、
第一四分位数、中位数、第三四分位数()与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。
> cc<-c(6,4,-10,8, 6, -2, 4, 4, 6, 6 ,8 , 8, 4, 4, 4, 4,8 ,8, 8, 4, 8 ,6 ,8, 4,10,20)
> png('test.png')
> boxplot(cc)
> dev.off()
查看图为
平均值 > mean
计算截去 10% 平均 > mean(mpg, trim =.1)
分组 平均 > mean(mpg,cyl,mean)
> mean(mpg[cyl==4])
四分位 > quantile 和 fivenum ;
上头的全部 > summary(mpg)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.42 19.20 20.09 22.80 33.90
> var #(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。
> sd # 是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
阅读(1123) | 评论(0) | 转发(0) |