假设您有一个包含 2 个变量的数据框 - 姓名和年龄。姓名是班级因素和年龄号码。现在想象一下这个数据框中有数千人。你怎么:
-
生成一个表: NAME |每个名称的 COUNT(NAME) 都是唯一的吗?
-
生成一个直方图,您可以在其中更改最小数量
出现在直方图中的事件。?
对于第 2 部分,我希望能够测试不同的最小频率值并查看直方图的结果。或者是否有更好的实用方法来确定每个名称进入直方图的最小计数?
Thanks!
编辑:这是 RDBS 中的表的样子:
NAME | COUNT(NAME)
John | 10
Bill | 24
Jane | 12
Tony | 50
Emanuel| 1
...
我想要做的是创建一个函数来绘制直方图,我可以在其中更改设置要绘制的最小频率的值。更有意义吗?
> x <- read.table(textConnection('
+ Name Age Gender Presents Behaviour
+ 1 John 9 male 25 naughty
+ 2 Bill 5 male 20 nice
+ 3 Jane 4 female 30 nice
+ 4 Jane 4 female 20 naughty
+ 5 Tony 4 male 34 naughty'
+ ), header=TRUE)
>
> table(x$Name)
Bill Jane John Tony
1 2 1 1
> layout(matrix(1:4, ncol = 2))
> plot(table(x$Name), main = "plot method for class \"table\"")
> barplot(table(x$Name), main = "barplot")
> tab <- as.numeric(table(x$Name))
> names(tab) <- names(table(x$Name))
> dotchart(tab, main = "dotchart or dotplot")
> ## or just this
> ## dotchart(table(dat))
> ## and ignore the warning
> layout(1)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)