R语言案例分析:多元数据的基本统计分析

2023-11-05

R语言案例分析:多元数据的基本统计分析

来自《多元统计分析与R语言建模》 第四版 

数据集下载

我们利用该数据集中的Case1来完成下面的R语言操作:

options(digits = 4) #输出结果位数
par(mar=c(4, 4, 2, 1) + 0.1, cex=0.8) # 图形修饰
case1 <- read.csv("clipboard", header=T, sep = "\t") #复制表中的数据,直接创建case1
head(case1)
     地区 性别 教育程度    观点     年龄 月收入 月支出
1    A      女       中            不支持   55   2299   1423
2    A      女       低   不支持   39   3378   2022
3    A      女       中   支持       33   3460   1868
4    B      男       高   支持       41   4564   1918
5    B      女       高  不支持    55   3206   1906
6    A      女       中  不支持    48   4043   2233

summary(case1)
地区    性别     教育程度     观点                           年龄              月收入               月支出     

A:204   男:603   低:319   不支持:628       Min.   : 6.0          Min.   : 637         Min.   : 797   

B:401   女:597   高:303   支持  :568   1st Qu.:34.0      1st Qu.:2388      1st Qu.:1722   

C:384                 中:578    NA's  : 4        Median :40.0    Median :2978   Median :1993   

D:211                         Mean   :40.1      Mean   :3006     Mean   :1997                                

3rd Qu.:47.0      3rd Qu.:3624     3rd Qu.:2262                               

 Max.   :72.0        Max.   :6239      Max.   :3385

# 定性分析
attach(case1) #绑定数据
T1 <- table(地区)


T1

   A    B    C    D 
204 401 384 211
barplot(T1) #绘制条形图

# 定量分析
f <- hist(月收入) #直方图

# 定性定量分析
boxplot(月收入~性别) #箱线图

t.test(月收入~性别) #t检验
Welch Two Sample t-test
data:  月收入 by 性别
t = 0.51, df = 1200, p-value = 0.6
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -75.43 128.49
sample estimates:
mean in group 男 mean in group 女 
                        3019                      2993

# 接受男女的月收入无显著差异的假设(p>0.5)

# 二维列联表分析
T2 <- table(性别, 观点)
T2
        观点
性别 不支持 支持
  男    319    282
  女    309    286

barplot(T2, beside = TRUE) # 条形图

barplot(T2, beside = F) # 条形图

# beside=T表示绘制分组条形图,beside=F表示绘制堆叠条形图

# 多维列联表分析
T3 <- ftable(性别, 教育程度, 观点) # 创建一个紧凑的"平铺"式列联表
T3
                      观点     不支持 支持
性别    教育程度                 
男              低                81     88
      高                78     66
      中                160  128
女     低                82     68
      高                86     72
      中                141  146


barplot(T3, beside = TRUE, col = 3:4) #条形图

T4 <- ftable(教育程度, 性别, 观点)
T4
                           观点 不支持  支持
教育程度      性别                 
低       男           81     88
         女           82     68
高       男           78     66
         女           86     72
中       男           160  128
         女           141  146

barplot(T4, beside = TRUE, col = 3:4) #条形图

detach(case1) #解除绑定







本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R语言案例分析:多元数据的基本统计分析 的相关文章

  • 聚类算法(二)--层次聚类法

    本文主要介绍层次聚类法的基本原理 距离计算方法 算法的优缺点 以及R语言实战 一 概述 层次聚类 Hierarchical Clustering 试图在不同层次上对数据集进行划分 从而形成树形的聚类结构 数据集的划分可采用 自底向上 的聚合
  • R大数定律(Python切比雪夫不等式验证大数定律)模拟圆周率

    大数定律 在概率论中 大数定律 LLN 是描述大量执行相同实验的结果的定理 根据规律 大量试验所得结果的平均值应接近预期值 并随着试验次数的增加而趋于接近预期值 LLN 很重要 因为它保证了一些随机事件的平均值的长期稳定结果 例如 虽然赌场
  • Stata输出统计结果到Excel或word

    目录 一 安装外部包 二 相关命令 三 实例 1 描述性统计结果输出 2 相关性结果输入 3 回归结果输出 1 单模型结果 2 多模型结果 参考 一 安装外部包 在Stata内安装外部包 estout和logout ssc install
  • PCE投稿要求

    进入PCE的投稿网址 http mc manuscriptcentral com pce 查了一下 大家都建议创建ORCID号 于是按照指示创建了 蓝色笔圈起来的是一些投稿指导 于是打开Instructions Forms Instruct
  • R语言——数据排序

    R语言中涉及排序的基本函数有order sort和rank三个 下面看看它们的基本用法 x表示需要排序的数据 decreasing表示是否按降序排序数据 method表示所使用的排序算法 na last表示如何处理NA值 缺失值 若为FAL
  • R手册(Visualise)--GGally(ggplot2 extensions)

    本站已停止更新 查看最新内容请移至本人博客 Wilen s Blog 文章目录 GGally ggmatrix ggplot2矩阵 ggpairs ggplot2广义配对图 ggscatmat 纯粹定量变量的传统散点图矩阵 返回ggplot
  • R语言与机器学习中的回归方法学习笔记

    来源 http blog sina com cn s blog 62b37bfe0101hom5 html key word lars rpart randomForest cp svm data diabetes prune boosti
  • 生信技能树R语言学习

    一 数据类型和向量 1 数据类型 1 1 判断数据类型class 1 2 按Tab键自动补全 1 3 数据类型的判断和转换 1 is 族函数 判断 返回值为TRUE或FALSE is numeric 123 is character a i
  • 802.11K/V/R协议介绍

    802 11K V R协议介绍 1 传统无线漫游介绍 1 1 什么是无线漫游 一台无线终端备 STA 通过连接Wi Fi获取上网体验 Wi Fi名称 又称为SSID 是由无线接入网 AP 提供的 因为一台AP设备的覆盖范围有限 所以无线网络
  • 【报错解决办法】bad restore file magic number (file may be corrupted) -- no data loaded

    今天在服务器上load一个Rdata的时候出现了这个报错 这还是第一次 之前load的都没问题 重装过一次R 上网一搜 发现是r的版本不对 检查之后发现确实如此 windows的R是4 1 2的版本 而linux上是3 6 于是我就重新在l
  • 转载:R语言绘图—图形标题、坐标轴设置

    R语言绘图是通过函数命令及相应参数设置实现的 如plot x y plot为绘图函数命令 x y则是绘图参数 指定了绘图的数据向量 但这种最基本的绘图设置很难满足个性化绘图的要求 我们需要根据需要对图形元素进行设置 图形元素是各类图形的基本
  • Class 06 - 良好的编码习惯(保持代码的可读性)

    Class 06 良好的编码习惯 保持代码的可读性 保持代码的可读性 编码风格 命名的注意事项 文件名 对象名称 语法 运算符 逗号 中括号和小括号 大括号 代码缩进 代码的长度 赋值 注释 调试报错 保持代码的可读性 在编写 R语言 或任
  • R语言 write.xlsx() 写入同一excel,及同一sheet注意

    write xlsx x file sheetName Sheet1 col names TRUE row names TRUE append FALSE showNA TRUE 1 想要将data1写da xlsx的sheet1 data
  • 使用lattice包的bwplot函数绘制箱图比较多个模型在不同指标上的性能差异(R语言)

    使用lattice包的bwplot函数绘制箱图比较多个模型在不同指标上的性能差异 R语言 箱图是一种常用的数据可视化方法 用于表示一组数据的分布特征 包括中位数 四分位数 异常值等 在比较多个模型在多个指标上的性能差异时 箱图可以提供直观的
  • R----stringr包介绍学习

    1 stringr介绍 stringr包被定义为一致的 简单易用的字符串工具集 所有的函数和参数定义都具有一致性 比如 用相同的方法进行NA处理和0长度的向量处理 字符串处理虽然不是R语言中最主要的功能 却也是必不可少的 数据清洗 可视化等
  • Coding and Paper Letter(六十一)

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 资源整理 1 Coding 1 航拍影像的土地覆盖分类 CAS机器学习人工智能2019 ZHAW 中ML DL分配的仓库 ml dl assignment 2019 2 跨
  • 主成分分析R语言实现

    主成分分析是一种常见的降维统计方法 它通过适当的变量替换 使得新变量成为原变量的线性组合 并且新变量间彼此独立 从而可从错综复杂的关系中寻求主要成分信息 揭示变量内在关系 本次主要分享的是该方法的R语言实现 目录 数据集展示 一 计算相关系
  • R语言中tidyverse基础知识汇总

    tidyverse group by 分组统计 gather 和spread 简单地说 gather 是列转行 而spread 是行转列 请看下面的示例 gt df id class grade 1 1 a 81 2 2 b 82 3 3
  • 4. 统计描述和基线表格绘制

    目录 1 连续型变量统计描述 单变量统计描述 1 summary函数 2 psych包中的describe 函数 3 Hmisc包中的describe 函数 4 pastecs包的stat desc 的函数 分组统计描述 1 doBy包的s
  • R语言——基本操作(一)

    目录 一 基本操作 二 R包的安装及使用 三 获取帮助 四 内置数据集 五 数据结构 六 向量索引 七 向量运算 参考 Rstudio 控制台常用快捷键 Ctrl 查看所有历史记录 比直接使用 查找更方便 Esc 中断操作 可中断未完成的操

随机推荐