实验九—基本统计分析(二)

2023-11-12

实验9 基本统计分析(二)

实验目的:通过综合案例,使学生掌握基本统计分析的各种指标的。掌握统计分析结果的可视化方法。

实验内容:

1 背景介绍

Consolidated食品公司在新墨西哥州、亚利桑那州和加利福尼亚州经营连锁超市。它举办了一个促销活动,宣传本公司新的信用卡政策,以及顾客在购物付款时除了使用现金和个人支票外,还能够使用诸如VISA卡和Mater卡这样的信用卡。新政策正在试验的基础上实行,公司希望信用卡支付方式能够鼓励顾客多消费。

在新政策实行一个月以后,工作人员选择一周时间内的100位顾客作为随机样本,搜集了每位顾客的支付方式和消费金额数据,全部数据在Consolid.csv文件中

2 问题讨论

a) 计算支付方式的频数和相对频率。画出支付方式的相对频率的饼图。

> data<-read.csv("E:/R语言/作业/Consolid.csv")
> tab<-table(data$支付方式)
> tab2<-tab/sum(tab)
> name<-names(tab)
> lab<-paste(name,tab2*100,"%",sep = "")
> pie(tab,labels = lab,main = "支付方式饼图")

输出结果为:

image-20221003122132316

image-20221003122158036

b) 计算每种支付方式下消费金额的频数和相对频率的分布。画出支付方式的相对频率的饼图。

> a<-sum(data$消费金额[data$支付方式=="现金"])
> b<-sum(data$消费金额[data$支付方式=="信用卡"])
> c<-sum(data$消费金额[data$支付方式=="支票"])
> value<-c(a,b,c)
> lab3<-paste(name,round(value/sum(value)*100,2),"%",sep = "")
> pie(value,labels = lab3,main = "支付方式相对频率饼图")

image-20221003130341628

image-20221003130354700

c) 画出每种支付方式下消费金额的直方图。

现金消费方式直方图

> d<-data$消费金额[data$支付方式=="现金"]
> hist(d,xlab = "现金消费金额",ylab="Frequency",main="现金消费方式直方图")

image-20221003131216381

image-20221003131227251

信用卡消费方式直方图

> e<-data$消费金额[data$支付方式=="信用卡"]
> hist(e,xlab = "信用卡消费金额",ylab="Frequency",main="信用卡消费方式直方图")

image-20221003131939961

image-20221003131950220

支票消费方式直方图

> f<-data$消费金额[data$支付方式=="支票"]
> hist(f,xlab = "支票消费金额",ylab="Frequency",main="支票消费方式直方图")

image-20221003132146092

image-20221003132205764

d)计算每种支付方式数据的集中趋势和离散程度。

使用summary函数得到最小值、下四分位点、中位数、平均值、上四分位点、最大值,利用这些值并计算出极差和四分位差

image-20221003132846384

计算极差

image-20221003133638331

支付方式 平均值 最小值 下四分位数 中位数 上四分位数 最大值 标准差 极差 四分位差
现金 8.840 1.090 4.832 7.405 12.8335 20.0480 5.2978 19.39 8.003
信用卡 40.88 14.14 2 7.10 45.33 52.56 69.77 14.87382 55.33 25.46
支票 42.73 2.67 33.94 41.34 53.36 78.16 15.62186 75.49 19.42

e)画出三种支付方式数据的箱线图。

boxplot(d,e,f,ylab="值",xlab="支付方式",col=c("red","green","blue"))

image-20221003134335809

3.结论

结论1:支票和现金的使用频率最高且相差不大,信用卡使用则较少,支付金额最高的是支票,其次是信用卡,最低的是现金。

结论2:支票和信用卡的稳定性比较小,现金则比较稳定,差别不大。

综上:可以得出使用支票和信用卡的人数较多,使用现金的人数较少,使用支票和信用卡的消费金额也比使用现金的消费金额多。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

实验九—基本统计分析(二) 的相关文章

  • R语言与数据分析实战4-变量的创建与修改

    第1关 创建新变量 在进行实际的数据分析时 我们会经常需要创建新变量或者为当前存在的变量变换新的取值 这就好比你是一个厨师 现在你要创新菜式 需要做一些新的厨房模具或者是改良当前已有的厨具来进行烹饪 对于创建新变量 其实原理非常简单 大家只
  • Stata输出统计结果到Excel或word

    目录 一 安装外部包 二 相关命令 三 实例 1 描述性统计结果输出 2 相关性结果输入 3 回归结果输出 1 单模型结果 2 多模型结果 参考 一 安装外部包 在Stata内安装外部包 estout和logout ssc install
  • R语言基本函数的学习(持续更新)

    目录 前言 Tidyverse包 arrange 函数 head 函数 filter 函数 select 函数
  • PCE投稿要求

    进入PCE的投稿网址 http mc manuscriptcentral com pce 查了一下 大家都建议创建ORCID号 于是按照指示创建了 蓝色笔圈起来的是一些投稿指导 于是打开Instructions Forms Instruct
  • R语言——数据排序

    R语言中涉及排序的基本函数有order sort和rank三个 下面看看它们的基本用法 x表示需要排序的数据 decreasing表示是否按降序排序数据 method表示所使用的排序算法 na last表示如何处理NA值 缺失值 若为FAL
  • R语言数据拆分

    博主的话 大家好 这里是bio 先赞后看养成习惯 还没关注的小伙伴点点关注不迷路 今天是南方的小年 祝福大家小年快乐 目录 博主的话 前言 一 split 函数 二 subset 函数 总结 前言 今天继续学习R语言 我们之前已经介绍过了数
  • r语言写九九乘法表并保存为txt文件

    r语言写九九乘法表并保存为txt文件 代码 for i in 1 9 for j in 1 i cat j x i i j t file 九九乘法表 txt append TRUE cat n file 九九乘法表 txt append T
  • 三句话,我让R语言自动升级了

    R语言是为数学研究工作者设计的一种数学编程语言 主要用于统计分析 绘图 数据挖掘 跟所有计算机语言一样 R语言也面临升级的问题 本文讲述了最快捷的升级R语言办法 不用重新安装之前的安装包 首先 进入R交互模式 然后三条命令搞定 instal
  • 如何用R分析CNKI文献关键词词频?

    疑惑 如何用VOSviewer分析CNKI数据 一文发布后 有同学问我 王老师 我有个问题 我用cnki导出关键词后 想统计关键词的词频 我应该用什么样的工具 如果不利用citespace和python 做出excel那种的统计表格 该怎么
  • 如何编写R函数

    转载自http blog sciencenet cn blog 255662 501317 html R语言实际上是函数的集合 用户可以使用base stats等包中的基本函数 也可以自己编写函数完成一定的功能 但是初学者往往认为编写R函数
  • 数据挖掘实验(四):决策树归纳 R语言

    一 实验目的 决策树分类算法 decision tree 通过树状结构对具有某特征属性的样本进行分类 其典型算法包括ID3算法 C4 5算法 C5 0算法 CART算法等 本次实验掌握用ID3的信息增益来实现决策树归纳 二 实验软件 Rst
  • 1.R语言基础知识

    目录 一 R语言的介绍 R语言的下载与按照 Rstudio R包的安装 工作空间管理 基本运算 二 R的数据结构 1 数据类型 2 数据类型的转换和判断 3 数据结构 三 导入 导出数据 获取内置数据集 获取其他格式的数据 四 数据框的常用
  • 使用R语言中的survival包进行生存分析是一种常见的统计方法

    使用R语言中的survival包进行生存分析是一种常见的统计方法 在生存分析中 我们经常需要创建一个生存对象来存储事件发生时间和事件状态 在本文中 我们将介绍如何使用survival包中的Surv函数来创建生存对象 并解读其结果 Surv函
  • R语言基础——缺失数据

    R语言基础 缺失数据 缺失数据的分类 统计学家通常将缺失数据分为三类 它们都用概率术语进行描述 但思想都非常直观 我们将用sleep研究中对做梦时长的测量 有12个动物有缺失值 来依次阐述三种类型 1 完全随机缺失 若某变量的缺失数据与其他
  • 【报错解决办法】bad restore file magic number (file may be corrupted) -- no data loaded

    今天在服务器上load一个Rdata的时候出现了这个报错 这还是第一次 之前load的都没问题 重装过一次R 上网一搜 发现是r的版本不对 检查之后发现确实如此 windows的R是4 1 2的版本 而linux上是3 6 于是我就重新在l
  • R语言GGPLOT2绘制圆环图雷达图/星形图/极坐标图/径向图Polar Chart可视化分析汽车性能数据

    最近我们被客户要求撰写关于可视化的研究报告 包括一些图形和统计输出 漂亮的圆形图 我不确定对数据分析师本身是否有额外的好处 但如果能吸引决策者的注意 那对我来说就是额外的价值 然而 用coord polar 或偶尔发现的ggplot2中的c
  • 2021-05-03

    一 R中安装 phyloseq 的方法 很多网上的教程使用的都是 source https bioconductor org biocLite R biocLite phyloseq 但是我尝试了很多次 最后还是没有成功 下面能成功安装 p
  • R语言读取Excel的神器——openxlsx

    作为非程序猿的各位同志们 可能最擅长的数据整理软件或者统计软件就是 嗯 没有错 它就是集万千宠爱于一身的E X O 咳咳咳 好了 隆重推出我们的主角 Excel 事实上 Excel是个super强大的软件 基本上用它已经能完成大量的统计分析
  • R语言实现RMF模型

    RMF模型说明 RMF模型是客户管理中 常被用来衡量客户价值和客户创利能力的重要方法 它主要考量三个指标 最近一次消费 Recency 近期购买的客户倾向于再度购买 消费频率 Frequency 经常购买的客户再次购买概率高 消费金额 Mo
  • R语言——基本操作(一)

    目录 一 基本操作 二 R包的安装及使用 三 获取帮助 四 内置数据集 五 数据结构 六 向量索引 七 向量运算 参考 Rstudio 控制台常用快捷键 Ctrl 查看所有历史记录 比直接使用 查找更方便 Esc 中断操作 可中断未完成的操

随机推荐

  • 用三元操作符替代if-else以降低CPU分支预测惩罚实现Unity内函数13倍提速

    测试对象 1 C Unity脚本 2 C DLL mcs build的动态链接库再导入Unity 3 C Native Code LLVM编译后导入Unity 被测试函数源码 两个随机数数组进行大小比较 一个数组保存大数 另一个保存小数 C
  • 动态IP代理是什么?一文看懂动态代理IP

    一 什么是动态IP代理 动态IP代理是一种代理服务 而动态IP是由ISP动态分配给用户的IP地址 这些IP地址会周期性地更改 每次链接互联网时 用户会被分配一个新的IP地址 因而也称为 轮换IP IP地址轮换是一个过程 您的IP 地址 网络
  • Unity教程:GUI 界面开发

    UI概述 UI永远是显示在屏幕的最前面上 不受变形 碰撞 光照的影响 GUI概述 GUI是Graphical User Interface的缩写 Unity的图形界面系统能容易和快速创建出各种交互界面 与传统的方法 创建GUI对象 标出位置
  • 神经网络之VGG

    目录 1 VGG的简单介绍 1 2结构图 3 参考代码 VGGNet 16 架构 完整指南 卡格尔 kaggle com 1 VGG的简单介绍 经典卷积神经网络的基本组成部分是下面的这个序列 带填充以保持分辨率的卷积层 非线性激活函数 如R
  • C# WinForm扩展控件TextBox底部下划线展示

    在winform项目中 新建一个类 TextBoxLine 然后编译项目 打开工具箱就可以看到控件了 代码 using System using System Collections Generic using System Compone
  • Midjourney 动画全参数提示(为 Niji V5 更新)使用 Midjourney 生成动画有两种方式:使用 Niji 模式或使用标准 Midjourney 模型,参数教程(第一节)

    Niji V5 Niji 模式的最新版本 是 Midjourney 的专门针对动画的模型 它建立在与标准 Midjourney 模型完全不同的架构上 更擅长生成具名动画角色 Niji V4 于 2023 年 12 月发布 Niji V5 于
  • gitee将本地项目更新到远程仓库指定的分支上

    1 首先看自己在哪个分支 git branch a 2 然后将代码放到暂存区 git add 3 然后git commit m 提交 到本地库 git commit m 问卷管理 4 然后git pull origin jieer 5 gi
  • shell调试技术

    1 shell调试选项 语法 sh n x v Sctipt sh 参数说明 n 检查shell脚本是否有语法错误 只读取shell脚本 但不执行 x 提供跟踪执行信息 将执行的每一条命令 每一个变量的值和结果一次打印出来 v 一边执行脚本
  • 什么是死区时间

    死区时间是PWM输出时 为了使H桥或半H桥的上下管不会因为开关的关断延迟问题发生同时导通而设置的一个保护时段 通常也指pwm响应时间 由于IGBT 绝缘栅极型功率管 等功率器件都存在一定的结电容 所以会造成器件导通关断的延迟现象 一般在设计
  • 【华为机试真题 Python】@分割可用字符集

    前言 本专栏针对华为OD机试题目进行了详细的分析与解答 并包含完整的代码实现 希望可以帮助到正在努力的你 关于OD机试流程 面经 面试指导等 如有任何疑问 欢迎联系我 wechat steven moda email nansun0903
  • 入门嵌入式,开发板应该怎么选?

    作者 学益得智能硬件 入门嵌入式 开发板应该怎么选择 网上推荐的太多 不知道该如何选择 选择开发板 无非考虑三点因素 配套学习资源 源码 视频 书籍 性能 能不能运行学习用到的程序 性价比 价格是不是超出了预算 下面给大家推荐几款主流的能跑
  • C++学习笔记5:继承、多态基础

    组合 继承 继承与组合 构造与析构顺序 派生类重载基类函数的访问 多态性 虚函数 纯虚函数和抽象基类 多重继承 派生类成员的标识与访问 组合 继承与多态性 面向对象涉及的重要目的之一就是代码重用 多态性可以以常规方式书写程序来访问多种现有的
  • ScheduledExecutorService执行定时任务

    java util concurrent Executors可创建一个线程池 它可给定延迟后定期地执行任务 Executors newScheduledThreadPool int corePoolSize ThreadFactory th
  • 对12306新验证码的简单破解

    12306的验证码又换了 变成了类似找你妹的找图游戏了 由于在另一博客发过了 这里贴个地址过来 http www cnblogs com gsls200808 p 4341599 html 后记 在网站更新验证码的第二天 有人在知乎上问了
  • 127.0.0.1可以访问,localhost不能访问的问题

    二者概念 localhost 本地服务器 127 0 0 1 本机地址 本机服务器 二者区别 localhot 是不经网卡传输的 它不受网络防火墙和网卡相关的的限制 127 0 0 1 是通过网卡传输的 它依赖网卡 并受到网络防火墙和网卡相
  • 深度学习常用库汇总简介

    1 FlatBuffer
  • 【C语言】图的邻接表——超详细解析

    图的邻接表 我们重点分析一下无向图 邻接表 我们如何将图中所有顶点和边建立起联系 1 我们发现 V0这个顶点与V1和V3相连 通过右边的邻接表可以看到会出现一个以 V0为头结点的单链表 后面连接的元素就是V1和V3 在顶点数组中的下标 2
  • 【LeetCode】思维向题笔记总结(持续更新)

    不全 记录的都是个人认为比较有意思的题 具体有哪些题可以看看目录 目录 链表相关 双指针 滑动窗口 209 长度最小的子数组 滑动窗口 904 水果成篮 滑动窗口 哈希 模拟相关 59 螺旋矩阵 II 哈希表 哈希表概述 1 两数之和 哈希
  • 全国首款支持多环境开发的 IDE —— CEC-IDE

    有热心开发者在 VS Code 的 GitHub repo 创建了 issue CEC IDE 是一款安全 专业且功能强大的集成开发工具 主页 https www jlht168 com 插件市场 https cecide digitalg
  • 实验九—基本统计分析(二)

    实验9 基本统计分析 二 实验目的 通过综合案例 使学生掌握基本统计分析的各种指标的 掌握统计分析结果的可视化方法 实验内容 1 背景介绍 Consolidated食品公司在新墨西哥州 亚利桑那州和加利福尼亚州经营连锁超市 它举办了一个促销