实验六—基本数据管理（三）

2023-11-03

实验6 基本数据管理（三）

实验目的：综合应用数据框的多种操作，进行综合实验；掌握小提琴图的绘制方法。

实验内容：

1.计算2的1-50次方，以及1-50的平方，找出这两个序列有哪些元素是相等的，显示出来。

x<-NULL
y<-NULL
for(i in 1:50){
  tmp1<-2^i
  tmp2<-i^2
  x=c(x,tmp1)
  y=c(y,tmp2)
}
z=NULL
for(i in 1:50)
  for(j in 1:50)
    if(x[i]==y[j])
      z=c(z,x[i])
print(z)

2.请问1：9*1：4的结果是什么？实验给出结果，并解释求解过程。

> 1:9*1:4
[1]  1  4  9 16  5 12 21 32  9
Warning message:
In 1:9 * 1:4 :
  longer object length is not a multiple of shorter object length

因为两个向量的长度不同，会按照广播原则将第二个向量扩展为 1 2 3 4 1 2 3 4 1，然后再进行运算。

3.定义字符串data为“R语言是一门艺术”，data1为“用心去体会”，将两字符串进行连接，并用冒号分隔。统计连接后字符串的长度。

> data<-"R语言是一门艺术"
> data1<-"用心去体会"
> data2<-paste(data,data1,sep = ":")
> data2
[1] "R语言是一门艺术:用心去体会"
> nchar(data2)
[1] 14

4.序列生成

a) 生成具有100个元素的向量e,每个元素服从[-3,3]之间均匀分布的随机数。

b) 使用y=3.14*x^2+log(x)+e生成序列y, x属于[1,100],将y保存至d.csv.

> e<-runif(100,-3,3)
> x<-runif(100,1,100)
> y<-3.14*x^2+log(x)+e
> write(y,"E:/R语言/作业/d.csv")

5.请生成如下所示的数据框

1.) 运单编号以334开头，后面的6位数字随机生成，得到运单编号字符串

2.) 寄件日期生成随机时间序列，可以使用as.Date()函数

3.) 目的地首先生成4个数字向量，之后重编码为字符串（晋冀鲁豫）

4.) 计费重量随机生成1-100之间的小数，保留2位

5.) 应收运费计算方法为：1公斤以内，收费15元，超过1公斤，超出部分，每公斤收3元

6.) 生成20条运单记录（给出的数据仅供参考）

7.) 从快递账单表中抽取目的地为“冀”的信息

8.) 从快递账单表中抽取目的地为“冀”并且计费重量<50的信息，不显示寄件日期

> no<-paste('334',trunc(runif(20,100000,999999)),sep = '')
> no
 [1] "334875326" "334137817" "334879106" "334604430" "334142065" "334954431" "334640708" "334437793"
 [9] "334615978" "334241614" "334664171" "334375283" "334874542" "334930917" "334495717" "334730331"
[17] "334203390" "334682227" "334974901" "334340394"

> s<-as.Date("2022-5-1")
> e<-as.Date("2022-9-24")
> date<-seq(s,e,length.out=20)
> date
 [1] "2022-05-01" "2022-05-08" "2022-05-16" "2022-05-24" "2022-05-31" "2022-06-08" "2022-06-16"
 [8] "2022-06-23" "2022-07-01" "2022-07-09" "2022-07-16" "2022-07-24" "2022-08-01" "2022-08-08"
[15] "2022-08-16" "2022-08-24" "2022-08-31" "2022-09-08" "2022-09-16" "2022-09-24"

> x<-trunc(runif(20,1,5))
> x
 [1] 2 1 4 1 1 3 3 1 4 3 1 1 3 4 2 3 1 3 4 1
> place<-ifelse(x==1,"晋",ifelse(x==2,"冀",ifelse(x==3,"鲁","豫")))
> place
 [1] "冀" "晋" "豫" "晋" "晋" "鲁" "鲁" "晋" "豫" "鲁" "晋" "晋" "鲁" "豫" "冀" "鲁" "晋" "鲁" "豫"
[20] "晋"

> weight<-round(runif(20,1,100),2)
> weight
 [1] 94.76 40.42  8.99  9.86 76.51 25.92 45.22 20.71 43.74 82.28 93.59 82.35 67.96 63.04 24.99  3.33
[17] 76.81 70.66 56.09 98.85
> cost<-ifelse(weight<1,15,15+(weight-1)*3)
> cost
 [1] 296.28 133.26  38.97  41.58 241.53  89.76 147.66  74.13 143.22 258.84 292.77 259.05 215.88
[14] 201.12  86.97  21.99 242.43 223.98 180.27 308.55

> data<-data.frame(no,date,place,weight,cost)
> names(data)<-c("运单编号","寄件日期","目的地","计费重量","应收运费")
> data
    运单编号   寄件日期 目的地 计费重量 应收运费
1  334982345 2022-05-01     冀    94.76   296.28
2  334496983 2022-05-08     晋    40.42   133.26
3  334409416 2022-05-16     豫     8.99    38.97
4  334968837 2022-05-24     晋     9.86    41.58
5  334750787 2022-05-31     晋    76.51   241.53
6  334972923 2022-06-08     鲁    25.92    89.76
7  334990372 2022-06-16     鲁    45.22   147.66
8  334970233 2022-06-23     晋    20.71    74.13
9  334957906 2022-07-01     豫    43.74   143.22
10 334464116 2022-07-09     鲁    82.28   258.84
11 334277235 2022-07-16     晋    93.59   292.77
12 334721102 2022-07-24     晋    82.35   259.05
13 334806711 2022-08-01     鲁    67.96   215.88
14 334455177 2022-08-08     豫    63.04   201.12
15 334635027 2022-08-16     冀    24.99    86.97
16 334606335 2022-08-24     鲁     3.33    21.99
17 334468092 2022-08-31     晋    76.81   242.43
18 334503952 2022-09-08     鲁    70.66   223.98
19 334349809 2022-09-16     豫    56.09   180.27
20 334461045 2022-09-24     晋    98.85   308.55

> data[data$目的地=="冀",]
    运单编号   寄件日期 目的地 计费重量 应收运费
1  334982345 2022-05-01     冀    94.76   296.28
15 334635027 2022-08-16     冀    24.99    86.97
> data[data$目的地=="冀"&data$计费重量<50,-2]
    运单编号 目的地 计费重量 应收运费
15 334635027     冀    24.99    86.97

6.数据data1_2.csv是一家购物网站连续60天的销售额数据。生成一张频数分布表，并计算各组频数的百分比。

实验结果如下所示：

	分组	频数	频数百分比
1	[500,550	9	15.00
2	[550,600	21	35.00
3	[600,650	21	35.00
4	[650,700	8	13.33
5	[700,750	1	1.67

实验步骤：

使用cut函数生成频数分布表
组织成数据框
计算频数百分比，结果保留2位小数
将频数百分比添加到数据框
为数据框的各个成员重命名为“分组，频数，频数百分比”
显示频数分布表

> data<-read.csv('E:/R语言/作业/data1_2.csv')
> t<-cut(data$销售额,breaks = c(500,550,600,650,700,750),right = FALSE)
> t
 [1] [550,600) [550,600) [650,700) [600,650) [600,650) [650,700) [600,650) [500,550) [550,600)
[10] [550,600) [650,700) [600,650) [600,650) [600,650) [550,600) [650,700) [600,650) [500,550)
[19] [600,650) [550,600) [500,550) [550,600) [500,550) [550,600) [550,600) [500,550) [600,650)
[28] [600,650) [500,550) [650,700) [600,650) [550,600) [600,650) [600,650) [600,650) [600,650)
[37] [600,650) [550,600) [550,600) [550,600) [550,600) [550,600) [500,550) [700,750) [650,700)
[46] [500,550) [550,600) [550,600) [600,650) [550,600) [600,650) [550,600) [550,600) [650,700)
[55] [550,600) [650,700) [500,550) [600,650) [600,650) [600,650)
Levels: [500,550) [550,600) [600,650) [650,700) [700,750)
> tab<-table(t)
> tab
t
[500,550) [550,600) [600,650) [650,700) [700,750) 
        9        21        21         8         1 
> df<-data.frame(tab)
> df
          t Freq
1 [500,550)    9
2 [550,600)   21
3 [600,650)   21
4 [650,700)    8
5 [700,750)    1

> df$percent<-round(df$Freq/60*100,2)
> df
          t Freq percent
1 [500,550)    9   15.00
2 [550,600)   21   35.00
3 [600,650)   21   35.00
4 [650,700)    8   13.33
5 [700,750)    1    1.67
> names(df)<-c("分组","频数","频数百分比")
> df
       分组 频数 频数百分比
1 [500,550)    9      15.00
2 [550,600)   21      35.00
3 [600,650)   21      35.00
4 [650,700)    8      13.33
5 [700,750)    1       1.67

7.调用vioplot包中的vioplot函数绘制如下图所示的data4_1的6项空气污染指标的小提琴图。

> install.packages('vioplot')#下载vioplot包
> library(sm)
> library(zoo)
> library(vioplot)
> data<-read.csv('E:/R语言/作业/data4_1.csv')
> vioplot(data[,4:9],col = c("red","yellow","green","black","blue","pink"))
> title(ylab = "指标值",xlab = "指标")

8.对题7数据进行以10为底的对数变换后，绘制小提琴图

> x<-log10(data[,4:9])
> vioplot(x,names = c("PM2.5","PM10","二氧化硫","一氧化碳","二氧化氮","臭氧浓度"),col = c("red","yellow","green","black","blue","pink"))
> title("对数变换后的小提琴图",ylab = "指标值",xlab = "指标")

题7数据进行标准化变换后，绘制小提琴图

> x<-scale(data[,4:9])
> vioplot(x,names = c("PM2.5","PM10","二氧化硫","一氧化碳","二氧化氮","臭氧浓度"),col = c("red","yellow","green","black","blue","pink"))
> title("标准化变换后的小提琴图",ylab = "指标值",xlab = "指标")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R语言

开发语言

实验六—基本数据管理（三）的相关文章

软件测试|Python中如何提取列表中索引为奇数的元素

简介在Python中我们经常需要从列表中提取特定位置的元素如果我们想要提取列表中索引为奇数的元素可以使用一些简单的方法来实现这一目标本文将介绍如何在Python中提取列表中索引为奇数的元素并提供示例代码来帮助大家更好地理解这个过
基于java的物资管理系统设计与实现

基于java的物资管理系统设计与实现 I 引言 A 研究背景和动机基于Java的物资管理系统设计与实现的研究背景和动机在于提高物资管理系统的效率和质量使得物资管理系统更加便捷快速准确从而提高物资管理的水平该系统的设计和实现主要围
socket网络编程几大模型？看看CHAT是如何回复的？

CHAT回复网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求不需
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
基于java的物流信息网系统设计与实现

基于java的物流信息网系统设计与实现 I 引言 A 研究背景和动机基于Java的物流信息网系统设计与实现的研究背景和动机随着互联网的普及和电子商务的快速发展物流信息网系统已成为现代物流管理的重要组成部分物流信息网系统能够实现物流信
【计算机毕业设计】白优校园社团网站的设计与实现

近些年随着中国经济发展人民的生活质量逐渐提高对网络的依赖性越来越高通过网络处理的事务越来越多随着白优校园社团网站的常态化如果依然采用传统的管理方式将会为工作人员带来庞大的工作量这将是一个巨大考验需要投入大量人力开展对社团
【gee】下载modis土地利用类型

var china ee FeatureCollection projects assets china boundary var lc dataset ee ImageCollection MODIS 061 MCD12Q1 filter
js中关于字符串的创建和判断类型

文章目录创建方法判断类型的技巧区分 1 typeof 2 instanceof 共点 1 Object prototype toSt
华为OD统一考试 Python【数字转化】

描述我们想要一种特殊的整数编码方式让数字小的时候编码占的空间也小编码的方法如下我们每7位组成一部分来编码在每个字节里用前7位来存数字如果后面还有数据最高的那一位就是1 否则就是0 数据要按小端序保存也就是说小的数据部分
一台java服务器可以跑多少个线程？

一台java服务器可以跑多少个线程一台java服务器能跑多少个线程这个问题来自一次线上报警如下图超过了我们的配置阈值打出jstack文件通过IBM Thread and Monitor Dump Analyzer for Java
Hutool改变我们的coding方式(二)

Hutool改变我们的coding方式 Hutool 简介 Hutool如何改变我们的coding方式文档安装 Maven
【路径规划】基于改进遗传算法求解机器人栅格地图路径规划（Matlab实现实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【心电图基线估计和去噪方法的群稀疏正则化】带有群稀疏正则化的心电图基线估计和去噪（Matlab实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
【路径规划】基于改进遗传算法求解机器人栅格地图路径规划（Matlab实现实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
初学者如何快速入门Python（内附详细攻略），一文讲清

目前python可以说是一门非常火爆的编程语言应用范围也非常的广泛工资也挺高未来发展也极好 Python究竟应该怎么学呢我自己最初也是从零基础开始学习Python的给大家分享Python的学习思路和方法一味的买书看书看视频是
2024最强Java面试八股文合集（持续更新）

今天要谈的主题是关于求职求职是在每个技术人员的生涯中都要经历多次对于我们大部分人而言在进入自己心仪的公司之前少不了准备工作有一份全面细致面试题将帮助我们减少许多麻烦在跳槽季来临之前特地做这个系列的文章一方面帮助自己巩固下基
sychnorized积累

sychnorized 1 对象锁包括方法锁默认锁对象为this 当前实例对象和同步代码块锁自己指定锁对象 2 类锁指synchronize修饰静态的方法或指定锁对象为Class对象 3 加锁和释放锁的原理现象时机内置锁th
Java进阶之旅第七天

Java进阶之旅第七天文章目录 Java进阶之旅第七天方法引用介绍代码展示结果方法引用的分类

随机推荐

阿里Java学习路线：阶段 2：数据库开发－数据库及SQL/MySQL基础：课时8：DDL（数据定义语言）之操作数据库

3 DDL 数据定义语言 3 1 基本操作 l 查看所有数据库名称 SHOW DATABASES l 切换数据库 USE mydb1 切换到mydb1数据库 3 2 操作数据库 l 创建数据库 CREATE DATABASE IF NOT
openai-chatGPT的API调用异常处理

因为目前openai对地区限制的原因即使设置了全局代理使用API调用时还是会出现科学上网代理的错误问题 openai库 0 26 5 错误提示 raise error APIConnectionError openai error AP
程序包org.apache.tools.zip不存在

可以看出 org apache tools zip 是 ant jar里面的然后在pom配置文件里面加上
LocalDateTime 相关方法

文章目录 1 获取日期时间日期时间 2 获取年月日时分秒 3 给定数值生成日期时间 4 格式化日期时间 gt 字符串 5 解析字符串 gt 日期时间 6 设定具体值 7 日期时间的加减 8 小测试日期 gt 日期时间注意本文中
2021年9月电子学会Python等级考试试卷（三级）答案解析

青少年软件编程 Python 等级考试试卷三级分数 100 00 题数 38 一单选题共25题每题2分共50分 1 使用map函数可以实现列表数据元素类型的转换而无需通过循环则将列表L 1 3 5 7 9 转换为列表 1 3
微信小程序大作业咖啡小店适合初学者使用

咖啡小店微信小程序能正常运行无错误含导航栏轮播咖啡售卖等等功能详情如下图所示下载链接在文末点我下载资源 https download csdn net download weixin 43474701 58819009
c语言strcat()/strcat_s()函数详解

前言先看下strcat strcat s 函数调用报错放大一点严重性代码说明项目文件行禁止显示状态错误 C4996 strcat This function or variable may be unsafe Consi
环境篇-Linux下安装OpenSSL

本文属于 OpenSSL加密算法库使用系列教程之一欢迎查看其它文章 linux下一般系统都自带了OpenSSL 可以直接使用包括终端直接使用OpenSSL命令直接调用OpenSSL库故一般不需要再安装若系统中没有安装Ope
muduo网络库学习笔记(8)：高效日志类的封装

前言在服务端编程中日志是必不可少的开发过程中日志的存在能方便我们调试错误和更好地理解程序运行过程中日志能帮助我们诊断系统故障并处理记录系统运行状态 muduo日志类封装细节 1 日志消息有多种级别 level 如TRACE D
sklearn之自定义转换器和流水线Pipeline

自定义转换器自定义一个类添加TransformrMixin作为基类则可以直接得到fit transform 方法添加BaseEstimator作为基类则可以获得两个调整超参数的方法 get params 和set params 实
c语言实现一个helloworld

开发工具 Dev C 代码如下 include
SOA与Web Service技术实验报告【全集】

所用教材 Java Web服务构建与运行若本文对你有用的话请点赞关注我哦 6学时实验题目 Web Service环境搭建 REST式服务作为一个HttpServlet类 JAX RS Web Service JAX RS Clien
Windows无法连接xrdp远程桌面，adduser xrdp ssl-cert后仍然提示Permission denied

今天连接远程桌面的时候在显示正在配置会话之后连接窗口就消失了使用systemctl status xrdp 命令查询到如下异常 Jul 12 22 12 46 iZuf644rn49wrcnf5o10a7Z xrdp 2296 229
Unity & Unreal Engine的官方.gitignore

gitignore Unity gitignore at main github gitignore gitignore UnrealEngine gitignore at main github gitignore Unity的 giti
nagios check_mysql uptime_nagios使用check_mysql监控mysql

如果没有check mysql插件需要安装Mysql数据库 1 建立专用数据库 root svr3 mysql u root p Enter password Welcome to the MySQL monitor Commands e
SpringMVC事务控制(xml文件配置和注解配置)

事务的定义事务应该具有4个属性原子性一致性隔离性持久性这四个属性通常称为ACID特性原子性 atomicity 一个事务是一个不可分割的工作单位事务中包括的操作要么都做要么都不做一致性 consistency 事务必须是
python之字符串替换

方法一 str replace old new max old 将被替换的子字符串 new 新字符串用于替换old子字符串 max 可选字符串替换不超过 max 次 temp str this is a test print temp
jquery保留一位小数_青岛版数学，4年级上册，动物世界——小数意义和性质，干货分享...

各位家长同学们大家好这里是玖振学堂学习分享课堂今天给大家分享的内容是青岛版数学四年级上册中动物世界小数的意义和性质这一单元的知识点小数的意义仿照整数的写法写在整数的右面用圆点隔开用来表示十分之几百分之几千分之几的数
程序员开发遇见chrome浏览器访问异常 ie 火狐正常访问快速解决办法(80以上版本chrome有重大变化)

近期有部分程序员开发遇见的chrome80以上版本url访问异常等针对相同操作系统相同浏览器相同的url所展示的异常现象网上找了很多方法尝试js调试后台跨域等然而并没有什么卵用大家也别浪费时间测试了本人尝试过以上所有方法结
实验六—基本数据管理（三）

实验6 基本数据管理三实验目的综合应用数据框的多种操作进行综合实验掌握小提琴图的绘制方法实验内容 1 计算2的1 50次方以及1 50的平方找出这两个序列有哪些元素是相等的显示出来 x lt NULL y lt NULL

实验六—基本数据管理（三）

实验6 基本数据管理（三）

实验六—基本数据管理（三） 的相关文章

随机推荐

热门标签

实验六—基本数据管理（三）的相关文章