Cut() 错误 - “中断”不是唯一的

2023-12-13

我有以下数据框：

 a         
    ID   a.1    b.1     a.2   b.2
1    1  40.00   100.00  NA    88.89
2    2  100.00  100.00  100   100.00
3    3  50.00   100.00  75    100.00
4    4  66.67   59.38   NA    59.38
5    5  37.50   100.00  NA    100.00
6    6  100.00  100.00  100   100.00

当我将以下代码应用于此数据框时：

 temp <- do.call(rbind,strsplit(names(df)[-1],".",fixed=TRUE))
 dup.temp <- temp[duplicated(temp[,1]),]

 res <- lapply(dup.temp[,1],function(i) {
 breaks <- c(-Inf,quantile(a[,paste(i,1,sep=".")], na.rm=T),Inf)
 cut(a[,paste(i,2,sep=".")],breaks)
 })

cut()函数报错：

 Error in cut.default(a[, paste(i, 2, sep = ".")], breaks) : 
 'breaks' are not unique

然而，相同的代码在类似的数据帧上运行得非常好：

 varnames<-c("ID", "a.1", "b.1", "c.1", "a.2", "b.2", "c.2")

 a <-matrix (c(1,2,3,4, 5, 6, 7), 2,7)

 colnames (a)<-varnames

 df<-as.data.frame (a)


    ID  a.1  b.1  c.1  a.2  b.2  c.2
  1  1    3    5    7    2    4    6
  2  2    4    6    1    3    5    7

 res <- lapply(dup.temp[,1],function(i) {
 breaks <- c(-Inf,quantile(a[,paste(i,1,sep=".")], na.rm=T),Inf)
 cut(a[,paste(i,2,sep=".")],breaks)
 })

 res
[[1]]
[1] (-Inf,3] (-Inf,3]
Levels: (-Inf,3] (3,3.25] (3.25,3.5] (3.5,3.75] (3.75,4] (4, Inf]

[[2]]
[1] (-Inf,5] (-Inf,5]
Levels: (-Inf,5] (5,5.25] (5.25,5.5] (5.5,5.75] (5.75,6] (6, Inf]

[[3]]
[1] (5.5,7] (5.5,7]
Levels: (-Inf,1] (1,2.5] (2.5,4] (4,5.5] (5.5,7] (7, Inf]

这个错误的原因是什么？如何解决？谢谢。

您收到此错误是因为列数据中的分位数值b.1, a.2 and b.2对于某些级别是相同的，因此它们不能直接用作函数中的中断值cut().

apply(a,2,quantile,na.rm=T)
       ID      a.1    b.1   a.2      b.2
0%   1.00  37.5000  59.38  75.0  59.3800
25%  2.25  42.5000 100.00  87.5  91.6675
50%  3.50  58.3350 100.00 100.0 100.0000
75%  4.75  91.6675 100.00 100.0 100.0000
100% 6.00 100.0000 100.00 100.0 100.0000

解决这个问题的一种方法是把quantile() inside unique()函数 - 这样您将删除所有不唯一的分位数值。如果分位数不唯一，这当然会减少断点。

res <- lapply(dup.temp[,1],function(i) {
  breaks <- c(-Inf,unique(quantile(a[,paste(i,1,sep=".")], na.rm=T)),Inf)
  cut(a[,paste(i,2,sep=".")],breaks)
})

[[1]]
[1] <NA>        (91.7,100]  (58.3,91.7] <NA>        <NA>        (91.7,100] 
Levels: (-Inf,37.5] (37.5,42.5] (42.5,58.3] (58.3,91.7] (91.7,100] (100, Inf]

[[2]]
[1] (59.4,100]  (59.4,100]  (59.4,100]  (-Inf,59.4] (59.4,100]  (59.4,100] 
Levels: (-Inf,59.4] (59.4,100] (100, Inf]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Cut() 错误 - “中断”不是唯一的的相关文章

计算一列中正数和负数的数量

我想计算数据帧的一列中正值和负值的数量我在 R 中该怎么做例如这里是数据框 logFC logCPM LR PValue FDR Bra15066 5 630822 5 184586 73 79927 8 647868e 18 4 0
R 中带有文件名的 For 循环

我有一个文件列表例如 nE pT sbj01 e2 2 csv nE pT sbj02 e2 2 csv nE pT sbj04 e2 2 csv nE pT sbj05 e2 2 csv nE pT sbj09 e2 2 csv nE
如何让 print() 将参数传递给 R 中用户定义的打印方法？

我在 R 中定义了一个 S3 类它需要自己的打印方法当我创建这些对象的列表并打印它时 R 按其应有的方式对列表中的每个元素使用我的打印方法我想对打印方法实际显示的数量进行一些控制因此我的类的 print 方法需要一些额外的参数但
将循环转换为并行计算的函数

我正在使用 R 编程语言我遇到这个问题我试图找出两个 shapefile 之间的成对交集即第一个 shapefile 中的每个多边形与第二个 shapefile 中的所有多边形相交的百分比我想我找到了解决这个问题的基本方法 Load
从 R 中的向量中选择所有可能的元组

我正在尝试用 R 编写一个程序当给定一个向量时将返回所有可能的tuples http en wikipedia org wiki Tuples该向量中的元素例如元组 c a b c c a b c 出租车 c a c c b c c
基于服务器中的条件逻辑呈现闪亮的用户输入

我正在尝试设置一个闪亮的导航栏面板页面其中用户控制我根据一组单选按钮中所做的初始选择来显示更改我直接在 ui 中渲染单选按钮然后在 Server r 中的观察到的逻辑控制结构内构建条件控件弹出错误是因为我的初始 if 语句计算结
计算例如具有多列 data.frames 的列表中的平均值

我有几个 data frames 的列表每个 data frame 有几列通过使用mean mylist first dataframe a我可以得到这个 data frame 中 a 的平均值但是我不知道如何计算列表中存储的所有 d
如何在 ggplot 中保持配色方案，同时删除每个图中未使用的级别？

我想比较一个图中的数据的一些子组和另一图中的一些其他子组如果我绘制一个图其中绘制了所有子组那么这个数字将是巨大的并且每个单独的比较都会变得困难我认为如果给定的子组在所有图中都具有相同的颜色这对读者来说会更有意义这是我尝试过的两
在shiny中过滤传单地图数据

我在用传单地图设置这个闪亮的东西时遇到了麻烦我的原帖 https stackoverflow com questions 50111566 applying leaflet map bounds to filter data within
我无法下载 R 中的 reshape2 包 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试安装 R 包时收到此响应 gt installed packages reshape2 Package LibPath V
正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
在 R 中向散点图添加线条

如何向图表添加线条我做了以下 dat lt data frame xvar 1 20 rnorm 20 sd 10 yvar 1 20 rnorm 20 sd 10 zvar 1 20 rnorm 20 sd 10 plot dat 1
如何使用 R 计算成为列表中中位数的概率？

假设我有以下数据集其中显示了假设实验的每个状态的三个观察结果的列表 state lt c Iowa Minnesota Illinois outcome lt list c 5 11 11 c 3 12 8 c 9 14 2 dat lt
选择 R 中的数据表中隐藏时（在绿色加号下方）列的显示顺序

Context 使用 DataTables 库制作交互式表格时当屏幕宽度对于列的数量和宽度来说太窄时列将隐藏在绿色号下我有一个非常宽的表格有 20 多列其中一些内容非常冗长因此某些列在所有屏幕宽度下总是隐藏的每次隐藏新列时
时间戳半小时窗口内字段的平均值

我的数据框有列名Timestamp es看起来像 Timestamp es 2015 04 01 09 07 42 31 2015 04 01 09 08 01 29 5 2015 04 01 09 15 03 18 5 2015 04 0
将绘图调用拆分为多个块

我正在编写一个图的解释其中我基本上将在第一个块中创建图然后描述该输出并在第二个块中添加一个轴然而似乎每个块都会强制一个新的绘图环境因此当我们尝试使用以下命令运行块时会出现错误axis独自的观察 output html docu
kernlab 中 SVM 训练之外的核矩阵计算

我正在开发一种新算法该算法可以生成修改后的核矩阵以用于 SVM 训练但遇到了一个奇怪的问题出于测试目的我比较了使用 kernelMatrix 接口和普通内核接口学习的 SVM 模型例如 Model with kernelMatri
Purrr::map_df() 删除 NULL 行

使用时purrr map df 我偶尔会传递一个数据框列表其中一些项目是NULL 当我做 map df 返回行数少于原始列表的数据框我想发生的事情是这样的map df calls dplyr bind rows 它忽略了NULL价值观
在 R 中使用 lapply 绘制多个数据帧

我正在尝试使用 lapply 函数绘制多个数据帧每个数据帧一个图但是尽管有关此主题的所有帖子我都找不到答案因为我不断收到错误图的输出列表为空我的数据结构如下 df1 lt mtcars gt group by cyl gt tal
基于时间窗口的不规则时间序列的优化滚动函数

有没有办法使用 rollapply 来自zoo包或类似的东西优化功能 rollmean rollmedian等使用基于时间的窗口计算滚动函数而不是基于大量观察的函数我想要的很简单对于不规则时间序列中的每个元素我想计算一个具有 N

随机推荐

当参数是 String 和 RegExp 类时，Angular 2 表单验证器中的 RegEx 会产生不同的结果

我正在尝试使用 Angular 2 表单验证器和我放入的正则表达式来验证基本表单元素Validators pattern 匹配有效的 URL 就是匹配当参数是字符串数据类型时理论上无效的模式 example component ts thi
如何检查可选功能参数是否设置

Python 中是否有一种简单的方法来检查可选参数的值是否来自其默认值或者是因为用户在函数调用时显式设置了它并不真地标准方法是使用用户不希望传递的默认值例如一个object实例 DEFAULT object def foo para
C# 中的命名约定 [关闭]

Closed 这个问题是基于意见的目前不接受答案 C 普遍接受的命名约定是什么函数类参数局部变量命名空间等微软有一个优秀的班级图书馆设计指南集包括一个命名部分简而言之括号中的示例类结构 PascalCase WebR
如何从 Matlab 命令提示符关闭一个或所有当前打开的 Matlab (*.m) 文件？

我在网上找到了一个解决方案见下文大约 2009 年该解决方案在我的机器 Windows 7 Matlab R2013a 上不起作用 Editor com mathworks mlservices MLEditorServices Ed
如何使用 iTextSharp 打印网格视图

如何在 asp net 中使用 iTextSharp 打印 GridView 数据全部我只需要一个提示而不是完整的代码尝试用这个 protected void ExportToPDF GridView gvReport bool La
通过循环添加 JPanel

成功了感谢你们代码如下我用了BoxLayout因为我认为这对于将问题一个一个地堆叠起来是理想的但现在我遇到了布局问题当我堆叠几个问题时问题面板开始重叠有什么想法吗 panels1 new MultipleChoice 5 se
在 erb 模板中禁用 HTML 转义

在 Rails 3 应用程序中我有一个域类其中一个属性存储纯 HTML 内容它是一个博客应用程序域类是 Post 在 ERB 模板中我需要显示格式化后的属性内容并放置 HTML 标签但是 Rails 正在转义所有 HTML 标
是否有受支持的方法来获取 H2O 模型在训练期间使用的功能列表？

这就是我的情况我有 400 多个特征其中许多可能无用而且通常为零我希望能够使用这些特征的子集训练模型查询该模型以获取实际用于构建该模型的功能构建一个仅包含这些特征的 H2OFrame 我为我想要预测的每一行得到一个稀疏的非零值
如何在 Wp7 应用程序中处理 Web 浏览器后退和前进导航

我在 Windows Phone 7 应用程序中使用网络浏览器我只想知道如何像任何桌面浏览器一样处理其后退和前进导航以及如何阻止特定导航我提到here和许多其他人但找不到任何对我有用的东西请帮忙您可以通过处理 OnNavigat
InsertMenu/AppendMenu - 如何使用 C++ 和 win32 将图标添加到菜单和子菜单

我使用 C 和 win32 编程编写了一个 shell 扩展 dll 上下文菜单程序开发环境是Visual Studio 2008和2010 在下面的示例代码中我尝试仅为主菜单添加菜单图标主菜单不显示菜单图标我需要为所有菜单项添加图
将 ajax 结果存储在 jQuery 变量中

我开始使用 jQuery 和 ajax 从数据库获取数据但我不知道如何将 get 的结果保存到回调函数外部的变量中这是我的 jquery 脚本 var result get test php function data result d
AKAudioPlayer：扬声器没有声音，只有耳机有声音

使用 AudioKit 进行声音管理我注意到这段非常简单的代码存在问题错误 import AudioKit class MainViewController UIViewController var audioFile AKAudioF
Intent Action_dial 在 android 11 中不起作用

我目前正在开发一个 Android 应用程序需要一个启动电话的功能所以我添加了这段代码 public void dialPhoneNumber String phoneNumber Intent intent new Intent In
Folium 中的 HeatMapWithTime 插件

我能够创建热图但点未显示 import folium import folium plugins as plugins import numpy as np import pandas as pd import geopandas as
将文件（配置）从 HDFS 复制到每个 Spark 执行器的本地工作目录

我正在研究如何使用 Java 将包含资源依赖项文件的文件夹从 HDFS 复制到每个 Spark 执行器的本地工作目录我最初考虑使用 Spark Submit 的 files FILES 选项但它似乎不支持任意嵌套的文件文件夹因此看来
提交到 Apple Store 后生成 APN SSL 证书时出现问题

我无法让 Apple 为我的应用程序 ID 生成 APN SSL 证书我已经向苹果商店提交了申请正在等待审核我使用临时应用程序 ID bundle id adHoc 测试了该应用程序一切顺利我使用应用 ID bundle id r
如何使用 JAXB 将 ArrayList
转换为 XML？
我正在尝试使用 JAXB 将 ArrayList 转换为 xml ArrayList

用于多个不同类名组合的 CSS 选择器

我想隐藏一些类这些类看起来像 class 1 class 2 class 3 class 60等等我想隐藏所有 class20s class30s 类并且键入每个类行并不是有效的方法 class21 class22 class23 d

使用 NSPredicate 按日期过滤 coredata 不返回任何内容

嗨我是这个核心数据的新手我有两个实体 CategoryList 和 ExpenseList CategoryList由两个属性组成1 日期 nsdate 2 类别 nsstring 在与 ExpenseList 的许多关系中关系名称为

Cut() 错误 - “中断”不是唯一的

我有以下数据框 a ID a 1 b 1 a 2 b 2 1 1 40 00 100 00 NA 88 89 2 2 100 00 100 00 100 100 00 3 3 50 00 100 00 75 100 00 4 4 66 67
热门标签

NF5280M4

HardWare

服务器网页压缩图片

图像配准

信息安全工具

SMMS

OAPPEND

分别写

连续写

复杂业务

五一技术分享

java技术

各自然带代表植被

ios弱网测试

zindex

事前用户分层

分层抽样

用户不均匀

业务AB实验

叉结构

链结构

华清远见

C语言初学练习

练习C语言

黑莓BES12
Powered by Hwhale

Cut() 错误 - “中断”不是唯一的

Cut() 错误 - “中断”不是唯一的 的相关文章

随机推荐

热门标签

Cut() 错误 - “中断”不是唯一的的相关文章