找出我的收藏中出现最多的值及其比例

2024-01-10

我已经尝试过使用 R 一点,目前我面临以下问题:

我有一张桌子data其属性中存储了一些数值foo。现在,如果我想从中获取比例表,我可以使用以下命令:

prop.table(table(data$foo))

这对我有用并产生以下输出(这只是其中的一部分):

[1] 0.005271318 0.005271318 0.003875969 0.004031008 0.005581395 0.005736434 0.004031008 0.005891473 0.006046512

我现在想做的是找出哪个比例最高,我是这样做的:

proportions <- prop.table(table(data$foo))
max(proportions)

我的问题是下一步:找出(以编程方式)我的值data$foo是我的输出的对应值max(proportions).

所以如果我有这个价值0.05作为我的最大值(比例),我想找到出现的所有值0.05%我的数据集中的机会(也可能有多个值,因为我的sum(proportions==mymax)产生输出2).

我尝试过prop.table(data$foo==mymax) where mymax <- max(proportions),(当然)这并没有按照我希望的方式进行。它只是生成一个布尔值列表。

我怎么可能这么做呢?

我创建了一些随机数据作为示例:

> dput(foo)
c(33L, 41L, 27L, 36L, 46L, 35L, 24L, 45L, 46L, 31L, 43L, 25L, 
44L, 48L, 24L, 35L, 22L, 25L, 23L, 21L, 25L, 43L, 40L, 33L, 28L, 
24L, 21L, 35L, 24L, 46L, 44L, 29L, 36L, 32L, 40L, 32L, 26L, 34L, 
37L, 49L, 46L, 36L, 46L, 38L, 41L, 36L, 32L, 50L, 29L, 23L, 37L, 
50L, 25L, 36L, 41L, 47L, 35L, 41L, 46L, 22L, 34L, 39L, 31L, 32L, 
46L, 40L, 33L, 29L, 48L, 23L, 47L, 40L, 37L, 38L, 21L, 21L, 21L, 
28L, 31L, 26L, 30L, 25L, 32L, 49L, 31L, 47L, 20L, 31L, 33L, 34L, 
38L, 30L, 41L, 41L, 50L, 32L, 41L, 49L, 21L, 49L, 26L, 21L, 29L, 
20L, 47L, 24L, 26L, 42L, 50L, 25L, 36L, 42L, 28L, 28L, 30L, 28L, 
43L, 21L, 33L, 25L, 26L, 50L, 25L, 39L, 38L, 36L, 44L, 50L, 24L, 
45L, 39L, 39L, 35L, 25L, 37L, 36L, 38L, 41L, 24L, 42L, 34L, 29L, 
35L, 20L, 40L, 41L, 20L, 49L, 45L, 20L)


> prop.table(table(foo))
foo
         20          21          22          23          24          25          26          27          28          29 
0.033333333 0.053333333 0.013333333 0.020000000 0.046666667 0.060000000 0.033333333 0.006666667 0.033333333 0.033333333 
         30          31          32          33          34          35          36          37          38          39 
0.020000000 0.033333333 0.040000000 0.033333333 0.026666667 0.040000000 0.053333333 0.026666667 0.033333333 0.026666667 
         40          41          42          43          44          45          46          47          48          49 
0.033333333 0.060000000 0.020000000 0.020000000 0.020000000 0.020000000 0.046666667 0.026666667 0.013333333 0.033333333 
         50 
0.040000000 

> myprop <- prop.table(table(foo))
> max(myprop)
[1] 0.06


> sum(myprop)
[1] 1

现在我知道,我的数据中出现的最高比例是0.06并且只发生一次,对吗?我想知道的是:那有什么价值?我能做的是:

> myprop==max(myprop)
foo
   20    21    22    23    24    **25**    26    27    28    29    30    31    32    33    34    35    36    37    38    39 
FALSE FALSE FALSE FALSE FALSE  **TRUE** FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE 
   40    41    42    43    44    45    46    47    48    49    50 
FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE 

所以我寻找的值是 25,但是除了手动搜索这个表之外,还必须有另一种方法。我就是搞不明白。


您似乎忽略了为您提供的表名称:

x <- c(1, 1, 2, 3)
(proportions <- prop.table(table(x)))
# x
#    1    2    3 
# 0.50 0.25 0.25 
max(proportions)
# [1] 0.5 
names(proportions)[which.max(proportions)]
# [1] "1"
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

找出我的收藏中出现最多的值及其比例 的相关文章

  • 如何更新条件公式?

    让我直接进入示例 考虑以下等式 frml lt formula y a b x z 使用这样的公式规范 例如和AER ivreg 我想更新这个公式 使其显示为 frml2 lt y a b c x z w 但是 我不确定如何更新条件标志之前
  • 使用 dplyr:group_by 将数据帧分成多个子集?

    有没有办法根据 group by 组使用 dplyr 将一个数据帧拆分为数据帧的子集 mtcars gt group by cyl gear gt codes 非常感谢 好吧 并不是你真的想要 但你可以这样做tidyr 即nearly一样的
  • R:将 readRDS 应用于 .Rds 文件名的列表对象

    我有几个包含数据帧对象的 Rds 文件 我想对每个文件应用一个函数并将数据帧绑定到单个数据帧中 但是 当我尝试从文件名列表中读取多个 Rds 文件时 我收到错误 FUN X i 中的错误 从连接读取时出错 readRDS 不适用于列表吗 R
  • 错误:“rjags”的包或命名空间加载失败

    在终端的 conda 环境之一中 我能够成功安装包 rjags 但是 当我在该环境中运行 R 并运行库 rjags 时 出现以下错误 加载所需的包 coda 错误 rjags 的包或命名空间加载失败 rjags 的 loadNamespac
  • R.matlab/readMat:readTag(this) 中出错

    我正在尝试使用 R matlab 将 matlab 文件读入 R 但遇到此错误 require R matlab r lt readMat file mat verbose T Trying to read MAT v5 file stre
  • 当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时,如何将文本文件读入 R

    如何读取文本文件 其中每条记录都是一个段落 每个换行符表示单独的字段 复杂的是 有些记录有 4 行 有些记录有 6 行 当字段数量的差异为 1 时 DWin 解决了我的问题 但当字段数量差异为 2 时 一切都崩溃了 你可以有一个在这里看看他
  • 在另一个 Rmd 中运行选定的块

    我已经在源 Rmd 文件中运行了分析 并且希望仅使用few来自源的块 我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
  • 将函数应用于 3d 数组的每一层,返回一个数组

    假设您有一个包含行 列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数 它接受一个矩阵作为输入并返回一个矩阵作为输出 就像t 如何将该函数应用于数组的每一层 返回与第一层大小相同的另一个数组 我觉得我应该
  • 仅保留百分比的尾随零

    给出以下示例 library pander tableAbs lt Titanic 1 1 tablePct lt round prop table tableAbs 100 2 table lt cbind tableAbs tableP
  • fread 将空导入为 NA

    我正在尝试导入带有空白的 csv 读取为 不幸的是他们都读作 NA now 为了更好地演示问题 我还展示了如何NA NA and 都映射到同一事物 除了最底部的示例 这将妨碍简单的解决方法dt is na dt lt gt write cs
  • glmnet 未从 cv.glmnet 收敛 lambda.min

    我跑了20倍cv glmnet套索模型以获得 lambda 的 最佳 值 但是 当我尝试重现结果时glmnet 我收到一个错误 内容如下 Warning messages 1 from glmnet Fortran code error c
  • 使用outer代替expand.grid

    我正在寻找尽可能快的速度并留在基地做该做的事expand grid做 我用过outer为过去类似的目的创建一个向量 像这样的东西 v lt outer letters LETTERS paste0 unlist v lower tri v
  • 在 R 中使用 Huggingface Transformer 模型

    我正在尝试在 R 中使用不同的 Huggingface 模型 这是通过 reticulate 导入 Transformer 包来实现的 谢谢 https rpubs com eR ic transfoRmers https rpubs co
  • 如何在R中同时对三个字段进行网络分析

    如何在 R 中同时对三个字段进行网络分析 下面是示例数据以及desired output在最后一栏中 df lt data frame stringsAsFactors FALSE id 1 c ABC ABC BCD CDE DEF EF
  • 从数据框创建稀疏矩阵

    我正在做一项作业 尝试为 Netflix 奖项数据构建协作过滤模型 我使用的数据位于 CSV 文件中 我可以轻松地将其导入到数据框中 现在我需要做的是创建一个稀疏矩阵 其中用户作为行 电影作为列 每个单元格都由相应的评级值填充 当我尝试绘制
  • 更改计划的开始日期以优化资源

    我有很多工作需要在特定的时间间隔执行 然而 我们每天完成这项工作的资源有限 因此 我正在尝试优化开始时间日期 开始时间日期只能向前移动 不能向后移动 以便每天使用的资源与我们的预算更加不相似 这些函数在下面的示例中使用 Function t
  • R - Quantstart:多种股票的测试策略

    我正在使用一些指标构建基本交易策略 我的问题是我希望它在多个股票上运行 而不必指定我想要测试的每个单独的股票 目前我可以使用向量一次获取多个符号 如下所示 Get Shares from Yahoo Finance Stocks lt AS
  • 使用许多特殊字符将 R 连接到 HANA 数据库时出现问题

    我在将 HANA 数据读入 R 时遇到问题 我已通过以下方式建立了连接 ch lt odbcConnect HANA uid USER pwd PW 并确认我已通过以下方式连接 sqlTables ch 这会调出我的表格列表 对我想要拉取的
  • 根据R中的前一行和当前行按组计算

    我可以根据 R 中的前一行和当前行进行计算 对于此数据框 df A B 1 2 2 2 2 3 3 4 5 5 B2 A2 0 5 B1 我可以使用这段代码来计算这个函数 for i in 2 nrow df B i lt 1 2 B i
  • 使用 R 交互式更改 Plotly 图像中的轴刻度(线性/对数)

    Goal 创建交互式下拉菜单 按钮来更新 R 中 Plotly 图形的轴比例 Issue 有很多关于创建的文档buttons https plot ly r custom buttons and 对数图 https plot ly r lo

随机推荐

  • 在 Jenkins 中运行 XCodeBuild 时出现代码签名错误

    不重复类似的问题 如下文进一步解释 从 Jenkins 中运行 XCodeBuild 时出现代码签名错误 但它可以从命令行或 Xcode 中构建正常 过去有几个人遇到过这个问题 他们的共同主题是 Jenkins 在启动时作为守护程序用户运行
  • 在 C# 中动态生成委托类型

    我们有一个要求 需要动态生成委托类型 我们需要根据输入参数和输出生成委托 输入和输出都是简单类型 例如 我们需要生成 int Del int int int string and int Del2 int int string int 任何
  • Super POM,Gradle中层次管理的Parent POM类型

    我们目前使用 Maven 作为构建工具 并且有一个迁移到 Gradle 的指令 我们当前的设置是 我们有一个超级 POM 它定义了所有第三方依赖项 各种插件 distributionManagement URL 并且该 POM 已上传到我们
  • 禁用大型项目​​中的组件

    有很多开发人员和初级人员 我想禁用某些组件 例如
  • 如何在 Chrome 浏览器中调试 AngularJS [关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我正在研究 AngularJS 我想在chrome中调试代码 在 Firefox 中 我可以在 Firebug 的帮助下调试它 任何想法 谢
  • Netty-无法访问类 jdk.internal.misc.Unsafe

    当我将 Java 从 8 升级到 11 时 我收到来自 Netty 的错误 jdk internal misc Unsafe 详细信息如下 我知道这是一条调试级别消息 我可以更改日志级别以忽略它 但我不确定当我忽略它时是否会出现其他问题 例
  • 等待多个 Akka FSM 消息

    我有一个 Akka FSM actor 在收到消息后运行以下伪代码ReadyState lookupA Wrapper Lookup A lookupB Wrapper Lookup B lookupC Wrapper Lookup C g
  • 在 Visual Studio 中折叠相关文件

    在 Visual Studio 中 大多数人都会注意到相关文件可以折叠为一个 例如 Form1 cs Form1 Designer cs 我正在创建一个 DAL 库 并将部分类拆分为多个文件 例如 SomeTableClass cs Som
  • windows下“我的电脑”文件夹的路径是什么?

    我正在使用 Visual Studio IDE 开发 C windowsform 项目 我用CFileDialog类要求用户选择要打开的文件 它显示通常打开的文件选择窗口 我希望显示的默认文件夹与单击 我的电脑 时访问的文件夹相同 其中显示
  • Visual Studio 中的引用属性的别名是什么?

    在 Visual Studio 中的 C 项目中 展开 References 文件夹 然后查看任何引用的属性 您会看到 Aliases 属性 在项目中 该属性具有 全局 值 有人可以告诉我这个属性的用途以及如何使用它吗 Thanks 您可能
  • MySQL 扩展显示

    是否有相当于 psql 的 x 来查看新行中每列的记录 Append G到语句末尾而不是分号 SELECT FROM table name WHERE condition G
  • array_multisort():数组大小不一致[重复]

    这个问题在这里已经有答案了 我正在尝试使用以下方法在其子数组的基础上对数组进行排序array multisort 功能 在努力的同时 print r mar echo br arr2 array multisort mar array we
  • R 中的 SVM:“预测器必须是数字或有序的。”

    我是 R 新手 遇到了这个问题 我想比较两种预测技术 支持向量机和神经网络 将它们应用于某些数据 并且我想比较它们的性能 为此 我使用 ROC 曲线 该代码应该计算 ROC 曲线下的面积 但它不起作用 神经网络代码工作正常 但是当 SVM
  • 将谷歌电子表格中的批量数据填充到谷歌表单下拉列表中

    我有一个包含多个部分的谷歌表单 每个部分都有一个下拉列表 我希望从电子表格中提取具有匹配名称的下拉列表的数据 这是我运行的脚本 但它似乎不起作用 function getDataFromGoogleSheets const ss Sprea
  • wagtail页面模型与其自身的多对多关系?

    所以我得到了一个带有 同伴 字段的 PlantDetailPage 模型 是的 植物可以是同伴 其中我应该能够选择其他 PlantDetailPages 我得到了显示的东西 在内联中创建新植物 是的 菜单中的菜单中的菜单 但有几个问题 1
  • 在android中查找从源到目的地的路线方向

    我是android新手 我已经成功编写了显示谷歌地图的代码 我可以给出源地址和目标地址 并使用反向地理编码概念将图钉放置在那里 该场景是我想显示从源点到目的地点的驾驶 步行 骑自行车方向 并显示从源点到目的地的一条线 据我所知 Androi
  • UISwipeGestureRecognizer 无法识别在视图外发起的滑动手势

    func addSwipe self isUserInteractionEnabled true let directions UISwipeGestureRecognizerDirection right left for directi
  • 在自定义印迹上使用什么、如何以及何时使用静态格式、格式和格式?

    描述 我正在尝试创建一个用于文本突出显示的内联印迹 我知道这个功能已经存在 https github com quilljs quill blob develop formats background js在羽毛笔中 但在我的实现中 我想根
  • PyCharm getitem 对带有数组的函数发出警告

    我收到来自 PyCharm 的代码检查警告 我理解这个逻辑 但我不清楚修复它的适当方法 假设我有以下示例函数 def get ydata xdata ydata xdata 2 for i in range len ydata print
  • 找出我的收藏中出现最多的值及其比例

    我已经尝试过使用 R 一点 目前我面临以下问题 我有一张桌子data其属性中存储了一些数值foo 现在 如果我想从中获取比例表 我可以使用以下命令 prop table table data foo 这对我有用并产生以下输出 这只是其中的一