通过对其他列数据进行随机采样来创建新列

2023-12-08

我想通过从剩余列中随机采样数据来创建一个新列。

考虑一个具有“N”列的数据框，如下所示：

|---------------------|------------------|---------------------|
|      Column 1       |     Column 2     |      Column N       |
|---------------------|------------------|---------------------|
|          0.37       |         0.8      |          0.0        |
|---------------------|------------------|---------------------|
|          0.0        |         0.0      |          0.8        |
|---------------------|------------------|---------------------|

生成的数据框应该看起来像

|---------------------|------------------|---------------------|---------------|
|      Column 1       |     Column 2     |      Column N       |     Sampled   |
|---------------------|------------------|---------------------|---------------|
|          0.37       |         0.8      |          0.0        |       0.8     |
|---------------------|------------------|---------------------|---------------|
|          0.0        |         0.0      |          B          |        B      |
|---------------------|------------------|---------------------|---------------|
|          A          |         5        |          0.8        |        A      |
|---------------------|------------------|---------------------|---------------|

“采样”列的条目是通过随机选择“N”列的相应条目之一来创建的。例如，从第 2 列选择“0.8”，从第 N 列选择“B”，依此类推。

df.sample(axis=1)只需选择一列并将其返回。这不是我想要的。

实现这一目标最快的方法是什么？该方法需要高效，因为原始数据帧很大，有很多行和列。

您可以使用底层numpy数组并为每行选择一个随机索引。

u = df.values
r = np.random.randint(0, u.shape[1], u.shape[0])

df.assign(Sampled=u[np.arange(u.shape[0]), r])

  Column 1  Column 2 Column N Sampled
0     0.37       0.8      0.0    0.37
1      0.0       0.0        B       B
2        A       5.0      0.8       A

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

通过对其他列数据进行随机采样来创建新列的相关文章

如何在 Matplotlib 饼图周围绘制箭头以将每个标签指向圆圈中各自的部分？

我一直在用 Matplotlib 绘制一些图表我有一个饼图想要在图表周围绘制箭头使每个标签都指向图表我有一个例子这是我当前的代码 import matplotlib pyplot as plt plt rcParams font
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
在 Django Admin 中调整字段大小

在管理上添加或编辑条目时 Django 倾向于填充水平空间但在某些情况下当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时这确实是一种空间浪费字符宽然后编辑框最多可容纳 15 或 20 个字符我如何告
Python 3d 绘图设置固定色阶

我正在尝试绘制两个 3d 数组第一个数组的 z 值在范围内 0 15 0 15 第二个来自 0 001 0 001 当我绘图时色标自动遵循数据范围如何设置自定义比例我不想看到 0 001 的浅色而应该看到 0 15 的浅色如何修
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
PySpark groupByKey 返回 pyspark.resultiterable.ResultIterable

我试图找出为什么我的 groupByKey 返回以下内容 0
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
python 对浮点数进行不正确的舍入

gt gt gt a 0 3135 gt gt gt print 3f a 0 314 gt gt gt a 0 3125 gt gt gt print 3f a 0 312 gt gt gt 我期待 0 313 而不是 0 312 有没有
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的

随机推荐

Devise 无法在 Google Chrome 中登录

我正在使用 Devise gem 在 Ruby on Rails Web 应用程序中进行用户身份验证该过程非常简单但是添加 Nginx 和 ssl 证书后该应用程序可以在 Mozilla Firefox 中登录但无法在 Googl
jQuery Datepicker - 根据它出现的位置添加类

我需要在输入元素中添加一个上方或下方类具体取决于日期选择器在哪一侧打开我似乎无法弄清楚如何获取即将创建的日期选择器实例的位置也许我只是想错了 order main datepicker datepicker showOn bo
@font-face 自定义图标字体仅显示 unicodes

我正在使用 CSS3 的 font face 自定义图标字体并且在旧版本的 Google Chrome 中仅显示 unicode 并且不会在我的自定义字体中替换或呈现该字体显示这些 un icode 的字形这是我正在使用的 font
“使用命名空间 std；”没有任何#include？ [复制]

这个问题在这里已经有答案了我尝试遵循它工作没有问题但在这种情况下 std 没有定义 using namespace std int main 你的代码是非法的指示using只能提名先前声明的命名空间即可以通过名称查找找到名称的命名
删除 div 时的 Bootstrap 网格布局

因此我正在使用一个仪表板外观它可能有四个可以打开的方块并且角色取决于用户角色顶行通常保留原样因此其宽度约为 30 另一行的宽度约为 70 这可以但是在仪表板的底行您可以有两个正方形当这两个都打开时我当前的网格设置工作得
过滤对象中的多个值

我需要按多个值过滤对象对象示例 items url https id 1693 type ABC currencyCode SEK longName Abc name ABC micCode DEF listingDate 2018 05
使用 numpy 进行数组重新分类

我有一个包含 10 位数字的大型 50000 x 50000 64 位整数 NumPy 数组数组中大约有 250 000 个唯一数字我有第二个重新分类表它将第一个数组中的每个唯一值映射到 1 到 100 之间的整数我希望将第一个数组
无法从 Orchard 模块中的项目文件夹加载图像

我正在尝试在 Orchard 模块中插入图像但遇到了一些问题 img src Href Modules Orchard Slider Content img other jpg gt 在我看来我写了这个但是图像没有加载它说找不到资源
如何修复 jslint The '&&' subexpression should bewrapped in parens 错误

我将所有内容都放在括号中但下面的代码仍然在 jslint 中抛出错误 Problem at line 5 character 104 The subexpression should be wrapped in parens if typ
.htaccess 导致所有页面被下载

我添加了以下行 htaccess AddType application x httpd php html htm 当我尝试加载侧面的任何页面时我的浏览器会尝试下载该页面我究竟做错了什么 Thanks 最有可能的您没有为您的网络服务器
将 JLabels 置于 JPanel 中心

我正在制作一个记分程序但遇到了问题我试图做的是在顶部有一个 JPanel 其中包含两个 JPanel 而 JPanel 又包含两个团队名称我很困惑为什么程序顶部的两个 JLabel 没有位于它们所包含的 JPanel 内部的中心 im
c_str 的使用是否带有异常未定义行为？

我见过几个类似的代码片段如下所示 struct MyExcept std exception explicit MyExcept const char m noexcept message m const char what const
如何运行在关闭 PuTTY SSH 会话后仍然运行的 Linux 命令？

我通过 putty 连接到我的 NAS 它在上面运行 Linux 我想将一个大目录从一个位置移动到另一个位置关闭 Putty 会话后是否可以保持进程运行我担心如果我关闭腻子文件将不会被复制到最后使用 nohup 开始任务并使用将
jQuery ui 选项卡中的多个 jQgrid

我遇到一个问题需要帮助我有 3 个 jQueryUI 选项卡第一个包含项目网格第二个保存工单网格第三个只是发出警报以验证显示功能是否正常工作问题是我在第二个选项卡上没有网格第一个负载正常如果我注释掉第一个选项卡的代码第二个网
Ruby on Rails：自定义操作

我是rails新手所以我向你解释一下我的情况我有一个用户模型和一个用户控制器用户使用电子邮件地址和密码登录特殊用户可以通过在表单中输入受邀者的电子邮件地址并点击提交来邀请其他用户然后受邀用户会收到一封邮件其中包含用于激活其帐
MySQL RAND() 种子值几乎重复

在 Windows 7 上使用 MySQL 5 6 21 我试图从按日期播种的表中返回随机行因此同一行返回当天然后切换第二天等如果您愿意可以是当天生成器的随机引用我注意到相同的行不断出现因此我将查询简化为基础看来 RAN
GO - WaitGroups 参考中的指针或变量

根据sync包中的以下函数声明添加 gt func wg WaitGroup Add delta int 完成 gt func wg WaitGroup Done 等待 gt func wg WaitGroup Wait 我知道它们都是由
如何自动启动 Android 应用程序？

我不确定如何在 Android 模拟器完成启动后自动启动 Android 应用程序有人有任何代码片段可以帮助我吗您必须添加清单权限条目
JPA @EmbeddedId：如何更新复合主键的一部分？

我有一个多对多关系其中链接表有一个附加属性因此链接表也由实体类表示称为Composition 主键为Composition is an Embeddable链接到相应的实体例如 2 ManyToOne参考用户在选择两个引用中的任
通过对其他列数据进行随机采样来创建新列

我想通过从剩余列中随机采样数据来创建一个新列考虑一个具有 N 列的数据框如下所示 Column 1 Column 2 Column N 0 37 0 8 0 0

通过对其他列数据进行随机采样来创建新列

通过对其他列数据进行随机采样来创建新列 的相关文章

随机推荐

热门标签

通过对其他列数据进行随机采样来创建新列的相关文章