查找两个数组中的重复值，Python

2024-04-22

我有两个数组（A 和 B），每个数组约有 50 000 个值。每个值代表一个 ID。我想创建一个包含三列的 pandas 数据框，col1：数组 A 中的值，col2：数组 B 中的值，col3：带有标签“唯一”或“重复”的字符串。在每个数组中，ID: 都是唯一的。

数组的长度不同。所以我不能做这样的事情来开始。

a = np.array([1, 2, 3, 4, 5])
a = np.array([5, 6, 7, 8, 9, 10])
pd.DataFrame({'a':a, 'a':b})

然后我想创建一个不同的 pandas 数据框，也包含三列。一个表示 ID，另一个表示 ID 来自哪个数组（a 或 b）。然后根据 ID 进行分组并计算出现次数。如果 >=2 那么我们就有一个重复的。

但我不知道如何在同一列中依次获取 numpy 数组（如 R 中的 rbind），同时根据值来自哪个数组创建另一列。

很可能有比我上面建议的更好的解决方案。有任何想法吗？

要查找两个数组中的重复元素，请使用numpy.intersect1d:

In [458]: a = np.array([1, 2, 3, 4, 5])

In [459]: b = np.array([5, 6, 7, 8, 9, 10])

In [462]: np.intersect1d(a,b)
Out[462]: array([5])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

NumPy

查找两个数组中的重复值，Python 的相关文章

导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

Codeigniter htaccess 和 base_url

我安装了 codeigniter 并开始在上面编写一些代码首先我想删除 index php 并对其进行一些研究我用下面的一个小 htaccess 代码将其删除 RewriteEngine on RewriteCond 1 index p
link_to_remote 是否有等效的 :disable_with ？

我有一个 link to remote 我想确保人们在等待它返回时只能单击它一次有没有什么好的方法可以在有人点击后禁用它更改链接的文本也很好但我也想禁用它以确保顺便说一句这是 Ruby on Rails 您无法禁用链接但您可以更
在文件夹的上下文菜单中运行批处理文件

当我右键单击任何文件夹时我想运行此批处理文件 setenv cmd echo off SET CPLUS INCLUDE PATH C mingw32 include C mingw32 lib gcc mingw32 4 9 2 inc
为什么create系统调用叫creat？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
RestKit 0.20.0pre5：每个请求的 HTTP 标头

我想发送一个If Modified Since带有 GET 请求的 http 标头由 RKObjectManager getObjectsAtPath the 迁移指南 https github com RestKit RestKit w
Maven 错误：也许您正在 JRE 而不是 JDK 上运行？

我以前从未使用过 Maven 我正在按照说明进行操作here http ecmarchitect com alfresco developer series tutorials maven sdk tutorial tutorial htm
使用类型类将 Haskell 中的值与类型关联起来

我想使用类型类返回String功能上依赖于 Haskell 类型的实例例如假设我们有这样的类型Form 我想将字符串 form 与此类型相关联给定类型Invocation 我想关联字符串 job 等等重要的是我通常不会有相关类型的实
Shell 脚本读取缺少最后一行

我的 bash shell 脚本有一个奇怪的问题我希望能对此有所了解我的团队正在开发一个脚本该脚本会迭代文件中的行并检查每一行中的内容我们遇到了一个错误当通过将不同脚本排序在一起的自动化流程运行时看不到最后一行用于迭代文件中的
为什么codeigniter2不以更安全的方式存储csrf_hash，例如会话？

为什么生成的 CSRF 保护令牌没有像建议的那样通过 SESSION 保存和使用here http codeutopia net blog 2008 10 16 how to csrf protect all your forms 目前在C
Oracle 内联视图

为什么使用内联视图使用内联视图有许多不同的原因有些事情没有内联视图就无法完成例如 1 对解析函数的结果进行过滤 select ename from select ename rank over order by sal desc rn
检查我的 SSRS 报告，代码中是否为空

我正在加载我使用 SSRS 通过代码 C 完成的报告但我需要检查报告是否为空我怎样才能得到它我使用的代码是 if string IsNullOrEmpty RptInstance FileName string ReportName
Javascript 将 URL 转换为 BASE64 图像

我正在构建一个 Ionic2 应用程序我正在尝试将图像 url 转换为 base64 图像我已经发现this https stackoverflow com questions 22172604 convert image url to
iTextSharp 可以将 PDF 文档转换为 PDF/A

我无法在常见问题解答中找到此功能是否存在于 API 中尽管在一本书中提到它是可能可用的有人有实施此功能的经验吗 On 这个线程 http old nabble com Added support for PDF A 1 td109714
在 SQL Server 中的韩语单词（任何 Unicode 单词）中查找韩语字母表（任何 Unicode 字符）的索引

我需要按姓名搜索人员这里的人名可以是英文韩文或中文为此我使用了Like搜索条件Name如下 select from MyTable where Name like N t 上述声明是给所有包含字母的用户t 但这不适用于韩语或中文就像
chrome扩展后台页面中的jQuery使用

Goal 我正在尝试使用此样板代码使用在线词典 API 进行查找以查找所选单词并返回定义 Problem 我已经单独测试了实际的 jQuery ajax 调用效果很好另外我可以在页面上获取所选的单词然而由于某种原因我实际上遇到
从无符号除法结果分配时有关符号转换的警告

我编译了以下代码 Wsign conversion int main unsigned int a 8 int b a 8u warning implicit conversion changes signedness unsigned i
如何防止“CoreData无法完成故障”？

我们偶尔会收到 CoreData 无法完成故障的信息我们已阅读 Apple 文档但不清楚允许保留哪些内容我们非常小心地为每个线程创建一个上下文等但是我们的应用程序正在做的一件事是我们在 UIViewController 上保留
PHP 空 $_POST

我通过 HTTP POST 向 PHP 发送数据这对于短于 8MB 8192KB 的数据来说效果很好但是当发送的数据量更大时 PHP 会显示 POST变量为空我强调的是 POST变量甚至不包含帖子字段的名称它作为空数组存在临界点似
Python RuntimeError：字典在迭代期间更改了大小[重复]

这个问题在这里已经有答案了我正在练习一个非常简单的Python代码我试图找到它的解决方案但找不到 def del contacts for name number in d1 items if del name name del d1
查找两个数组中的重复值，Python

我有两个数组 A 和 B 每个数组约有 50 000 个值每个值代表一个 ID 我想创建一个包含三列的 pandas 数据框 col1 数组 A 中的值 col2 数组 B 中的值 col3 带有标签唯一或重复的字符串在每个数组

查找两个数组中的重复值，Python

查找两个数组中的重复值，Python 的相关文章

随机推荐

热门标签