Python3,一篇搞定Numpy与Pandas的差异点及应用场景,妥妥的学到了。

2023-10-30

1、引言

小屌丝: 鱼哥,你说 Numpy 和Pandas都是应用于数据处理和分析,那这ta俩有啥区别呢?
小鱼:这… 名字不一样啊。
在这里插入图片描述

小屌丝:鱼哥,正经点。
小鱼:好吧, 那我就给你说几句。 本质上的区别。
小屌丝:别只说几句啊, 难得的机会,你多说几句,反正都是 Z公子买单。
小鱼:… 好吧,那就看在Z公子买单的份上,我就多说几句。

2、Numpy与Pandas比较

说到Numpy 和Pandas,在数据处理和分析界,无人不知无人不晓。
但是,嘿嘿, 为什么我还要叨唠呢?
因为今天,我们要聊一聊 Numpy和Pandas的另一面。
在这里插入图片描述

2.1 相同点

首先,Numpy 和Pandas的相同点,我们都知道,即:

  • Numpy和Pandas都是Python的第三方库,用于数据处理和分析。
  • 它们都提供了高效的数据结构和函数,可以处理大规模数据。
  • Numpy和Pandas都支持向量化操作,可以对整个数组或数据框进行快速计算。
  • 它们都具有广泛的功能和方法,可以进行数据的读取、转换、筛选、聚合等操作。

2.2 差异点

其次, Numpy 和Pandas的差异点,如:

  • 应用不同

    • Numpy主要用于数值计算和科学计算,提供了多维数组对象(ndarray)和相关的数学函数;
    • 而Pandas则更适用于数据处理和分析,提供了数据框(DataFrame)和序列(Series)等数据结构;
  • 数据结构不同

    • Numpy的数据结构是多维数组,适用于处理数值型数据;
    • 而Pandas的数据结构更灵活,可以处理不同类型的数据,包括数值型、字符串型、时间序列等;
  • 操作不同

    • Numpy的操作更底层,更适合进行数值计算和数组操作;
    • 而Pandas提供了更高级的数据操作和分析功能,例如数据的合并、重塑、分组、透视等;
  • 性能不同

    • Numpy的性能更高,适用于处理大规模的数值计算;
    • 而Pandas的性能相对较低,但更适合处理结构化的数据和进行数据分析。

2.3 应用场景

2.3.1 Numpy应用场景

Numpy应用场景如下:

  • 数值计算:numpy 提供了高效的数组运算方法,可以处理包含大量数字的数据集,比如矩阵运算、向量运算、数组加减乘除等等。

  • 科学计算:numpy 提供了大量的方法和函数,用于处理科学计算相关的数据,比如数据可视化、积分、微分、信号处理等等。

  • 机器学习:numpy 提供了大量的方法和函数,用于处理机器学习相关的数据,比如神经网络模型训练、自编码器、条件随机场等等。

  • 图像处理:numpy 提供了大量的方法和函数,用于处理图像相关的数据,比如图像滤波、图像变换、图像分割等等。

  • 科学数据分析:numpy 提供了大量的方法和函数,用于处理科学数据相关的数据,比如天文学、物理学、地球科学等等。

2.3.2 Pandas 应用场景

pandas 的应用场景如下:

  • 数据分析:pandas 提供了大量的方法和函数,用于处理数据的不同方面,比如数据读取、数据过滤、数据分组、数据排序、数据汇总、数据分析等等。

  • 金融分析:pandas 提供了大量的方法和函数,用于处理金融数据相关的数据,比如股票数据分析、债券数据分析、期货数据分析等等。

  • 商业智能:pandas 提供了大量的方法和函数,用于处理商业数据相关的数据,比如销售数据分析、客户数据分析、市场数据分析等等。

  • 数据可视化:pandas 提供了大量的方法和函数,用于处理数据可视化相关的数据,比如图表绘制、数据地图生成等等。

  • 人工智能:pandas 提供了大量的方法和函数,用于处理人工智能相关的数据,比如自然语言处理、图像识别、语音识别等等。

2.4 代码示例

接下来,我就以两段代码,来看下Pandas和Numpy的差异。

2.4.1 Numpy

代码示例


import numpy as np

# 创建一个一维数组
arr = np.array([1, 2, 3, 4, 5])

# 对数组进行加法操作
result = arr + 1

print(result)  # 输出:[2 3 4 5 6]

2.4.2 Pandas

代码示例

import pandas as pd

# 创建一个数据框
data = {'Name': ['Tom', 'John', 'Mike'],
        'Age': [25, 30, 35],
        'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)

# 筛选年龄大于30的数据
result = df[df['Age'] > 30]

print(result)

3、总结

看到这里,今天的分享就结束了。
今天主要对Numpy 和Pandas的差异点及应用场景进行了一些分享。
在上一篇,小鱼也说过, 学好Pandas,走到"哪里"都不怕。

如果您想学习数据分析,可以直接跳转到小鱼的数据分析专栏

这里有:

我是小鱼

  • CSDN 博客专家
  • 阿里云 专家博主
  • 51CTO博客专家
  • 51认证讲师等
  • 认证金牌面试官
  • 职场面试及培训规划师
  • 多个国内主流技术社区的认证专家博主
  • 多款主流产品(阿里云等)测评一、二等奖获得者

关注我,带你学习更多更专业更前言的Python技术。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python3,一篇搞定Numpy与Pandas的差异点及应用场景,妥妥的学到了。 的相关文章

  • 我应该使用 Python 双端队列还是列表作为堆栈? [复制]

    这个问题在这里已经有答案了 我想要一个可以用作堆栈的 Python 对象 使用双端队列还是列表更好 元素数量较少还是数量较多有什么区别 您的情况可能会根据您的应用程序和具体用例而有所不同 但在一般情况下 列表非常适合堆栈 append is
  • 打印数字时添加千位分隔符[重复]

    这个问题在这里已经有答案了 我真的不知道这个问题的 名称 所以它可能是一个不正确的标题 但问题很简单 如果我有一个数字 例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
  • GUI(输入和输出矩阵)?

    我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据 完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
  • 如何将特定范围内的标量添加到 numpy 数组?

    有没有一种更简单 更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始 但它涉及获取给定数
  • 从 Powershell 脚本安装 Python

    当以管理员身份从 PowerShell 命令行运行以下命令时 可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
  • 使用 python/numpy 重塑数组

    我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
  • 无法导入 langchain.agents.load_tools

    我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
  • 通过Python连接到Bigquery:ProjectId和DatasetId必须非空

    我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
  • Django 视图中的“请求”是什么

    在 Django 第一个应用程序的 Django 教程中 我们有 from django http import HttpResponse def index request return HttpResponse Hello world
  • Pandas 组合不同索引的数据帧

    我有两个数据框df 1 and df 2具有不同的索引和列 但是 有一些索引和列重叠 我创建了一个数据框df索引和列的并集 因此不存在重复的索引或列 我想填写数据框df通过以下方式 for x in df index for y in df
  • 找到一个数字所属的一组范围

    我有一个 200k 行的数字范围列表 例如开始位置 停止位置 该列表包括除了非重叠的重叠之外的所有类型的重叠 列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围 并对 100k 个数字重复该
  • Protobuf 如何编码 oneof 消息结构

    对于这个 python 程序 在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
  • 为什么 csv.DictReader 给我一个无属性错误?

    我的 CSV 文件是 200 Service 我放入解释器的代码是 snav csv DictReader open screennavigation csv delimiter print snav fieldnames 200 for
  • Python:Goslate 翻译请求返回“503:服务不可用”[关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我们不允许提出寻求书籍 工具 软件库等推荐的问题 您可以编辑问题 以便用事实和引文来回答 这个问题似乎不是关于主要由程序员使用的特定编程问
  • 每当使用 import cv2 时 OpenCV 都会出错

    我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了 但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时 在 python IDLE 上它都会说 Trac
  • Firebase Firestore:获取文档的生成 ID (Python)

    我可以创建一个新文档 带有自动生成的 ID 并存储对其的引用 如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
  • 如何使用 Boto3 启动具有 IAM 角色的 EC2 实例?

    我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例 以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2
  • 如何将 Django 中的权限添加到模型并使用 shell 进行测试

    我在模型中添加了 Meta 类并同步了数据库 然后在 shell 中创建了一个对象 它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
  • 在virtualenv中下载sqlite3

    我正在尝试使用命令创建应用程序python3 manage py startapp webapp但我收到一条错误消息 django core exceptions ImproperlyConfigured 加载时出错 pysqlite2 或
  • JSON:TypeError:Decimal('34.3')不是JSON可序列化的[重复]

    这个问题在这里已经有答案了 我正在运行一个 SQL 查询 它返回一个小数列表 当我尝试将其转换为 JSON 时 出现类型错误 查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS

随机推荐

  • 剑指Offer—— 链表的公共点

    题目表述 输入两个链表 找出它们的第一个公共结点 首先要明白一点 两条链表相交 则他们的形状类似Y 而不是X 所以 从相交的点以后 两条链表的所有结点都是一样的 我们只要找出第一个相同的结点即可 1 我们分别算出两条链表的长度 2 算出两条
  • 用AI配置一台高性能电脑

    首先 并没有什么性价比很高的台式机 这个前提肯定是要有参考物的 比如你要用这个电脑主要是干嘛的 办公的 打游戏的 其次是预算了 我是打游戏的 你给我配一台办公的 办公的肯定性价比高 便宜 但并不符合我实际的需求 例 游戏电脑配置清单 i5
  • Makefile中的匹配符%

    一 匹配符 Make命令允许对文件名 进行类似正则运算的匹配 主要用到的匹配符是 比如 假定当前目录下有 f1 c 和 f2 c 两个源码文件 需要将它们编译为对应的对象文件 o c 等同于下面的写法 f1 o f1 c f2 o f2 c
  • 浏览器查找js绑定或者监听的事件

    1 打开浏览器审核模式 2 选择源代码 3 最右边有个事件监听断点 4 以触摸模式为例 如果代码中有监听触屏事件 移动的时候就会触发相关js代码 并找到位置
  • Linux线程介绍(Linux 系统编程)

    进程与线程 典型的UNIX Linux进程可以看成只有一个控制线程 一个进程在同一时刻只做一件事情 有了多个控制线程后 在程序设计时可以把进程设计成在同一时刻做不止一件事 每个线程各自处理独立的任务 进程是程序执行时的一个实例 是担当分配系
  • 性能测试必备监控技能windows篇

    前言 在手头没有专门的第三方监控时 该怎么监控服务指标呢 本篇就windows下监控进行分享 也是我们在进行性能测试时 必须掌握的 下面我们就windows下常用的三种监视工具进行说明 任务管理器 资源监视器 性能监视器 在 开始 gt 开
  • 分页、关联查询优化

    文章目录 一 分页查询示例 1 分页查询优化 1 1 根据自增且连续的主键排序的分页查询 1 2 根据非主键字段排序的分页查询 二 Join关联查询优化 1 Join关联查询示例表 2 常见表关联算法 2 1 嵌套循环连接 Nested L
  • 跟据经纬度实现附近搜索

    现在很多手机软件都用附近搜索功能 但具体是怎么实现的呢 在网上查了很多资料 mysql空间数据库 矩形算法 geohash我都用过了 当数据上了百万之后mysql空间数据库方法是最强最精确的 查询前100条数据只需5秒左右 接下来推出一个原
  • IIS设置连接超时

    连接超时有助于减少由空闲连接消耗的处理资源损失 启用连接超时时 IIS 会在连接级别执行以下类型的连接超时 客户端已向服务器发送了数据 现处于空闲状态造成的连接超时 已建立了与服务器的连接 但客户端未发送数据时造成的服务器侦听超时 响应超时
  • 使用 Jenkins 实现Android自动化打包和踩坑经历

    每当有项目做的过程中 测试需要做单元测试 每次手动的切换生产和测试环境 切换各种推送 统计和第三方账号相当的麻烦 同时还需要暂存代码 切换分支深的太过繁琐 此时如果将项目配置自动化打包了 那么就可以将这些问题解决了 我们来看一下Jenkin
  • Web渗透测试实战——(1)Web渗透测试简介

    Web渗透测试实战 1 Web渗透测试简介 一 什么是渗透测试 二 渗透测试类型 三 渗透测试阶段 1 信息收集与侦查 2 枚举 3 漏洞评估与分析 4 漏洞利用 5 报告 四 常用的测试方法学 五 推荐的测试平台 一 什么是渗透测试 渗透
  • ubuntu vnc 内网穿透远程连接

    实现ubuntu 系统桌面级别的远程连接 需要在ubuntu 系统中安装vnc 既然是桌面 前提是需要ubuntu 带有图形化界面 如果没有 可以执行以下命令安装图形化界面 sudo apt install ubuntu desktop s
  • 快速熟悉Vue项目

    一 快速梳理大型vue项目整体架构技巧方法总结 首先对于Vue Cli搭建的项目 一定要知道项目的目录结构 如果目录结构都不了解 那一定会很头痛 查看 package json 配置文件 了解项目引用了哪些额外插件和框架 查看 router
  • Keras框架下的猫狗识别(二)

    Tensorflow学习 使用jupyter notebook Keras框架下的猫狗识别 一 模型构建与训练 Tensorflow学习 使用jupyter notebook 前言 一 数据预处理 二 使用步骤 1 引入库 2 定义模型 3
  • 检错纠错码(奇偶校验码 CRC循环冗余校验码 海明码)

    检错与纠错码在计算机中经常被使用 在此对常用的三种检错纠错码做一个介绍 分别是奇偶校验码 CRC循环冗余校验码和海明码 奇偶校验码 通常所说的奇偶校验码指的是一维奇偶校验码 它只能检错 不能纠错 只有二维奇偶校验码具备纠错能力 校验方法 分
  • 面试题:什么是跨域?出现的原因?如何解决跨域问题?

    跨域 浏览器不能执行其他网页的脚步 由浏览器的同源策略造成的 是浏览器对javascript实施的安全限制 无法跨域是浏览器对用户安全的考虑 如果自己写个没有同源策略的浏览器 完全不用考虑跨域问题 同源策略限制 Cookie localSt
  • 文件操作与IO

    目录 一 什么是文件 二 文件的分类 三 Java中的文件操作 四 文件操作案例 一 什么是文件 平时我们锁说到的文件一般指的都是存储在硬盘上的普通文件 形如txt png jpg 等等这些都是普通文件 都存储在硬盘上 而在计算机中 文件可
  • Apifox 生成接口文档 教程与操作步骤

    接口文档自动生成 本文主要介绍使用 apifox 如何生成接口文档 附上详细的使用教程和操作步骤 使用Apifox 的可以自动生成接口文档 本文会给大家介绍下如何使用Apifox 来自动生成所需的接口文档 Apifox 是一款接口设计 调试
  • C# 在VS里开发Android应用 Xamarin(一)(刚开始接触的菜鸡,有没说好的地方请指出,学习中!!)

    去年寒假把之前做的大大小小所有C 程序项目都重新看了一遍 发现都是些管理系统啥的 想想也没啥桌面程序可做了 有好点子的可以跟我说说 就想去找找还有啥可做的 于是就百度了一番 发现可以写Android的应用 欣喜若狂 赶紧看看若何进行下一步
  • Python3,一篇搞定Numpy与Pandas的差异点及应用场景,妥妥的学到了。

    Numpy 与Pandas的差异比较 1 引言 2 Numpy与Pandas比较 2 1 相同点 2 2 差异点 2 3 应用场景 2 3 1 Numpy应用场景 2 3 2 Pandas 应用场景 2 4 代码示例 2 4 1 Numpy