Numpy

2023-11-05

文章目录

1.Numpy是什么？
2.ndarray
3.Numpy基本操作
4.ndarray运算
5 矩阵的运算
- - 5.1 矩阵乘法

1.Numpy是什么？

NumPy（Numerical Python）是一个强大的Python数值计算库。它提供对大型多维数组和矩阵的支持，并提供了许多高效操作这些数组的数学函数。 NumPy是Python科学计算的基础库，在诸如机器学习、数据科学、工程学和研究等领域得到广泛应用。
在这里插入图片描述
要使用NumPy，首先需要安装它。可以使用pip安装它：

pip install numpy

Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务，使用Numpy比直接使用Python要简洁的多。

2.ndarray

2.1 什么是ndarray?

NumPy提供了一个N维数组类型ndarray，它描述了相同类型的“items”的集合。
ndarray（N维数组）是NumPy库中最重要的数据结构之一。它是一个多维、同类型数据的容器，可以存储在内存中的连续块，提供了许多功能和操作来高效地处理大规模数值数据。
机器学习的最大特点就是大量的数据运算，那么如果没有一个快速的解决方案，那可能现在python也在机器学习领域达不到好的效果。
Numpy专门针对ndarray的操作和运算进行了设计，所以数组的存储效率和输入输出性能远优于Python中的嵌套列表，数组越大，Numpy的优势就越明显。
在这里插入图片描述
ndarray到底跟原生python列表有什么不同呢，请看一张图：

从图中我们可以看出ndarray在存储数据的时候，数据与数据的地址都是连续的，这样就给使得批量操作数组元素时速度更快。
这是因为ndarray中的所有元素的类型都是相同的，而Python列表中的元素类型是任意的，所以ndarray在存储元素时内存可以连续，而python
原生list就只能通过寻址方式找到下一个元素，这虽然也导致了在通用性能方面Numpy的ndarray不及Python原生list，但在科学计算中，Numpy
的ndarray就可以省掉很多循环语句，代码使用方面比Python原生list简单的多。此外ndarray支持并行化运算(向量化运算)。

使用numpy生成一个数组

import numpy as np

#使用numpy生成一个数组
a=np.array([1,2,3,4,5,6])
a

在这里插入图片描述

2.2 ndarray的属性

在这里插入图片描述

2.3 ndarray的类型

在这里插入图片描述

import numpy as np

# 创建不同形状的数组
# 二维数组
a=np.array([[1,2,3],[4,5,6]],dtype=int)
# 一维数组
b=np.array([1,2,3,4,5],dtype=int)
# 三维数组
c=np.array([[[1,2,3],[4,5,6]],[[2,7,8],[3,6,9]]],dtype=int)

# 打印数组的形状
a.shape
b.shape
c.shape

在这里插入图片描述

3.Numpy基本操作

3.1 生成0或1的数组

在这里插入图片描述

import numpy as np

#生成全是1的数组
np.ones([4,8])
ones

#生成全是0的数组
zeros=np.zeros([4,8])
zeros

在这里插入图片描述

3.2 从现有数组生成数组

在这里插入图片描述
当创建新的数组时，numpy.array() 默认会复制数据，以确保创建的数组与原始数据没有共享内存。这是所谓的“拷贝”操作。
numpy.asarray() 不会执行拷贝操作，而只是将该数组返回，这有助于节省内存和提高性能。

import numpy as np

a = np.array([[1,2,3],[4,5,6]])
# 从现有的数组当中创建
a1 = np.array(a)
# 相当于索引的形式，并没有真正的创建一个新的
a2 = np.asarray(a)

拓展：浅拷贝和深拷贝

**浅拷贝是创建一个新的数据结构，并复制原始数据结构中的元素。**如果原始数据结构是一个单层结构（没有嵌套的对象），那么浅拷贝将复制所有元素。但是，如果原始数据结构中有嵌套的对象（如列表中嵌套了另一个列表，或字典中嵌套了另一个字典），浅拷贝将不会递归复制嵌套对象，而是复制它们的引用。
深拷贝是创建一个新的数据结构，并递归复制原始数据结构中的所有元素，包括嵌套对象。 这意味着原始数据结构中的每个元素及其嵌套的元素都将在新数据结构中独立存在，不共享引用。

3.3 生成固定范围的数组

np.linspace (start, stop, num, endpoint)
创建等差数组 — 指定数量

参数:
start:序列的起始值
stop:序列的终止值
num:要生成的等间隔样例数量，默认为50
endpoint:序列中是否包含stop值，默认为ture

np.linspace(0,100,11)

在这里插入图片描述

np.arange(start,stop, step, dtype)
创建等差数组 — 指定步长

参数 step:步长,默认值为1

np.arange(40,50,1)

在这里插入图片描述
np.logspace(start,stop, num)
创建等比数列

参数:
num:要生成的等比数列数量，默认为50

logspace(1, 3, 5) 返回一个包含 5 个均匀分布在对数刻度上的数据点的数组。这些数据点分别是 10^1，101.5，10^2，102.5 和 10^3。

3.4 生成随机数组

3.4.1 正态分布

正态分布是一种概率分布。正态分布是具有两个参数μ和σ的连续型随机变量的分布，第一参数μ是服从正态分布的随机变量的均值，第二个参数σ是此随机变量的标准差，所以正态分布记作N(μ，σ )。在这里插入图片描述
μ决定了其位置，其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
正态分布的创建:

np.random.randn(d0, d1, …, dn)
功能：从标准正态分布中返回一个或多个样本值

np.random.normal(loc=0.0, scale=1.0, size=None) （常用）
loc：float 此概率分布的均值（对应着整个分布的中心centre）
scale：float 此概率分布的标准差（对应于分布的宽度，scale越大越矮胖，scale越小，越瘦高）
size：int or tuple of ints
输出的shape，默认为None，只输出一个值

np.random.standard_normal(size=None)
返回指定形状的标准正态分布的数组。

eg:生成均值为1.75，标准差为1的正态分布数据，100000000个

import numpy as np
import matplotlib.pyplot as plt

x1=np.random.normal(1.75,1,100000000)

# 创建画布
plt.figure(figsize=(20,10),dpi=100)

# 绘制直方图
plt.hist(x1,1000)

# 显示
plt.show()

在这里插入图片描述

3.4.2 均匀分布

均匀分布是概率论和统计学中的一种重要概率分布，也称为均匀随机变量分布。在均匀分布中，所有可能的结果在某个范围内是等可能发生的，没有任何一个结果比其他结果更有可能发生。

np.random.rand(d0, d1, …, dn) 返回[0.0，1.0)内的一组均匀分布的数。

np.random.uniform(low=0.0, high=1.0, size=None) (常用)
功能：从一个均匀分布[low,high)中随机采样，注意定义域是左闭右开，即包含low，不包含high. 参数介绍: low:
采样下界，float类型，默认值为0； high: 采样上界，float类型，默认值为1；
size:
输出样本数目，为int或元组(tuple)类型，例如，size=(m,n,k), 则输出mnk个样本，缺省时输出1个值。
返回值：ndarray类型，其形状和参数size中描述一致。

np.random.randint(low, high=None, size=None, dtype=‘l’)
从一个均匀分布中随机采样，生成一个整数或N维整数数组，
取数范围：若high不为None时，取[low,high)之间随机整数，否则取值[0,low)之间随机整数。

import numpy as np
import matplotlib.pyplot as plt

x1=np.random.uniform(-1,1,100000000)

# 创建画布
plt.figure(figsize=(20,10),dpi=100)

# 绘制直方图
plt.hist(x1,1000)

# 显示
plt.show()

在这里插入图片描述

3.5 形状修改

ndarray.reshape(shape, order)
返回一个具有相同数据域，但shape不一样的视图
行、列不进行互换

# 在转换形状的时候，一定要注意数组的元素匹配
stock_change.reshape([5, 4])
stock_change.reshape([-1,10]) # 数组的形状被修改为: (2, 10), -1: 表示通过待计算

ndarray.resize(new_shape)
修改数组本身的形状（需要保持元素个数前后相同）
行、列不进行互换

stock_change.resize([5, 4])
# 查看修改后结果
stock_change.shape
(5, 4)

ndarray.T
数组的转置
将数组的行、列进行互换

3.6 类型修改

ndarray.astype(type)
返回修改了类型之后的数组

3.7 数组的去重

np.unique()

import numpy as np

a=np.array([[1,2,3,4],[2,3,4,5],[5,6,7,7]])
b=np.unique(a)
b

在这里插入图片描述

3.8 数组的索引以及切片

直接进行索引,切片
对象[:, :] – 先行后列

import numpy as np

a=np.array([[1,2,3,4],[2,3,4,5],[5,6,7,7]])
a[0,0:2]

在这里插入图片描述

4.ndarray运算

4.1 逻辑运算

# 生成10名同学，5门功课的数据
>>> score = np.random.randint(40, 100, (10, 5))
# 取出最后4名同学的成绩，用于逻辑判断
>>> test_score = score[6:, 0:5]
# 逻辑判断, 如果成绩大于60就标记为True 否则为False
>>> test_score > 60
array([[ True, True, True, False, True],
[ True, True, True, False, True],
[ True, True, False, False, True],
[False, True, True, True, True]])
# BOOL赋值, 将满足条件的设置为指定的值-布尔索引
>>> test_score[test_score > 60] = 1
>>> test_score
array([[ 1, 1, 1, 52, 1],
[ 1, 1, 1, 59, 1],
[ 1, 1, 44, 44, 1],
[59, 1, 1, 1, 1]])

通用判断函数

np.all() 全部符合条件才为true

# 判断前两名同学的成绩[0:2, :]是否全及格
>>> np.all(score[0:2, :] > 60)
False

np.any() 有一个符合条件就为true

# 判断前两名同学的成绩[0:2, :]是否有大于90分的
>>> np.any(score[0:2, :] > 80)
True

np.where 三元运算符

# 判断前四名学生,前四门课程中，成绩中大于60的置为1，否则为0
temp = score[:4, :4]
np.where(temp > 60, 1, 0)

复合逻辑需要结合np.logical_and和np.logical_or使用

 # 判断前四名学生,前四门课程中，成绩中大于60且小于90的换为1，否则为0
np.where(np.logical_and(temp > 60, temp < 90), 1, 0)
# 判断前四名学生,前四门课程中，成绩中大于90或小于60的换为1，否则为0
np.where(np.logical_or(temp > 90, temp < 60), 1, 0)

4.2 统计运算

在这里插入图片描述
进行统计的时候，axis 轴的取值并不一定，Numpy中不同的API轴的值都不一样，在这里，axis 0代表列, axis 1代表行去进行统计

# 接下来对于前四名学生,进行一些统计运算
# 指定列 去统计
temp = score[:4, 0:5]
print("前四名学生,各科成绩的最大分：{}".format(np.max(temp, axis=0)))
print("前四名学生,各科成绩的最小分：{}".format(np.min(temp, axis=0)))
print("前四名学生,各科成绩波动情况：{}".format(np.std(temp, axis=0)))
print("前四名学生,各科成绩的平均分：{}".format(np.mean(temp, axis=0)))

np.argmax(temp, axis=)
np.argmin(temp, axis=)
找出最大和最小元素的坐标

4.3 数组间的运算

4.3.1 广播机制

数组在进行矢量化运算时，要求数组的形状是相等的。当形状不相等的数组执行算术运算的时候，就会出现广播机制，该机制会对数组进行扩
展，使数组的shape属性值一样，这样，就可以进行矢量化运算了。下面通过一个例子进行说明：

arr1 = np.array([[0],[1],[2],[3]])
arr1.shape
# (4, 1)
arr2 = np.array([1,2,3])
arr2.shape
# (3,)
arr1+arr2
# 结果是：
array([[1, 2, 3],
[2, 3, 4],
[3, 4, 5],
[4, 5, 6]])

上述代码中，数组arr1是4行1列，arr2是1行3列。这两个数组要进行相加，按照广播机制会对数组arr1和arr2都进行扩展，使得数组arr1和arr2
都变成4行3列。
在这里插入图片描述

5 矩阵的运算

5.1 矩阵乘法

np.matmul和np.dot的区别:
二者都是矩阵乘法。
np.matmul中禁止矩阵与标量的乘法。在矢量乘矢量的內积运算中，np.matmul与np.dot没有区别。

np.matmul

import numpy as np
a=np.array([[81,52],[50,51],[3,5]])
b=np.array([[40,41,22],[30,31,56]])
np.matmul(a,b)

np.dot

import numpy as np
a=np.array([[81,52],[50,51],[3,5]])
b=np.array([[40,41,22],[30,31,56]])
np.dot(a,b)

运行结果：
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Numpy 的相关文章

InterfaceError：连接已关闭（使用 django + celery + Scrapy）

当我在 Celery 任务中使用 Scrapy 解析函数有时可能需要 10 分钟时我得到了这个信息我用姜戈 1 6 5 django celery 3 1 16 芹菜 3 1 16 psycopg2 2 5 5 我也使用了psyc
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
Pycharm Python 控制台不打印输出

我有一个从 Pycharm python 控制台调用的函数但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面像
Flask 和 uWSGI - 无法加载应用程序 0 (mountpoint='')（找不到可调用或导入错误）

当我尝试使用 uWSGI 启动 Flask 时出现以下错误我是这样开始的 gt cd gt root localhost uwsgi socket 127 0 0 1 6000 file path to folder run py ca
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

前端Vue自定义得分构成水平柱形图组件可用于系统专业门类得分评估分析

引入Vue自定义得分构成水平柱形图组件 cc horBarChart 随着技术的发展传统的开发方式使得系统的复杂度越来越高一个小小的改动或小功能的增加可能会导致整体逻辑的修改造成牵一发而动全身的情况为了解决这个问题我们采用了组件化
官方推荐U盘安装Ubuntu 10.10 方法

通用USB Installer是一个Linux系统安装器允许你从你的USB闪存驱动器选择安装一个Linux发行版通用USB安装器使用非常方便只需选择一个 Linux发行版的ISO文件和你的U盘便能进行安装 Universal USB
java用模板生成word(docx)文档(含动态表格)

生成word思路用WPS或者office编辑好word的样式然后另存为word xml文档将xml翻译为FreeMarker模板最后用java来解析FreeMarker模板并输出Docx 编辑好需要使用的word文档 1 把需要注入
在Linux上面如何部署jar包？

1 首先打开工具Xshell或者FinalShell 并登录 2 使用 ll 命令查看根目录文件确定jar包将要放到哪个位置使用cd 命令进入文件如 cd opt yt 3 新建文件传输可和本地关联 4 将jar包直接拖过去就行 5
树的遍历（中序，前序，后序）

与只有一种逻辑遍历它们的线性数据结构数组链表队列堆栈等不同树可以以不同的方式遍历常见的有中序遍历前序遍历和后序遍历实现各种遍历的方法又包括以上图为例深度优先遍历 a 中序左根右 4 2 5 1 3 b 前序根
关于async & await（TAP）异步模型的异常捕获

在TAP之前若要捕获线程中Task的异常通常有两种办法 1 阻塞线程开始后在适当的时机调用 wait 或waitAll方法 2 非阻塞推荐在建立任务的时候写该task的continueWith方法在该方法中捕获异常对于T
get提交和post提交的区别

Http定义了与服务器交互的不同方法最基本的方法有4种分别是GET POST PUT DELETE URL全称是资源描述符我们可以这样认为一个URL地址它用于描述一个网络上的资源而HTTP中的GET POST PUT DELET
Linux安装以及使用

Linux虚拟机安装以及使用 1 安装VMware16 2 创建虚拟机 3 虚拟机配置网络 4 利用mobaxterm连接服务器 5 配置jdk和tomcat 6 配置docker和mysql 7 部署项目 1 安装VMware16 接下来
leetcode160–相交链表（最优解/双指针）

今天做的三道题比较简单给你两个单链表的头节点 headA 和 headB 请你找出并返回两个单链表相交的起始节点如果两个链表不存在相交节点返回 null 题目数据保证整个链式结构中不存在环注意函数返回结果后链表必须保持其原
ISA(MIPS,ARM,RISC-V)中的算术运算溢出检测逻辑是怎样的？

关于ISA架构之前写过一些总结这里单独将其中一个技术点拿出来对比分析不同架构下实现的差异这个技术点就是算术指令中的溢出检测 ARM体系结构中通过CPSR的状态寄存器反映当前指令的溢出状态而MIPS 则是通过指令触发中断的方式产生
Jenkins使用(代码拉取-＞编译构建-＞部署上线)

Jenkins简介 Jenkins是一个开源项目提供了一种易于使用的持续集成系统使开发者从繁杂的集成中解脱出来专注于更重要的业务逻辑实现上同时Jenkins能实时监控集成中存在的错误提供详细的日志文件和提醒功能还能用图表的形式形
Java——(1)定义一个学生类Student，包含属性：姓名(String name)、年龄(int age) (2)定义Map集合，用Student对象作为key

分析以下需求并用代码实现 1 定义一个学生类Student 包含属性姓名 String name 年龄 int age 2 定义Map集合用Student对象作为key 用字符串此表示表示学生的住址作为value 3 利用四种方式
db2异常

一 db2 SQL0180N The syntax of the string representation of a datetime value is incorrect SQLSTATE 2200 问题描述在用import导入时没有
qt入门级使用

qt的安装可参考 QT下载安装及配置教程亲测好用 qt基本使用 1 创建第一个qt程序打开后欢迎界面如下这是关于qt的一些项目的讲解不过视频地址在国外需要翻qiang才能看而且全是英文左边还有一个示例那里面有各种项目的模
Android开发之RecyclerView的使用全解

转自 http blog csdn net dmk877 article details 50816933 自Android 5 0之后谷歌公司推出了RecylerView控件 RecylerView 我想看到一个新名词后大部分人会首先发
微分动态规划

from https en wikipedia org wiki Differential dynamic programming 深入理解DDP DDP是一种轨迹优化类别问题中的最优控制算法这种算法在1966年被Mayne提出该算法使
PostgreSQL 性能优化

提出问题 PostgreSQL数据库如何进行简单的性能调优解决问题前言 PostgreSQL的配置参数作为性能调优的一部分起着重要的位置有时候一个简单的配置参数就会决定应用的性能因此有必要简单了解下其相关的配置参数查询Linux
Hadoop（三）读写流程

Remote Procedure Call RPC 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务而不需要了解底层网络技术的协议 RPC协议假定某些传输协议的存在如TCP或UDP 为通信程序之间携带信息数据在OSI网络通
数据库基础命令

SELECT 从数据库中提取数据 SELECT column name column name FROM table name SELECT DISTINCT column name column name FROM table name
Numpy

文章目录 1 Numpy是什么 2 ndarray 2 1 什么是ndarray 2 2 ndarray的属性 2 3 ndarray的类型 3 Numpy基本操作 3 1 生成0或1的数组 3 2 从现有数组生成数组拓展浅拷贝和深拷贝

Numpy

文章目录

1.Numpy是什么？

2.ndarray

2.1 什么是ndarray?

2.2 ndarray的属性

2.3 ndarray的类型

3.Numpy基本操作

3.1 生成0或1的数组

3.2 从现有数组生成数组

拓展：浅拷贝和深拷贝

3.3 生成固定范围的数组

3.4 生成随机数组

3.4.1 正态分布

3.4.2 均匀分布

3.5 形状修改

3.6 类型修改

3.7 数组的去重

3.8 数组的索引以及切片

4.ndarray运算

4.1 逻辑运算

通用判断函数

4.2 统计运算

4.3 数组间的运算

4.3.1 广播机制

5 矩阵的运算

5.1 矩阵乘法

Numpy 的相关文章

随机推荐

热门标签