pandas之Series（）菜鸟教程

2023-11-14

'''
Pandas数据结构Series：基本概念及创建
"一维数组"Serise
'''
import numpy as np
import pandas as pd
import  time
# Series 数据结构
# Series 是带有标签的一维数组，可以保存任何数据类型（整数，字符串，浮点数，Python对象等）,轴标签统称为索引
# 导入numpy、pandas模块
s=pd.Series(np.random.rand(5))
#查看数据，数据类型
print(s)
print(type(s))
# .index查看series索引，类型为rangeindex
# .values查看series值，类型是ndarray
print(s.index,type(s.index))
print(s.values,type(s.values))
# 核心：series相比于ndarray，是一个自带索引index的数组 → 一维数组 + 对应索引
# 所以当只看series的值的时候，就是一个ndarray
# series和ndarray较相似，索引切片功能差别不大
# series和dict相比，series更像一个有顺序的字典（dict本身不存在顺序），其索引原理与字典相似（一个用key，一个用index）
print("========创建series三中方法=========")
#由字典创建，字典的key就是index，values就是values
dic={"a":"1","b":"2","c":"3","d":"4"}
s=pd.Series(dic)
print(s)
# 注意：key肯定是字符串，假如values类型不止一个会怎么样？ → dic = {'a':1 ,'b':'hello' , 'c':3, '4':4, '5':5}
# Series 创建方法二：由数组创建(一维数组)
arr=np.random.rand(5)
s=pd.Series(arr)
print(s)
# 默认index是从0开始，步长为1的数字
s=pd.Series(arr,index=['a','b','c','d','e'])
print(s)
# Series 创建方法三：由标量创建
s=pd.Series(10,index=range(4))
print(s)
# 如果data是标量值，则必须提供索引。该值会重复，来匹配索引的长度
# Series 名称属性：name
s1=pd.Series(np.random.randn(5))
print(s1)
print("====================")
s2=pd.Series(np.random.randn(5),name="test")
print(s2)
print(s1.name,s2.name,type(s2.name))
print("====================")
#name为Series的一个参数，创建一个数组的 名称
# .name方法：输出数组的名称，输出格式为str，如果没用定义输出名称，输出为None
s3=s2.rename("hehehe")
print(s3)
print(s3.name,s2.name)
# .rename()重命名一个数组的名称，并且新指向一个数组，原数组不变
#rand()和randn()的区别
#rand():随机样本位于[0, 1)中
#randn():标准正态分布中返回一个或多个样本值。

'''
Pandas数据结构Series：索引
位置下标 / 标签索引 / 切片索引 / 布尔型索引
'''
print("=======Pandas数据结构Series：索引=======")
s=pd.Series(np.random.rand(5))
print(s)
print(s[0],type(s[0]),s[0].dtype)
print(float(s[0]),type(float(s[0])))
# print(s[-1])
# 位置下标从0开始
# 输出结果为numpy.float格式，
# 可以通过float()函数转换为python float格式
# numpy.float与float占用字节不同
# s[-1]结果如何？
print("======索引切片========")
s1=pd.Series(np.random.rand(5))
print(s1)
s2=pd.Series(np.random.rand(5))
print(s2)
print(s1[1:4],s1[4])
# 注意：用index做切片是末端包含
print(s2[0:3],s2[3])
print("===================")
print(s2[:-1])
print(s2[::2])
# 下标索引做切片，和list写法一样

print("=========布尔型索引======")
s=pd.Series(np.random.rand(3)*100)
s[4]=None  #添加一个空值
print(s)
bs1=s>50
bs2=s.isnull()
bs3=s.notnull()
print(bs1,type(bs1),bs1.dtype)
print(bs2,type(bs2),bs2.dtype)
print(bs3,type(bs3),bs3.dtype)
# 数组做判断之后，返回的是一个由布尔值组成的新的数组
# .isnull() / .notnull() 判断是否为空值 (None代表空值，NaN代表有问题的数值，两个都会识别为空值)
print(s[s>50])
print(s[bs3])
# 布尔型索引方法：用[判断条件]表示，其中判断条件可以是 一个语句，或者是 一个布尔型数组！
print("============= Pandas数据结构Series：基本技巧====================")
'''
Pandas数据结构Series：基本技巧
数据查看 / 重新索引 / 对齐 / 添加、修改、删除值
'''
#查看数组
s=pd.Series(np.random.rand(50))
# .head()查看头部数据
# .tail()查看尾部数据
# 默认查看5条
print(s.tail(10))
print(s.head())
print("============# 重新索引reindex==============")
# .reindex将会根据索引重新排序，如果当前索引不存在，则引入缺失值
s=pd.Series(np.random.rand(3),index=['a','b','c'])
print(s)
# .reindex()中也是写列表
# 这里'd'索引不存在，所以值为NaN
s1=s.reindex(['a','b','c','d'])
print(s1)
# fill_value参数：填充缺失值的值
s2=s.reindex(['a','b','c','d'],fill_value=0)
print(s2)
print("========Series对齐==========")
s1=pd.Series(np.random.rand(3),index=['Jack','Marry', 'Tom'])
s2=pd.Series(np.random.rand(3),index=['Jack','Marry', 'Tom'])
print(s1)
print(s2)
print(s1+s2)
# Series 和 ndarray 之间的主要区别是，Series 上的操作会根据标签自动对齐
# index顺序不会影响数值计算，以标签来计算
# 空值和任何值计算结果扔为空值

print("=======#删除：drop==========")
s=pd.Series(np.random.rand(5),index=list('ngjur'))
print(s)
s1=s.drop('n')
s2=s.drop(['g','j'])
print(s1)
print(s2)
print(s)
# drop 删除元素之后返回副本(inplace=False)
print("========添加=======")
s1=pd.Series(np.random.rand(5))
s2=pd.Series(np.random.rand(5),index=list("ngjur"))
print(s1)
print(s2)
s1[5]=100
s2['a']=100
print(s1)
print(s2)
print("================")

# 直接通过下标索引/标签index添加值
s3=s1.append(s2)
print(s3)
# 通过.append方法，直接添加一个数组
# .append方法生成一个新的数组，不改变之前的数组
print("=======修改======")
s=pd.Series(np.random.rand(3),index=['a','b','c'])
print(s)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python系列

python

pandas之Series（）菜鸟教程的相关文章

Python：在列表理解本身中引用列表理解？

这个想法刚刚出现在我的脑海中假设您出于某种原因想要通过 Python 中的列表理解来获取列表的唯一元素 i if i in created comprehension else 0 for i in 1 2 1 2 3 1 2 0 0 3
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
从字符串中删除识别的日期

作为输入我有几个包含不同格式日期的字符串例如彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期在下一步中我想从字符串中删除
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何从网页中嵌入的 Tableau 图表中抓取工具提示值

我试图弄清楚是否有一种方法以及如何使用 python 从网页中的 Tableau 嵌入图形中抓取工具提示值以下是当用户将鼠标悬停在条形上时带有工具提示的图表示例我从要从中抓取的原始网页中获取了此网址 https covid19 colo
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
Python 函数可以从作用域之外赋予新属性吗？

我不知道你可以这样做 def tom print tom s locals locals def dick z print z name z name z guest Harry print z guest z guest print di
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di
Python 类继承 - 诡异的动作

我观察到类继承有一个奇怪的效果对于我正在处理的项目我正在创建一个类来充当另一个模块的类的包装器我正在使用第 3 方 aeidon 模块用于操作字幕文件但问题可能不太具体以下是您通常如何使用该模块 project aeidon P
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

机器学习之网格搜索技术，如何在Auto-sklearn中应用网格搜索技术

文章目录一机器学习中的网格搜索技术是怎么回事二通俗解释三在一般情况下使用网格搜索技术四 GridSearchCV网格搜索技术的原理五如何在Auto sklearn中使用网格搜索技术 1 Auto sklearn实际用应用中
python3 爬取今日头条文章（巧妙避开as,cp,_signature）

使用环境 python3 scrapy win10 爬取思路一关于as cp的生成与 signature的想法对于今日头条的爬虫网上搜索出来的文章大多是基于崔庆才通过搜索爬取美女街拍的方案怎么说呢类似这样的虽说是个巧办法但是
RPC研究

深入浅出RPC 深入篇 mindwind 2014 09 22 出处 http mindwind me blog 2014 09 22 深入浅出RPC 深入篇 html 解析 RPC 的本质深入篇我们主要围绕 RPC 的功能目标和实现考
golang内存分析工具

pprof https blog csdn net weixin 40486544 article details 108402577 utm medium distribute pc relevant none task blog 2de
Unity粒子系统详解

接下来的图片就是Unity2017 1 0f3 编辑器中的粒子系统模块了解粒子系统必须先了解每一个属性都代表了什么之后才能根据这些原理来调整出自己满意的效果主面板ParticleSystem Duration 粒子发射周期如图的意
互联网公司数据产品经理和数据分析师，主要有什么区别？

数据产品经理和数据分析师是目前互联网公司的热门职位它跟数据分析师的职责有重叠的部分不同的地方是这个职位关注的点是数据分析的产品化这是普通互联网公司数据产品经理的日常那数据产品经理跟互联网公司里的产品经理有什么区别呢在大的互联网公
mysql+'@'%_mysql忘记登录的人：命令拒绝用户”@’％’

跑步秀表示我以具有数据库所有权限的用户身份登录跑步表状态导致错误并且错误不显示我已登录的用户名就好像对于这个命令 mysql忘记了我是谁其他select语句工作正常有人可以解释一下吗怎么修谢谢 Welcome to the M
HUAWEI+Eudemon1000E+防火墙+典型配置案例

当使用consol口登入Eudemon1000E 防火墙时如果登入失败退出可能会被锁定提示 User interface con0 is locked 锁定的时间默认是10分钟可以通过对con0 配置修改锁定值设置串口console
解决java.lang.RuntimeException: Can't toast on a thread that has not called Looper.prepare()

最近在整理Android开发过程中的一些错误话不多说直接上错误错误原因是自己想在网络请求成功后弹出一个Toast提醒但由于程序在主线程中创建handler后会创建一个looper对象而子线程却不会那什么时候需要looper L
飞桨AI课程干货--带你开启新世界的大门！

笔者近期体验了免费的百度深度学习7日打卡第六期 Python小白逆袭大神训练营课程每天都有对应的直播由中科院团队负责教学每天有对应的作业贯穿其中带你全程体验百度AI开放平台 AI Studio 飞桨PaddlePaddle Ea
SQL视图View的总结和使用

实际工作当中数据交互查询返回结果 SQL你是没办法找其他的完美替代的但有的时候还是会遇到一些很头痛的问题需要视图view来解决比如以下场景 view日常使用场景场景一有的时候多个表并表条件查询尤其是好几张表那种一起查询的那种
JS 使用正则

在JS中如何使用正则来校验字符串 1 使用RegExpObject test string 匹配则为true否则为false 声明一个正则对象 var a 0 9 需要注意的是 a不是字符串而是一个对象我们可以打印下a的构造函数没错
ESP32-WROVER-E无法正常写入固件

在之前用模块下载程序都是好的然后突然就出现了无法下载的现象打印了他的输出都是 rst 0x10 RTCWDT RTC RESET boot 0x13 SPI FAST FLASH BOOT invalid header 0xffffff
【2023】华为OD机试真题Java-题目0219-查找充电设备组合

非常典型的动态规划问题 package com company test import java util Arrays public class Main1 public static void main String args int
Matlab使用LSTM网络做classification和regression时XTrain的若干种数据结构-part I

目前看来 Deep learning的两大用途是classification和regression 以LSTM为例它的优势在于对时序数据 sequence data 强大的处理能力简单来说可以用作 1 sequence to labe
浅谈C++

重载原因 C 中的运算符重载是一种特性允许程序员定义自定义类类型的运算符操作通过运算符重载可以对类对象执行类似于内置类型的操作例如加法减法乘法等运算符重载通过定义特定的成员函数或非成员函数来实现成员函数的运算符重载为类的成员
【通过粒子滤波进行地形辅助导航】用于地形辅助导航的粒子滤波器和 PCRB研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现 1 概述粒子滤波 Particle Filter
linux搭建 sftp服务 && sftp自动上传脚本

1 新建sftp用户组 sftp 用户家目录 groupadd sftp mkdir p sftpdata sftp 2 新建sftp用户 useradd d sftpdata sftp tester m g sftp s sbin nol
安装 Hana Studio

1 从sap 官网下载下来的安装包是 sar 类型的压缩包 2 需要用专门的解压工具 SAPCAR 3 运行sapcar 工具和安装包放到英文路径下 win r 输入cmd 输入CD SAPCAR保存路径我的保存在出现这种没有打开相应
pandas之Series（）菜鸟教程

Pandas数据结构Series 基本概念及创建一维数组 Serise import numpy as np import pandas as pd import time Series 数据结构 Series 是带有标签的一维数组可以

pandas之Series（）菜鸟教程

pandas之Series（）菜鸟教程 的相关文章

随机推荐

热门标签

pandas之Series（）菜鸟教程的相关文章