数据操作之-dataframe常见操作：取行、列、切片、统计特征值

2023-11-19

import numpy as np
import pandas as pd
from pandas import  *
from numpy import *


data = DataFrame(np.arange(16).reshape(4,4),index = list("ABCD"),columns=list('wxyz'))
print data
print data[0:2]       #取前两行数据


print len(data )              #求出一共多少行
print data.columns.size      #求出一共多少列


print data.columns        #列索引名称
print data.index       #行索引名称


print data.ix[1]                #取第2行数据
print data.iloc[1]             #取第2行数据


print data['x']      #取列索引为x的一列数据
print data.loc['A']      #取第行索引为”A“的一行数据，


print data.loc[:,['x','z'] ]          #表示选取所有的行以及columns为a,b的列；注意和iloc的区别
print data.loc[['A','B'],['x','z']]     #表示选取'A'和'B'这两行以及columns为x,z的列的并集；


print data.iloc[1:3,1:3]              #数据切片操作，切连续的数据块
print data.iloc[[0,2],[1,2]]              #即可以自由选取行位置，和列位置对应的数据，切零散的数据块


print data[data>2]       #表示选取数据集中大于0的数据
print data[data.x>5]       #表示选取数据集中x这一列大于5的所有的行


a1=data.copy()
print a1[a1['y'].isin(['6','10'])]    #表显示满足条件：列y中的值包含'6','8'的所有行。

print data.mean()           #默认对每一列的数据求平均值；若加上参数a.mean(1)则对每一行求平均值；
print data['x'].value_counts()    #统计某一列x中各个值出现的次数：

print data.describe() #对每一列数据进行统计，包括计数，均值，std，各个分位数等。


data.to_excel(r'E:\',sheet_name='Sheet1')  #数据输出至Excel

结果图：data.describe()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

数据操作之-dataframe常见操作：取行、列、切片、统计特征值的相关文章

如何替换 Pandas Dataframe 中不在列表中的所有值？ [复制]

这个问题在这里已经有答案了我有一个值列表如何替换 Dataframe 列中不在给定值列表中的所有值例如 gt gt gt df pd DataFrame D ND D garbage columns S gt gt gt df S 0
计算另一个字符串中多个字符串的出现次数

在 Python 2 7 中给定以下字符串 Spot是一只棕色的狗斑点有棕色的头发斑点的头发是棕色的查找字符串中 Spot brown 和 hair 总数的最佳方法是什么在示例中它将返回 8 我正在寻找类似的东西string c
Gunicorn 工作人员无论如何都会超时

我正在尝试通过gunicorn运行一个简单的烧瓶应用程序但是无论我做什么我的工作人员都会超时无论是否有针对应用程序的活动工作人员在我设置任何内容后总是会超时timeout值到是什么导致它们超时当我发出请求时请求成功通过但工作
如何在 Matplotlib 饼图周围绘制箭头以将每个标签指向圆圈中各自的部分？

我一直在用 Matplotlib 绘制一些图表我有一个饼图想要在图表周围绘制箭头使每个标签都指向图表我有一个例子这是我当前的代码 import matplotlib pyplot as plt plt rcParams font
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
如何将 GAE 中一种 Kind 中的所有实体复制到另一种 Kind 中，而无需显式调用每个属性

我们如何使用function clone entity 如中所述在 Python 中复制 Google App Engine 数据存储中的实体而无需在编译时知道属性名称 https stackoverflow com question
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
Django REST Framework - CurrentUserDefault 使用

我正在尝试使用CurrentUserDefault一个序列化器的类 user serializers HiddenField default serializers CurrentUserDefault 文档说为了使用它请求必须作为
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
Firebase Firestore：获取文档的生成 ID (Python)

我可以创建一个新文档带有自动生成的 ID 并存储对其的引用如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的

随机推荐

你知道bdsm吗

是的我知道 BDSM BDSM 是一种性癖好通常指一组相关的性癖好包括较强的角色扮演较轻的或较重的身体触摸以及在性活动中的安全词 BDSM 也可以包括授权和自我控制以及建立信任和良好的沟通 BDSM 可能涉及各种形式的挑逗包
4. Spring Boot Security角色管理持久化实现

1 概述在第三章里大家学会了怎么初步使用Spring Boot 结合Spring Security来实现权限控制和角色管理但是我们发现无论是使用那种方式角色管理和权限控制全部是在 xml中或则配置类中写的没有实现持久化本次就为大家
Conversion to Dalvik format failed with error

Conversion to Dalvik format failed with error 1解决方法第一种情况包导入错误点击工程 gt build path gt libraries gt 选中android1 x 或者android
解决 Android App 上架 Google play后 ,签名变更,第三方sdk无法登录

1 将google 管理后台的 sha 1 证书值记录下来 2 根据Google sha 1 证书值获取 Facebook 的登录需要使用的散列值使用以下工具 http tomeko net online tools hex to b
MySQL——idea连接MySQL

选择MySQL 连接数据库选择数据库编写SQL语句
Anaconda 命令行常用指令

Anaconda 命令行指令 Anaconda Prompt 命令行一基础指令 1 查看Anaconda安装版本 conda version 2 查看已经安装的环境 conda env list 方法1 conda info env 方
网络基础知识

网络编程 2 网络的体系结构七层模型四层模型因为网络通信比较麻烦所以网络采用分层思想 OSI开放系统互联网模型七层模型高层应用层表示层会话层低层传输层网络层数据链路层物理层驱动网卡仅仅是一种理想状态现实中
文本情感分析竞赛（首次提交排名第6）

之前花了半个小时做了个DataCastle上的基础竞赛题然后提交结果后直接第六名因此来分享一下该文章之前记录在我的公众号上原文链接 https mp weixin qq com s nIJ2begF2 5i WnT1PEM3w 数据
变量的存储类型 auto register extern static

说明在C语言中变量和函数都有数据类型和存储类型两个属性数据类型规定了取值范围和运算存储类型规定了占用内存的方式变量的存储类型可分为静态存储和动态存储静态存储生命周期为程序的运行时间动态存储动态分配内存用完就放内存的区域
每日一问：你想如何破坏单例模式？

前言 1 单例是什么单例模式是一种创建型设计模式目的是保证全局一个类只有一个实例对象分为懒汉式和饿汉式所谓懒汉式类似于懒加载需要的时候才会触发初始化实例对象而饿汉式正好相反项目启动类加载的时候就会创建初始化单例对象 1
ThreadLocal的理解和使用

1 ThreadLocal初步早在JDK 1 2的版本中就提供java lang ThreadLocal ThreadLocal为解决多线程程序的并发问题提供了一种新的思路使用这个工具类可以很简洁地编写出优美的多线程程序 ThreadL
LightGBM算法详解(教你一文掌握LightGBM所有知识点)

LightGBM Light Gradient Boosting Machine 是一款基于决策树算法的分布式梯度提升框架为了满足工业界缩短模型计算时间的需求 LightGBM的设计思路主要是两点减小数据对内存的使用保证单个机器在不牺
Ubuntu 切换工作区快捷键失效

首先安装 Compiz Config Settings Manager sudo apt get install compizconfig settings manager 在桌面板块下勾选Desktop Wall 以启用点开Desk
信息安全管理（CISP）—— 部分重点内容总结

目录一风险评估方法定量分析计算原理公式例题二风险评估要素之间的关系三 GB Z 24364 2009信息安全风险管理指南四阶段两过程四能力成熟度模型SSE CMM 域维能力维五等级保护2 0的工作流程系统定
利用Intellij IDEA创建Spring的Helloworld

引言 Spring 作为一款轻量级的框架自然会赢得大多数开发者的信赖笔者今天也开始学习Spring框架了那么如何利用当今非常火的IDEA来开发Spring呢按照国际惯例先从Spring的HelloWorld开始吧准备环境 Int
validation query

public static void mySQLConfigPlugin Plugins me C3p0Plugin dbplugin createC3p0Plugin DruidPlugin dbplugin createDruidPlu
sql优化

SQL总结优化部分 1 应尽量避免在 where 子句中使用或 lt gt 操作符否则将引擎放弃使用索引而进行全表扫描 2 对查询进行优化应尽量避免全表扫描首先应考虑在 where 及 order by 涉及的列上建立索引 3 应
模糊数学Python（一）模糊运算

代码 import numpy as np def istype a 判断模糊矩阵a的类型 a np array a s np eye a shape 0 a shape 1 if a gt s all and a T a all retu
安装12.04lts的两个问题总结

因为在win7下有很多bug 老师叫我用Linux来完成项目的最后一步啊啊啊之前一直是在虚拟机里面搞安装Ubuntu的过程中遇到了好多个问题好吧好吧下面总结一下让遇到同样问题的朋友少走点弯路吧 1 分区问题建立主分区之后
数据操作之-dataframe常见操作：取行、列、切片、统计特征值

import numpy as np import pandas as pd from pandas import from numpy import data DataFrame np arange 16 reshape 4 4 inde

数据操作之-dataframe常见操作：取行、列、切片、统计特征值

数据操作之-dataframe常见操作：取行、列、切片、统计特征值 的相关文章

随机推荐

热门标签

数据操作之-dataframe常见操作：取行、列、切片、统计特征值的相关文章