Python pandas：删除字符串中分隔符之后的所有内容

2024-05-24

我有数据框，其中包含例如：

"vendor a::ProductA"
"vendor b::ProductA"
"vendor a::Productb"

我需要删除所有内容（包括）两个 :: 以便我最终得到：

"vendor a"
"vendor b"
"vendor a"

我尝试了 str.trim （似乎不存在）和 str.split 但没有成功。实现这一目标的最简单方法是什么？

您可以使用pandas.Series.str.split就像你会用的一样split通常情况下。只需在绳子上分开即可'::'，并对从创建的列表建立索引split method:

>>> df = pd.DataFrame({'text': ["vendor a::ProductA", "vendor b::ProductA", "vendor a::Productb"]})
>>> df
                 text
0  vendor a::ProductA
1  vendor b::ProductA
2  vendor a::Productb
>>> df['text_new'] = df['text'].str.split('::').str[0]
>>> df
                 text  text_new
0  vendor a::ProductA  vendor a
1  vendor b::ProductA  vendor b
2  vendor a::Productb  vendor a

这是一个非熊猫解决方案：

>>> df['text_new1'] = [x.split('::')[0] for x in df['text']]
>>> df
                 text  text_new text_new1
0  vendor a::ProductA  vendor a  vendor a
1  vendor b::ProductA  vendor b  vendor b
2  vendor a::Productb  vendor a  vendor a

编辑：这是对正在发生的事情的逐步解释pandas above:

# Select the pandas.Series object you want
>>> df['text']
0    vendor a::ProductA
1    vendor b::ProductA
2    vendor a::Productb
Name: text, dtype: object

# using pandas.Series.str allows us to implement "normal" string methods 
# (like split) on a Series
>>> df['text'].str
<pandas.core.strings.StringMethods object at 0x110af4e48>

# Now we can use the split method to split on our '::' string. You'll see that
# a Series of lists is returned (just like what you'd see outside of pandas)
>>> df['text'].str.split('::')
0    [vendor a, ProductA]
1    [vendor b, ProductA]
2    [vendor a, Productb]
Name: text, dtype: object

# using the pandas.Series.str method, again, we will be able to index through
# the lists returned in the previous step
>>> df['text'].str.split('::').str
<pandas.core.strings.StringMethods object at 0x110b254a8>

# now we can grab the first item in each list above for our desired output
>>> df['text'].str.split('::').str[0]
0    vendor a
1    vendor b
2    vendor a
Name: text, dtype: object

我建议检查一下pandas.Series.str 文档 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.html，或者，更好的是，在 pandas 中处理文本数据 http://pandas.pydata.org/pandas-docs/stable/text.html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

pandas

Python pandas：删除字符串中分隔符之后的所有内容的相关文章

Python + PostgreSQL + 奇怪的ascii = UTF8编码错误

我有包含字符的 ascii 字符串 x80 代表欧元符号 gt gt gt print x80 当将包含该字符的字符串数据插入数据库时我得到 psycopg2 DataError invalid byte sequence for enc
Python，将迭代函数变成递归函数

我创建了一个输出 4 3 2 1 0 1 2 3 4 的迭代函数 def bounce2 n s n for i in range n print n n n 1 if n lt 0 for i in range s 1 print n n
Python sqlite3游标没有属性commit

当我运行这段代码时 path Scripts wallpapers single png conn sqlite3 connect Users Heaven Library Application Support Dock desktopp
为什么导入 pdb 时出现此错误？ “模块”对象没有属性“ascii_letters”

尝试调试我的代码我正在导入库pdb import sys from subprocess import check call import pdb functions if name main Code 我收到此错误 File reg p
如何从谷歌云存储桶读取音频文件并在datalab笔记本中使用ipd播放

我想在数据实验室笔记本中播放我从谷歌云存储桶中读取的声音文件这个怎么做 import numpy as np import IPython display as ipd import librosa import soundfile as
html 解析器 python

我正在尝试解析一个网站我正在使用 HTMLParser 模块问题是我想解析第一个 a href 评论后但我真的不知道该怎么做所以我在文档中发现有一个函数叫做handle comment 但我还没有找到如何正确使用它我有以下内容 i
如何找到列表S的所有分区为k个子集（可以为空）？

我有一个唯一元素列表比方说 1 2 我想将其拆分为 k 2 个子列表现在我想要所有可能的子列表 1 2 1 2 2 1 1 2 我想分成 1 1 2 我怎样才能用 Python 3 做到这一点更新我的目标是获取 N 个唯一数字列表的
为什么我的scoped_session 引发 AttributeError: 'Session' object has no attribute 'remove'

我正在尝试建立一个系统将数据库操作优雅地推迟到单独的线程以避免在 Twisted 回调期间发生阻塞到目前为止这是我的方法 from contextlib import contextmanager from sqlalchemy i
如何使用循环将十进制转换为二进制？

我想编写一个程序将十进制数 0 到 9 转换为二进制数我可以编写如何使用重复除法将十进制数转换为二进制数的代码但是我在创建一个以二进制格式打印十进制数字 0 到 9 的循环时遇到了麻烦这是我的代码 number 0 remaind
如何使用 Pandas 将巨大的 CSV 转换为 SQLite？

我有一个巨大的表大约 60 GB 采用存档的 CSV 文件形式我想将其转换为 SQLite 文件我现在所做的事情如下 import pandas import sqlite3 cnx sqlite3 connect db sqlite
错误：无法访问文件“$libdir/plpython2”：没有这样的文件或目录

我正在运行 postgresql 9 4 PostgreSQL 9 4 4 on x86 64 unknown linux gnu compiled by gcc GCC 4 1 2 20070626 Red Hat 4 1 2 14 64
如何修复错误“AttributeError：‘模块’对象在 python3 中没有属性‘客户端’？

以下是我的代码 import http h1 http client HTTPConnection www bing com 我认为没问题但是 python 给了我以下错误 AttributeError 模块对象没有属性客户端我想知
str.translate 给出 TypeError - Translate 采用一个参数（给定 2 个参数），在 Python 2 中工作

我有以下代码 import nltk os json csv string cPickle from scipy stats import scoreatpercentile lmtzr nltk stem wordnet WordNetL
一行Python和SQLite代码，为什么需要加“，”？ [复制]

这个问题在这里已经有答案了 c execute INSERT INTO numbers VALUES random randint 0 100 如果我将上面的代码更改为 c execute INSERT INTO numbers VALUE
Django - 电子邮件发送两次

每当我使用如下所示的电子邮件设置从views py调用下面的方法时电子邮件的两份副本都会发送给收件人并且我收到如下所示的错误 def sendEmailBasic request msg EmailMessage Request Cal
Matplotlib 图例不工作

自从升级 matplotlib 以来每当尝试创建图例时我都会收到以下错误 usr lib pymodules python2 7 matplotlib legend py 610 UserWarning Legend does not
如何在 Python 中从 HTML 页面中提取 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我必须用Python 编写一个网络爬
numpy.cov() 返回意外的输出

我有一个 X 数据集有 9 个特征和 683 行 683x9 我想获取这个 X 数据集和另一个与 X 具有相同形状的数据集的协方差矩阵我使用np cov originalData generatedData rowvar False 代
为什么 bot.get_channel() 会产生 NoneType？

我正在制作一个 Discord 机器人来处理公告命令当使用该命令时我希望机器人在特定通道中发送一条消息并向用户发送一条消息以表明该命令已发送但是我无法将消息发送到频道我尝试了这段代码 import discord import
获取调用者文件的绝对路径

假设我在不同的目录中有两个文件 1 py 比如说在C FIRST FOLDER 1 py and 2 py 比如说在C SECOND FOLDER 2 py 文件1 py进口2 py using sys path insert 0 pa

随机推荐

如何清除 ASP.NET MVC 应用程序中文本框的发布数据？

默认情况下使用呈现的文本框使用发布数据中的值例如如果页面上存在验证错误将从发布的数据中检索该值并将其用于 value 属性现在在某些情况下我希望能够清除该值换句话说我希望文本框为空我不希望 MVC 从发布的数据中获取值并
将大型高清视频文件上传到 Amazon Web Services S3

最终目标将大型视频文件内容制作者将是专业用户因此他们的一点额外工作并不是一个巨大的负担然而对他们和我来说保持尽可能简单是理想的如果可以使用网络表单来启动那就最好了内容制作者不会有数百个因此可以投入一些额外的时间或精力为
IBM AIX：核心-外壳：显示文件修改日期

我想用 bash 做这样的事情查看文件上次修改的时间 ls lha ls full time 但我必须在 AIX 上使用 core shell 怎样才能达到这样的效果呢您可以使用 istat istat test ksh Inode 8
numberOfRowsInSection：重新加载数据时未调用

我有一个UITableView使用数组来列出数据这很好用我也有一个UISearchBar用于搜索那个tableview 当 tableviews 数组中的数据匹配时这些行将添加到另一个可变数组中并且cellForRowAtIndex
使用鼠标事件复制拖放时出现问题

我想用我自己的例程复制标准的 startDrag stopDrag 事件来稍微改变一些事情并且我遇到了某种事件传播或冒泡问题这是我的代码
如何使用 jquery 阻止或限制输入字段中的特殊字符？

如何使用 jquery 阻止在输入字段中输入特殊字符一个使用正则表达式的简单示例您可以更改它以允许禁止您喜欢的任何内容 input on keypress function event var regex new RegExp a z
如何在不破坏默认行为的情况下覆盖 __getattr__ ？

我如何覆盖 getattr https docs python org 3 reference datamodel html object getattr 类的方法而不破坏默认行为压倒一切 getattr 应该没事 getattr 仅作为
Blob 的簇生长

考虑以下来自 Mathworks 的图像我已经用标签标记了斑点 L num bwlabel I 如何迭代连接所有斑点即从一个斑点开始找到离它最近的一个考虑最左边的两个斑点可以从一个斑点的许多点绘制许多条线来连接到另一个斑点blob
如何在 Windows 8.1 上使用 Python 过滤器和 Pandoc 将带 tikz 的 md 转换为 html

我正在尝试使用 Pandoc 过滤器将带有 tikz 图片的 markdown 文件转换为 html 我使用的是 Win 8 1 并且我拥有所有依赖项 pdflatex Python 2 7 ImageMagick 和 pandocfilt
使用asp.net mvc计算相对日期

在 C 中使用 ASP NET MVC 显示相对日期例如 20 分钟前的最佳库是什么当简单的扩展方法可以做到这一点时您就不需要库了这是我使用过的扩展方法 public static string TimeAgo this Date
iTunes Lookup API，获取iPhone 5应用程序截图

I use iTunes API 查找通过 App ID 获取应用数据即使应用程序是为iPhone5 在 JSON 中我得到3 5 inch屏幕截图下截图网址 array 有什么办法可以得到4 inch 截图可以使用非官方的 iTun
java替代Thread.stop()来中断特定调用

我正在寻找一种方法来告诉这个调用大约需要 20 120 秒 final Area image final AffineTransform transform new AffineTransform transform scale imag
JavaScript Array.length 属性是函数还是简单变量？

我有以下 JavaScript 代码我已经使用 new 关键字初始化了一个数组因此创建了该数组对象的一个新实例然后我通过向数组添加元素来填充该数组然而我认为我犯了一个根本性的误解代码的下一部分让我非常困惑如果它不够清楚或者完
Google 使用 Angular JS 放置自动完成功能

我试图让谷歌地点自动完成与 Angular JS 一起工作这是jsfiddle http jsfiddle net punchouty cTD2a 2 place change 事件后模型未更新它正在根据输入的变化进行更新下面是 ht
Git：repo 包含一个空目录 - 会发生什么？

Git 跟踪文件而不是目录 https stackoverflow com questions 5091017 和我们目前不能add空目录 https stackoverflow com questions 11600188 The 标准
如何使用 boto3 从 AWS Cognito 获取经过身份验证的身份响应

我想使用 boto3 获取访问 AWS 服务的临时凭证用例是这样的我的 Cognito 用户池中的用户登录到我的服务器我希望服务器代码为该用户提供访问其他 AWS 服务的临时凭证我有一个存储我的用户的 Cognito 用户池我有一
按下按钮时清除编辑文本焦点并隐藏键盘

我正在制作一个带有编辑文本和按钮的应用程序当我在 edittext 中输入内容然后单击按钮时我希望键盘和焦点在 edittext 上消失但我似乎无法做到这一点我在 XML 中插入了这两行代码 android focusable tr
Spring Data：限制自定义查询的结果

在我的 Spring 数据存储库中我必须使用自定义查询 Query注解我知道我可以限制这样的命名查询中的结果数量 Iterable
iOS 应用程序中的屏幕共享？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我想与运行相同应用程序的其他设备共享
Python pandas：删除字符串中分隔符之后的所有内容

我有数据框其中包含例如 vendor a ProductA vendor b ProductA vendor a Productb 我需要删除所有内容包括两个以便我最终得到 vendor a vendor b vendor a 我尝

Python pandas：删除字符串中分隔符之后的所有内容

Python pandas：删除字符串中分隔符之后的所有内容 的相关文章

随机推荐

热门标签

Python pandas：删除字符串中分隔符之后的所有内容的相关文章