PYTHON：从 txt 文件中删除 POS 标签

2024-05-14

我有以下 txt 文件，其中包含 POS (词性 http://en.wikipedia.org/wiki/Part-of-speech_tagging) 每个单词的标签。

不用/jj到/说/vb，/，我/ppss是/bedz愤怒/jj在/在/dt无与伦比/jj入侵/nn在/在自由/jj企业/nn ./。 /wrb 怎么敢/vbn 他们/ppss

有没有办法读取没有 POS 标签的文件，结果将是：

不用说，我对这种对自由企业的前所未有的侵犯感到愤怒。他们怎么敢

所以，基本上我想删除之后的任何字符/.

words = re.findall('\w+',open(input_file).read())

上面的代码将删除 / 但缩写如 jj 、 ppss 仍然出现。那么，如何删除 / 后面跟着的任何字符。

这够好吗？

>>> import re
>>> s = 'Needless/jj to/to say/vb ,/, I/ppss was/bedz furious/jj at/in this/dt unparalleled/jj intrusion/nn upon/in free/jj enterprise/nn ./.'
>>> re.sub(r'/[^\s]+','',s)
'Needless to say , I was furious at this unparalleled intrusion upon free enterprise .'

这只是删除以以下内容开头的任何文本/直到找到空白。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

PYTHON：从 txt 文件中删除 POS 标签的相关文章

(discord.py) 尝试更改成员角色时，“用户”对象没有属性“角色”

因此我正在尝试编写一个机器人让某人在命令中指定的主持人指定的一段时间内暂停角色我知道该变量称为小时即使它目前以秒为单位我稍后会解决这个问题基本上它是由主持人在消息暂停 personmention numberofhours
如何在刻度标签和轴之间添加空间

我已成功增加刻度标签的字体但现在它们距离轴太近了我想在刻度标签和轴之间添加一点呼吸空间如果您不想全局更改间距通过编辑 rcParams 并且想要更简洁的方法请尝试以下操作 ax tick params axis both whic
将字符串转换为带有毫秒和时区的日期时间 - Python

我有以下 python 片段 from datetime import datetime timestamp 05 Jan 2015 17 47 59 000 0800 datetime object datetime strptime t
如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

python 日志记录替代方案 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案蟒蛇记录模块 http docs python org library logging html使用起来
这个 JQuery 指令做什么 $(function(){...}) [重复]

这个问题在这里已经有答案了我最近一直在研究JQuery 尽管我知道一些东西但书上有这样一句话我根本无法理解 function current entry 1 有谁知道这条线是如何工作的以及它的作用是什么它类似于 JQuery 函数中的
在 C++17 中使用成员的链接错误

我在 Ubuntu 16 04 上使用 gcc 7 2 并且需要使用 C 17 中的新文件系统库尽管确实有一个名为experimental filesystem的库但我无法使用它的任何成员例如当我尝试编译此文件时 include
ASP.NET 中 HTTP 缓存相关标头的有效含义

我正在 ASP NET 2 0 中开发一个 Web 应用程序其中涉及通过资源处理程序 ashx 提供图像我刚刚实现了处理缓存标头和条件 GET 请求这样我就不必为每个请求提供所有图像但我不确定我是否完全理解浏览器缓存发生了什么图像
当一组工作人员完成时如何执行 Sidekiq 回调

假设我有一个 Sidekiq 任务将产品处理到我的数据库每个产品都按商店分组因此我的代码的一个过于简化的示例将是这样的 stores each do store store products each do product Produc
JsGrid 将嵌套对象加载到表中

我正在 Django 中开发一个 Web 项目并使用 jsGrid 我遇到了问题并且找不到解决方案我有一个嵌套的 JSON 数据它是通过组合多个数据库表记录创建的这是我的 JSON count 3 results personnel
#1115 - 未知字符集：'utf8mb4'

我的电脑上运行着一个本地网络服务器用于本地开发我现在正处于导出数据库并导入到我的托管 VPS 的阶段导出然后导入时出现以下错误 1115 未知字符集 utf8mb4 有人能指出我正确的方向吗该错误明确表明您没有utf8mb4您的阶段
输出带有SAS表测试结果的表的宏

Problem 我不是一个非常有经验的 SAS 用户但不幸的是我可以访问数据的实验室仅限于 SAS 另外我目前无法访问这些数据因为它只能在实验室中使用因此我创建了模拟数据进行测试我需要创建一个宏来获取值和尺寸PROC MEANS表
如何让 Firebase 与 Java 后端配合使用

首先如果这个问题过于抽象或不适合本网站我想表示歉意我真的不知道还能去哪里问目前我已经在 iOS 和 Android 上开发了应用程序他们将所有状态保存在 Firebase 中因此所有内容都会立即保存到 Firebase 实时数据
为什么 Linux 对目录使用 getdents() 而不是 read()？

我浏览 K R C 时注意到为了读取目录中的条目他们使用了 while read dp gt fd char dirbuf sizeof dirbuf sizeof dirbuf code Where dirbuf是系统特定的目录结构
如何在 Qt 中以编程方式制作一条水平线

我想弄清楚如何在 Qt 中制作一条水平线这很容易在设计器中创建但我想以编程方式创建一个我已经做了一些谷歌搜索并查看了 ui 文件中的 xml 但无法弄清楚任何内容 ui 文件中的 xml 如下所示
使用 DBCP 配置 Tomcat

在闲置一段时间几个小时后我们收到了 CommunicationsException 来自 DBCP 错误消息在异常中位于这个问题的末尾但我没有看到任何配置文件中定义的 wait timeout 我们应该看哪里在 tomcat
C语言声明数组没有初始大小

编写一个程序来操纵温度详细信息如下所示输入要计算的天数主功能输入摄氏度温度输入功能将温度从摄氏度转换为华氏度独立功能查找华氏度的平均温度我怎样才能在没有数组初始大小的情况下制作这个程序 include
角度 4 单击按钮功能未触发

我正在尝试检查文本输入是否为空或不在角度 4 中我没有为此使用表单这只是一个输入字段当我在下面的按钮中执行 addLocaton 函数时需要进行检查我的输入字段
受限 AppDomain 中的代码访问安全异常

Goal 我需要在权限非常有限的 AppDomain 中运行一些代码它不应该访问任何花哨或不安全的内容 except对于我在其他地方定义的一些辅助方法我做了什么我正在创建一个具有所需基本权限的沙箱 AppDomain 并创建一个运行代
如何查找连接到 AF_INET 套接字的客户端的 UID？

有什么方法或类似的东西ucred for AF UNIX如果是AF INET插座 TCP在我的例子中找出连接到我的套接字的客户端的UID 还有 proc net tcp但它显示了UID of the creator插座的而不是连接的cli
如何更改 Flutter 中的默认字体系列

如何更改应用程序的每个文本以使用特定字体我可以使用以下命令单独更改它们TextStyle 但如何让我的应用程序默认使用特定字体你能告诉我怎么做吗您可以按照以下步骤更改 Flutter 应用程序的默认字体系列 1 将字体文件添加到项目文
无法使用 git 配置文件进行 ssh

我知道它被问了很多次但我无法得到我的问题的答案我正在尝试使用配置文件 ssh 到系统配置文件是 Host qa HostName 10 218 70 345 User user IdentityFile C Users bean ss
Java 的“&&”与“&”运算符

我使用的示例来自 Java Herbert Schildt 的完整参考文献第 12 版 Java 是 14 他给出了以下 2 个示例如果阻止第一个是好的第二个是错误的因此发表评论 public class PatternMatch
PYTHON：从 txt 文件中删除 POS 标签

我有以下 txt 文件其中包含 POS 词性 http en wikipedia org wiki Part of speech tagging 每个单词的标签不用 jj到说 vb 我 ppss是 bedz愤怒 jj在在 dt无与伦

PYTHON：从 txt 文件中删除 POS 标签

PYTHON：从 txt 文件中删除 POS 标签 的相关文章

随机推荐

热门标签

PYTHON：从 txt 文件中删除 POS 标签的相关文章