将 NLTK Rake 应用于 Dataframe 中的每一行

2023-12-21

我想应用 Rake 函数（https://pypi.org/project/rake-nltk/ https://pypi.org/project/rake-nltk/）到我的数据框中的每一行。

我可以将该函数单独应用于特定行，但不能将其附加到数据帧。

这是我到目前为止所拥有的：

r = Rake(ranking_metric= Metric.DEGREE_TO_FREQUENCY_RATIO, language= 'english', min_length=1, max_length=4)
r.extract_keywords_from_text(test.document[177])
r.get_ranked_phrases() #prints a list of keywords
test['keywords'] = test.applymap(lambda x: r.extract_keywords_from_text(x)) #trying to apply it to each row.

它只是无限期地运行。我只想在我的数据框“测试”中附加一个名为“关键字”的新列，其中包含来自 r.get_ranked_phrases() 的关键字列表。

r.extract_keywords_from_text(x) 将返回 None

import pandas as pd
from  rake_nltk import Rake  

r = Rake()    

df=pd.DataFrame(data = ['machine learning and fraud detection are a must learn',
                  'monte carlo method is great and so is hmm,pca, svm and neural net',
                  'clustering and cloud',
                  'logistical regression and data management and fraud detection'] ,columns = ['Comments'])


 def rake_implement(x,r):
     r.extract_keywords_from_text(x)
     return r.get_ranked_phrases()

df['new_col'] =df['Comments'].apply(lambda x: rake_implement(x,r))
print(df['new_col'])
#o/p
0      [must learn, machine learning, fraud detection]
1    [monte carlo method, neural net, svm, pca, hmm...
2                                  [clustering, cloud]
3    [logistical regression, fraud detection, data ...
Name: new_col, dtype: object

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

NLTK

将 NLTK Rake 应用于 Dataframe 中的每一行的相关文章

如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f

随机推荐

PHP：找不到“Phar”类

我尝试使用 Silex 框架作为我的 Web 应用程序的基础但是如果我尝试包含 phar 存档 PHP 会抛出以下错误 Fatal error Class Phar not found in var www framework sile
将两个 mysql 查询合并为一个

组合这两个查询的正确语法是什么 SELECT clicks FROM clicksTable WHERE clicks gt 199 ORDER BY clicks ASC LIMIT 1 and SELECT clicks FROM cl
如果无法修改 JSONP 中的标头。 Chrome 中的 Twitter 扩展程序如何工作？

现在我正在用 Javascript 做 Twitter 客户端读完这个话题后我有一个疑问修改 JSONP 请求的 HTTP 标头 https stackoverflow com questions 3350778 modify htt
获取地址时模板类型（类/函数）实例化的规则是什么？

在回答中this https stackoverflow com questions 6734492 c callback to function template explicitly instantiate template问题我发现
核心数据：继承、STI 还是其他？

我似乎无法在文档中或通过谷歌找到任何关于此的信息但如果有的话指向它的指针会很棒在我的应用程序中我有一个Thing作为核心数据类我打算拥有那个Thing包含许多Items 里面有很多字段比如order and created da
在 macOS 中找不到 mysql 命令

我已经安装了 MySQL dmg根据官方页面安装文件但它返回command not found mysql当我执行时mysql命令如何解决这个问题 MySQL 的文档说使用软件包安装程序进行安装时文件将安装到 usr local 中
setuid 与 seteuid 函数

setuid 和 seteuid 函数有什么区别在手册页中这两个函数都有相似的描述 setuid DESCRIPTION setuid sets the effective user ID of the calling process
如何在运行时更改 WinForms 应用程序的区域性

我用 C 创建了 Windows 窗体程序我在本地化方面遇到一些问题我有两种语言的资源文件一种是英语另一种是法语我想单击每个语言按钮并在运行时更改语言但是当我点击按钮时它不起作用我正在使用这个代码 private void
如何为 Azure AD B2C 设置用户旅程查看器

根据Azure Active Directory B2C 收集日志 https learn microsoft com en us azure active directory b2c active directory b2c troubl
您认为 Java 中最好的 CMS 是什么 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Rails 3：如何在 application.rb 中声明 Rack 中间件

很多例子比如这两个如何在 Rails3 中使用机架中间件 https stackoverflow com questions 4224900 how to use rack middleware with rails3 http asc
VueJS 将 HTML 打印到页面

我有一个属性其中包含 HTML 字符串作为其属性之一当我尝试将其打印到模板中的页面时它实际上打印了 HTML 因此文本包含 HTML 标签并且它本身不会被浏览器解释为 HTML 我怎样才能解决这个问题模板 div class de
无法在 Android 8 中禁用通知振动

我试着禁用振动显示通知时 Func public static Notification buildNotifForUploaderService Context ctx String title String message Notifi
Pandas 数据框按日期移动列

我有一个按日期和 ID 索引的面板数据集看起来像这样 df pd DataFrame Date 2005 12 31 2006 03 31 2006 09 30 2005 12 31 2006 03 31 2006 06 30 2006
绕过错误并继续代码

这是我之前遇到的一个简单问题本质上像这样的解决方案 https stackoverflow com questions 574730 python how to ignore an exception and proceed and t
在 Android 上替换 ViewPager 中的当前 Fragment

我有一个ViewPager我必须更换第一个Fragment如果某个动作发生 public static class PagerAdapter extends FragmentStatePagerAdapter private TempCha
如何添加可拖动的“文本字段”以在颤振中的图像上添加文本？

我正在 flutter 中创建一个 Meme 生成器应用程序我只需要知道是否有一种方法用户本身可以在图像上添加文本并将该文本拖动到图像区域中的任何位置这样图片看起来很有趣我尝试过拖动框小部件但不知道如何将其用于文本字段这样我也可
SQL 2008+ NOLOCK 与 READPAST 对于报告准确性的注意事项

了解最终的决策是业务决策在 SQL 2008 R2 中运行的 NOLOCK 和 READPAST 之间的准确性考虑因素是什么在与业务领域讨论变更之前我希望能有更好的理解我继承了许多查询用于创建管理报告的数据视图 WITH NOLO
iPhone：获取 Google 地图的选定缩放级别

当用户使用以下任一方式时我们需要获取 MKMapView 当前选择的缩放级别使用 Mapkit 放大或缩小 Google 地图我们尝试过的解决方案在模拟器上运行良好但在真实环境中运行不佳设备具有 iOS 3 0 1 的 iPho
将 NLTK Rake 应用于 Dataframe 中的每一行

我想应用 Rake 函数 https pypi org project rake nltk https pypi org project rake nltk 到我的数据框中的每一行我可以将该函数单独应用于特定行但不能将其附加到数据帧这

将 NLTK Rake 应用于 Dataframe 中的每一行

将 NLTK Rake 应用于 Dataframe 中的每一行 的相关文章

随机推荐

热门标签

将 NLTK Rake 应用于 Dataframe 中的每一行的相关文章