即使在使用 .loc 之后，仍尝试在 DataFrame 警告的切片副本上设置值

2024-01-11

我收到警告“

 C:\Python27\lib\site-packages\pandas\core\indexing.py:411: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  self.obj[item] = s"

尽管按照文档中的建议我正在使用 df.loc ？

def sentenceInReview(df):
    tokenizer = nltk.data.load('tokenizers/punkt/english.pickle')
    print "size of df: " + str(df.size)
    df.loc[: ,'review_text'] = df.review_text.map(lambda x: tokenizer.tokenize(x))

    print df[:3]

我今天早些时候遇到了这个问题，这个问题与 Python 在函数/分配变量等之间传递“对象引用”的方式有关。

与 R 不同，在 python 中将现有数据帧分配给新变量不会进行复制，因此对“新”数据帧的任何操作仍然是对原始基础数据的引用。

解决这个问题的方法是进行深度复制（see docs https://docs.python.org/3/library/copy.html) 每当您尝试返回某物的副本时。看：

import pandas as pd
data = [1, 2, 3, 4, 5]
df = pd.DataFrame(data, columns = {'num'})
dfh = df.head(3)  # This assignment doesn't actually make a copy
dfh.loc[:,'num'] = dfh['num'].apply(lambda x: x + 1)
# This will throw you the error

# Use deepcopy function provided in the default package 'copy' 
import copy
df_copy = copy.deepcopy(df.head(3))
df_copy.loc[:,'num'] = df_copy['num'].apply(lambda x: x + 1)
# Making a deep copy breaks the reference to the original df. Hence, no more errors.

这是一个关于这个话题的更多内容 https://robertheaton.com/2014/02/09/pythons-pass-by-object-reference-as-explained-by-philip-k-dick/这或许可以解释 Python 做得更好的方式。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

即使在使用 .loc 之后，仍尝试在 DataFrame 警告的切片副本上设置值的相关文章

python导入模块时如何避免一直写模块名？

我用math最近模块很多我不想写math sqrt x and math sin x 每时每刻我想缩短它并写sqrt x and sin x How 对于较长的模块名称通常会缩短它们例如 import numpy as np 然后您
DataFrame 在函数内部修改

我面临一个我以前从未观察到的函数内数据帧修改的问题有没有一种方法可以处理这个问题以便初始数据帧不被修改 def test df df tt np nan return df dff pd DataFrame data 现在当我打印时d
Spark MLlib - 训练隐式警告

我在使用时不断看到这些警告trainImplicit WARN TaskSetManager Stage 246 contains a task of very large size 208 KB The maximum recommend
编辑 scikit-learn 决策树

我想编辑 sklearn DecisionTree 例如改变条件或切割节点叶子等但似乎没有功能可以做到这一点如果我可以导出到文件编辑它以导入如何编辑决策树环境 Windows 10 python3 3 sklearn 0 17
Python + PostgreSQL + 奇怪的ascii = UTF8编码错误

我有包含字符的 ascii 字符串 x80 代表欧元符号 gt gt gt print x80 当将包含该字符的字符串数据插入数据库时我得到 psycopg2 DataError invalid byte sequence for enc
Python的reduce()短路了吗？

If I do result reduce operator and False 1000 得到第一个结果后它会停止吗自从False anything False 相似地 result reduce operator or True 10
Scikit-learn 的内核 PCA：如何在 KPCA 中实现各向异性高斯内核或任何其他自定义内核？

我目前正在使用Scikit learn 的 KPCA https scikit learn org stable modules generated sklearn decomposition KernelPCA html对我的数据集执行降
使用 Scipy imsave 将 Numpy 数组保存到图像时保留未更改的数据

使用 Scipy 保存二维 Numpy 数组单个值时toimage or imsave像素值与 Numpy 数组中的像素值不完全匹配相反在某些区域主要是边缘图像算法似乎使用某种插值是否有一个选项可以停止插值并保留准确的数据例
在Python中创建一个新表

我正在尝试从数控机床中提取数据事件每毫秒发生一次我需要过滤掉一些用管道分隔的变量分隔符 PuTTy exe 程序生成的日志文件我尝试阅读熊猫但列不在同一位置 df pd read table data log sep 日志文件的一
如何使用 Python 多处理避免在分叉进程中加载父模块

当您创建一个Pool使用Python的进程multiprocessing 这些进程将分叉父进程中的全局变量将显示在子进程中如下面的问题所述如何限制多处理进程的范围 https stackoverflow com questions 2
参数验证，Python 中的最佳实践[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案让我们举一个 API 的例子 def get abs directory self path if os path isdir path ret
如何检查列表是否为空？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动例如如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
如何在 Python 中从 HTML 页面中提取 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我必须用Python 编写一个网络爬
numpy.cov() 返回意外的输出

我有一个 X 数据集有 9 个特征和 683 行 683x9 我想获取这个 X 数据集和另一个与 X 具有相同形状的数据集的协方差矩阵我使用np cov originalData generatedData rowvar False 代
Django 接受 AM/PM 作为表单输入

我试图弄清楚如何使用 DateTime 字段在 Django 中接受 am pm 作为时间格式但我遇到了一些麻烦我尝试在 forms py 文件中这样设置 pickup date time from DateTimeField inpu
使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持

尝试将具有存储在 PubSub 中的属性的消息拉取到 Beam 管道中我想知道是否添加了对 Python 的支持这就是我无法阅读它们的原因我看到它存在于Java中 pipeline options PipelineOptions pi
如何正确消除字典中的元素直到只剩下一个字符串

我真的需要这方面的帮助 def get winner dict winner new dict for winner in dict winner first letter winner 0 value dict winner winner
获取调用者文件的绝对路径

假设我在不同的目录中有两个文件 1 py 比如说在C FIRST FOLDER 1 py and 2 py 比如说在C SECOND FOLDER 2 py 文件1 py进口2 py using sys path insert 0 pa
在Python 3.2中，我可以使用http.client打开并读取HTTPS网页，但urllib.request无法打开同一页面

我想打开并阅读https yande re https yande re with urllib request 但我收到 SSL 错误我可以使用以下方式打开并阅读页面http client用这个代码 import http client
从数据集的给定日期范围中提取属于一天的数据

我有一个数据集日期范围为 2018 年 1 月 12 日到 8 月 3 日其中包含一些值维数为my df数据框是 my df shape 9752 2 每行包含半小时频率第一行开始于2018 01 12 my df iloc 0 D

随机推荐

ALAssetsLibrary 获取相机胶卷

我使用以下方式枚举所有资产组ALAssetsLibrary 这是代码 ALAssetsLibrary library ALAssetsLibrary alloc init void enumerate ALAssetsGroup BOOL
在 jQuery 中过滤 div 并根据自定义数据属性标签隐藏它们

我花了几个小时为在线商家网站构建一个简单的可排序搜索结果它的工作方式是从搜索页面获取 html 模板同时使用 ajax 执行搜索检索 json 数据然后创建 div 元素我已经完成了sort per and direction排序
适用于 Android 应用内计费的 Air Native 扩展

我正在尝试设置本机扩展以通过空中应用程序处理应用内计费我可以向市场发送购买请求但无法收到回复我已经追踪到创建的 AndroidManifest xml 文件为了在 Java 中执行此操作您需要引用特定的类但是当我通过 Flash
如何更改 Microsoft Visual C++ 中的默认语言

我刚刚从 Internet 下载了 Visual C 该应用程序是法语的有什么办法可以切换语言吗如果您下载了 Express 版本则必须下载您想要的任何其他语言的 Express 版本
XPath / XQuery：在节点中查找文本，但忽略特定后代元素的内容

我试图找到一种方法来搜索节点内的字符串但排除这些节点的某些子元素的内容简单明了我想在文本段落中搜索字符串不包括作为段落子元素的脚注例如我的文件是
如何修复控制台警告“资源...已使用链接预加载进行预加载，但在窗口加载事件后几秒钟内未使用”？

我正在为 PWA 开发 gatsby 主题启动器但我似乎无法摆脱以下控制台警告 The resource https davidde github io gatsby starter simpwa page data offline p
为什么推送通知在测试飞行中不起作用？

我已经作为开发者帐户测试了推送通知并且它有效但是当我尝试将其放在 TestFlight 上供测试人员测试时它没有显示推送通知但数据被正确接收那么有一种我需要为 TestFlight 生成证书吗但是当我尝试将其放在 TestFlig
git show commit 中 /dev/null 的意义是什么？

什么是 dev null表示由git show commit output 这是添加了一个新文件所以我认为它是说没有删除任何内容但为什么引用 dev null git show a395a commit a395a7bb4abcc606
CSS3 过渡属性的特征检测

我只是想弄明白这个modernizr 他们如何检查用户的浏览器是否支持某个CSS属性基本上我只是想要一个小脚本来告诉我用户的浏览器是否支持CSS转换我将 Modernizr 代码抽象为如下所示 Elem document createE
在windows中如何定义可执行内存块？

我知道Linux支持mmap能够定义可执行内存块的系统命令在 Windows 中如何做同样的事情我想也许有一些 Windows 等效函数可以做同样的事情 Call CreateFileMapping http msdn microsof
使用 Jetpack Compose 进行生物识别提示

BiometricPrompt 在其构造函数中需要 Fragment 或 FragmentActivity 我无法找到如何从可组合屏幕使用 BiometricPrompt 文档中没有任何教程中都没有这里有人处理过同样的问题吗或者是否有
如何获取特定用户的所有AD组？

我检查了this https stackoverflow com questions 90572 how to get ad user groups for user in asp net已经发帖了但这并不能回答我的问题我想要获取特定用
Web 配置转换不起作用

在 NET MVC 3 0 应用程序中我有以下配置appSettings 网络配置
T-SQL：sp_MSdependency 标志参数

谁能告诉我 flags 参数的有效值是什么 sp MSdependencies存储过程尤其是它们的含义是什么运行此命令将为您枚举选项 exec sp MSdependencies Returns sp MSobject dependen
插件如何调整窗口大小

当我使用以下 html 加载 pdf 时 pdf 插件似乎会调整其窗口大小以适应 pdf 文件的完整长度我想知道这个插件是怎么做到的
Github Pages 呈现空白页面

我刚刚将一个空白 Jekyll 站点推送到我的 github 页面 https louissafety github io https louissafety github io 但是它不会渲染默认的 jekyll 页面而是渲染空白页面
codeigniter：登录后如何重定向到当前控制器（常规php中的php_self）

好吧这并不是真正的问题但我检查用户是否存在并将其登录并重定向到 site members area 但我不想将用户发送到特定页面但我想重新加载当前控制器因此如果我登录index home 我想重定向到index home 我应该如
Flutter：“我的对话框”键盘溢出

我试图将 TextField 添加到对话框中但是当键盘出现时它会溢出我的对话框图片当键盘出现时这里我的代码的一部分看起来像 AlertDialog content new ListView shrinkWrap true chil
C++ 将数据输入私有向量时出现问题（无效使用）

我有一个 Account 类的向量它是 BankingSystem 类私有的这是我如何定义它们的账户类别 struct newAccount string firstName string lastName string accoun
即使在使用 .loc 之后，仍尝试在 DataFrame 警告的切片副本上设置值

我收到警告 C Python27 lib site packages pandas core indexing py 411 SettingWithCopyWarning A value is trying to be set on a c

即使在使用 .loc 之后，仍尝试在 DataFrame 警告的切片副本上设置值

即使在使用 .loc 之后，仍尝试在 DataFrame 警告的切片副本上设置值 的相关文章

随机推荐

热门标签

即使在使用 .loc 之后，仍尝试在 DataFrame 警告的切片副本上设置值的相关文章