DataFrame.to_csv 抛出错误“[Errno 2]没有这样的文件或目录”

2023-12-01

我正在尝试将 DataFrame 写入 .csv 文件：

now = datetime.datetime.now()
date = now.strftime("%Y-%m-%d")

enrichedDataDir = "/export/market_data/temp"
enrichedDataFile = enrichedDataDir + "/marketData_optam_" + date + ".csv"

dbutils.fs.ls(enrichedDataDir)
df.to_csv(enrichedDataFile, sep='; ')

这引发了我以下错误

IOError: [Errno 2] 没有这样的文件或目录: '/export/market_data/temp/marketData_optam_2018-10-12.csv'

但当我这样做时

dbutils.fs.ls(enrichedDataDir)

Out[72]: []

没有错误！当我进入目录级别（更高一级）时：

enrichedDataDir = "/export/market_data"
dbutils.fs.ls(enrichedDataDir)

Out[74]: 
[FileInfo(path=u'dbfs:/export/market_data/temp/', name=u'temp/', size=0L)
 FileInfo(path=u'dbfs:/export/market_data/update/', name=u'update/', size=0L)]

这也有效。这对我来说意味着我确实拥有我想要访问的所有文件夹。但我不知道你的.to_csv选项会引发错误。我也检查了权限，没问题！

主要问题是，我使用 Microsoft Azure Data Lake Store 来存储这些 .csv 文件。无论出于何种原因，都不可能通过df.to_csv写入 Azure Datalake 存储。

由于我试图使用df.to_csv我使用的是 Pandas DataFrame 而不是 Spark DataFrame。

我改为

from pyspark.sql import *

df = spark.createDataFrame(result,['CustomerId', 'SalesAmount'])

然后通过以下行写入 csv

from pyspark.sql import *

df.coalesce(2).write.format("csv").option("header", True).mode("overwrite").save(enrichedDataFile)

它有效。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

IO

PySpark

Databricks

DataFrame.to_csv 抛出错误“[Errno 2]没有这样的文件或目录” 的相关文章

为什么我不能使用“exclude”从 python 轮子中排除“tests”目录？

考虑以下包结构与以下setup py内容 from setuptools import setup find packages setup name dfl client packages find packages exclude te
Python：记录垃圾收集器

我有一个 python 应用程序有一些性能问题我想将垃圾收集器的事件特别是何时调用添加到我的日志中是否可以 thanks http docs python org library gc html gc set debug http
为什么在 Windows 中使用 GetConsoleScreenBufferInfoEx 时控制台窗口会缩小？

我正在尝试使用 GetConsoleScreenBufferInfoEx 和 SetConsoleScreenBufferInfoEx 设置 Windows 命令行控制台的背景和前景色我正在 Python 中使用 wintypes 进行此
如何在 ReportLab 段落中插入回车符？

有没有办法在 ReportLab 的段落中插入回车符我试图将 n 连接到我的段落字符串但这不起作用 Title Paragraph Title n Page myStyle 我想要这样做因为我将名称放入单元格中并且想要控制单元格中的
Pyspark 数据框逐行空列列表

我有一个 Spark 数据框我想创建一个新列其中包含每行中具有 null 的列名称例如原始数据框是 col 1 col 2 col 3 62 45 null 62 49 56 45 null null null null null
Python 正则表达式部分匹配或“hitEnd”

我正在编写一个扫描器因此我将任意字符串与正则表达式规则列表进行匹配如果我可以模拟 Java hitEnd 功能不仅知道正则表达式何时不匹配还知道何时匹配这将非常有用 can t匹配当正则表达式匹配器在决定拒绝输入之前到达输入末尾
Django 的 URL 覆盖率测试为 0%，为什么？

使用姜戈鼻子我对 URL 进行了测试但 URL 覆盖率仍然为 0 为什么 python manage py 测试配置文件这是我的报道 Name Stmts Miss Cover Missing profiles 0 0 100 pro
如何使用 Pandas 将巨大的 CSV 转换为 SQLite？

我有一个巨大的表大约 60 GB 采用存档的 CSV 文件形式我想将其转换为 SQLite 文件我现在所做的事情如下 import pandas import sqlite3 cnx sqlite3 connect db sqlite
如何从 Python 中指定运行程序的输入文件？

我正在编写一个外部脚本以通过笔记本电脑上的 Python mrjob 模块而不是在 Amazon Elastic Compute Cloud 或任何大型集群上运行 mapreduce 作业我读自mrjob文档 http packag
在Python中删除带有重音符号的字符串中的所有非字母字符

我正在尝试使用 Python 3 7 从包含重音符号的字符串中删除所有非字母字符空格除外我尝试了以下方法 import re text 29 1981 4 2008 clean text re sub W d text print cl
如何使用 PySpark 有效地将这么多 csv 文件（大约 130,000 个）合并到一个大型数据集中？

我之前发布了这个问题并得到了一些使用 PySpark 的建议如何有效地将这一大数据集合并到一个大数据框中 https stackoverflow com questions 60259271 how can i merge this la
如何检查列表是否为空？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动例如如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
如何在 Python 中从 HTML 页面中提取 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我必须用Python 编写一个网络爬
求解不等式系统时“多项式错误：仅允许使用单变量多项式”

我想找到以下两个常数的区间cons1 and cons2我写了下面的代码 from sympy import Poly from sympy import Abs from sympy solvers inequalities import
numpy.cov() 返回意外的输出

我有一个 X 数据集有 9 个特征和 683 行 683x9 我想获取这个 X 数据集和另一个与 X 具有相同形状的数据集的协方差矩阵我使用np cov originalData generatedData rowvar False 代
Django 接受 AM/PM 作为表单输入

我试图弄清楚如何使用 DateTime 字段在 Django 中接受 am pm 作为时间格式但我遇到了一些麻烦我尝试在 forms py 文件中这样设置 pickup date time from DateTimeField inpu
大型数据集上的 Sklearn-GMM

我有一个很大的数据集我无法将整个数据放入内存中我想在这个数据集上拟合 GMM 我可以用吗GMM fit sklearn mixture GMM 重复小批量数据没有理由重复贴合只需随机采样您认为机器可以在合理时间内计算的尽可能多的数据
Jupyter Notebook：没有名为 pandas 的模块

我搜索了其他问题但没有找到任何有帮助的内容大多数只是建议您使用 conda 或 pip 安装 pandas 在我的 jupyter 笔记本中我试图导入 pandas import pandas as pd 但我收到以下错误 Modul
如何正确消除字典中的元素直到只剩下一个字符串

我真的需要这方面的帮助 def get winner dict winner new dict for winner in dict winner first letter winner 0 value dict winner winner
在Python 3.2中，我可以使用http.client打开并读取HTTPS网页，但urllib.request无法打开同一页面

我想打开并阅读https yande re https yande re with urllib request 但我收到 SSL 错误我可以使用以下方式打开并阅读页面http client用这个代码 import http client

随机推荐

Java：流中的消费者接口无法按预期工作[重复]

这个问题在这里已经有答案了我有两条语句我期望它们应该打印相同的结果 Arrays stream abc split forEach System out println first Arrays stream abc split p
让 Greasemonkey 对元素的 ajax 更改做出反应

有一个页面加载了一个空的跨度如下所示 span span 然后用一些文本填充该范围我需要我的脚本来获取该文本但 Greasemonkey 在填充文本之前运行甚至waitForKeyElements我尝试使用的函数没有帮助因为页面加
C# 中的私有内部类 - 为什么它们不被更频繁地使用？

我对 C 比较陌生每次我开始从事 C 项目时我只从事过 C 中近乎成熟的项目我想知道为什么没有内部类也许我不明白他们的目的对我来说内部类至少是私有内部类看起来很像 Pascal Modula 2 Ada 中的内部过程它们
Button离开Highlighted状态时调用方法

我想在按钮突出显示时执行一个操作并在按钮离开突出显示状态时执行另一个操作有什么建议吗你可以使用KVO button addObserver self forKeyPath highlighted options NSKeyValueO
如何使用SimpleAdapter.ViewBinder？

我有一个布局复杂的列表R layout menu row 它由一个ProgressBar和一个文本字段我使用的适配器 SimpleAdapter simpleAdapter new SimpleAdapter this getData p
生成 WIX 创作文件以在单个组件下包含多个文件

我们使用 heat 可执行文件生成一个创作文件其中为每个文件创建一个唯一的组件有没有办法在单个组件下包含多个文件预期结果
Twitter 卡元标记在 index.html 中工作，而不在 React Helmet 中工作

我在 App js 中使用了下面的 React Helmet 代码来渲染 Twitter 卡元
git - 删除 HEAD 之前的提交

好吧我是 Git 新手想知道如何删除 HEAD 之前的提交例如 commit foo This is the HEAD commit bar This is what I want to remove 我该如何删除commit bar
如何防止 DLL 注入

所以前几天我看到了这个 http www edgeofnowhere cc viewtopic php p 2483118 它介绍了 DLL 注入的三种不同方法我将如何防止这些过程发生或者至少我如何防止第一个我在想也许 Ring
用户始终处于登录状态并且无法在 flutter firebase 中注销

主要飞镖 Widget build BuildContext context return StreamProvider
Javascript：取消或让活动继续进行？

我的场景涉及 Kendo UI 但我认为它可能通常适用于 JavaScript 因此使用 JavaScript 标签我有一个 Kendo 调度程序其编辑事件选项设置为起作用在 functionA 中我创建了一个 Kendo 窗口基
如何在没有提交按钮的情况下将值从一个jsp页面传递到另一个jsp页面？

这是我的 demo1 jsp 页面
整数到 NSInteger 并保存到核心数据

我有一个名为 Marbles 的整数并尝试使用以下代码将其保存到数组中 records setValue marbles forKey marbles 使用这段代码我收到警告警告语义问题整数到指针转换不兼容将 int 发送到 i
Mongodb 分组并使用空数组进行推送

我遇到了一个问题group当有一个数组可以是empty 该集合可能是这样的 id Contract 1 ContactId Contact 1 Specifications id Contract 2 ContactId Contact 2
将索引添加到现有文件的文件名（file.txt => file_1.txt）

如果文件已经存在我想向文件名添加索引这样我就不会覆盖它就像我有一个文件一样myfile txt和同一时间myfile txt存在于目标文件夹中我需要复制带有名称的文件myfile 1 txt 同时如果我有一个文件myfile txt
gitosis + git 错误：致命：'/home/git/repositories/idea-generator.git' 似乎不是 git 存储库

我尝试按照有关如何使用的说明进行操作gitosis管理我的git项目除了一个小问题外我已经安装了gitosis成功地当我尝试创建我的第一个 git 项目时通过 gitosis 设置和配置项目后问题就出现了当我推送到远程 git
如何在MYSQL中插入时间2009-09-22 18:09:37.881 我的列类型是DateTime

如何插入时间2009 09 22 18 09 37 881在mysql中实际上我可以插入和检索时间2009 09 22 18 09 37在 mysql 中但每当我尝试插入时2009 09 22 18 09 37 881数据未插入数据库
获取目录中所有文件夹的列表[关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心所以我有一个如下所示的文件系统 Music 001 song mp3 002 song
Java 的 NullPointerException 是否可以更改为报告哪个变量为空？ [复制]

这个问题在这里已经有答案了 The NullPointerExceptionin Java 似乎只报告它发生在特定的代码行上如果一行代码中使用了多个变量是否可以更改该异常以声明哪个变量为空不类文件中的调试信息不包含足够的信息来允许
DataFrame.to_csv 抛出错误“[Errno 2]没有这样的文件或目录”

我正在尝试将 DataFrame 写入 csv 文件 now datetime datetime now date now strftime Y m d enrichedDataDir export market data temp enr

DataFrame.to_csv 抛出错误“[Errno 2]没有这样的文件或目录”

DataFrame.to_csv 抛出错误“[Errno 2]没有这样的文件或目录” 的相关文章

随机推荐

热门标签