在spark 1.6中将csv读取为数据框

2023-12-11

我有 Spark 1.6 并尝试读取 csv(或 tsv)文件作为数据帧。 以下是我采取的步骤:

scala>  val sqlContext= new org.apache.spark.sql.SQLContext(sc)
scala> import sqlContext.implicits._
scala> val df = sqlContext.read
scala> .format("com.databricks.spark.csv")
scala> .option("header", "true")
scala.option("inferSchema", "true")
scala> .load("data.csv")
scala> df.show()

Error:

<console>:35: error: value show is not a member of org.apache.spark.sql.DataFrameReader df.show()

最后一个命令应该显示数据帧的前几行,但我收到错误消息。任何帮助都感激不尽。


看起来您的函数没有正确链接在一起,并且它试图在 val df 上运行“show()”,这是对 DataFrameReader 类的引用。 如果我运行以下命令,我可以重现您的错误:

val df = sqlContext.read
df.show()

如果你重构代码,它会起作用:

val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").option("inferSchema", "true").load("data.csv")
df.show()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在spark 1.6中将csv读取为数据框 的相关文章

随机推荐

  • 如何以正确的格式将抓取的数据导出到 csv 文件?

    I made an improvement to my code according to this suggestion from paultrmbrth what i need is to scrape data from pages
  • 我想知道为什么用向量可以成功而用数组却不行?

    这成功了 include
  • 从 Visual Studio 2019 中替换 WiX 变量

    我正在努力本地化我在 WiX 工具集中制作的安装程序 并尝试根据生成的 msi 更改我的许可协议 如果 msi 来自调试中的 en us 文件夹 那么它应该是英语 如果位于 fr fr 文件夹中 则应该是法语 我目前分别有英语和法语的两个许
  • 获取 RTI DDS 上 DataWriter/Publisher 的 IP 地址?

    我在用RTI DDS 5 2 3 17并想获取该设备的 IP 地址DataWriter Publisher添加到一些日志消息 我该如何去做呢 我在形成做什么的逻辑时遇到了一些困难 无法以标准化方式访问 DataWriter 的 IP 地址
  • 不使用多部分httppost方法在android中发布图像文件

    这个问题借用自同样的问题 因为我遇到了一些问题 在服务器端发布图像期间 图像详细信息无法进入服务器端 像这样 无法发布图像文件信息php服务器 用户ID正常但图像文件信息无法发布 在这种情况下 图像在服务器上保存成功 我无法获取图像的php
  • 如何保护ajaxRequest.open php脚本

    我是使用 AJAX 的新手 我只是按照教程使用 AJAX 从数据库中检索一些信息并将其输出到页面上 有一行我调用了一个 php 脚本 这是进行数据库查询的地方 并且结果被回显 我有点担心 由于文件名在前端可见 并且它的唯一目的是直接输出数据
  • 使用 EnumDisplayDevices 获取显示器的名称

    我碰到this帖子中有人想使用 EnumDisplayDevices 找出他们的显示器的名称 这正是我想要的 我尝试在 C 中做类似的事情 但对 EnumDisplayDevices 的第二次调用似乎永远不会返回任何内容 我只获取有关显卡的
  • Genie 中嵌套泛型类型的语法是什么?

    我想声明一个哈希表string因为它是关键并且array of int因为它的价值 indent 4 init var h new HashTable of string array of int str hash str equal h
  • CSS 样式表未加载

    这是最愚蠢的问题 但我不知道为什么我找不到问题 下面是代码 但 css 文件未加载 section a href class btn btn primary Hello a section
  • Tensorflow,如何访问 RNN 的所有中间状态,而不仅仅是最后一个状态

    我的理解是tf nn dynamic rnn返回 RNN 单元 例如 LSTM 在每个时间步的输出以及最终状态 如何访问所有时间步骤中的细胞状态 而不仅仅是最后一个时间步骤 例如 我希望能够对所有隐藏状态进行平均 然后在后续层中使用它 以下
  • 使用 DataFrame 按组计算 Python Spark 累积和

    如何专门使用以下方法计算每组的累积总和DataFrame abstraction 并在PySpark 示例数据集如下 df sqlContext createDataFrame 1 2 a 3 2 a 1 3 b 2 2 a 2 3 b t
  • 在 Windows 中获取鼠标光标下的单词

    大家好 我和一个朋友正在讨论一个新项目的可能性 一个翻译程序 只要你将鼠标悬停在任何控件中的任何单词上 甚至是静态的 不可编辑的单词上 就会弹出翻译 我知道有很多浏览器插件可以在网页上执行此类操作 我们正在考虑如何在系统范围内 在 Wind
  • Q3DScatter --> 如何将不同颜色的点添加到点云中

    我在 Qt 中编写了一个程序 它使用 Q3DScatter 可视化处理后的点云 3D 点 现在我想添加具有不同颜色的计算关键点 那可能吗 有哪位男孩有这方面的经验吗 下面您可以看到代码部分 其中点云被添加到数据数组中 QScatterDat
  • 禁用元素的 NumericUpDown 背景颜色更改

    在我的 winform 应用程序上 我尝试对所需字段进行颜色编码 在用户编辑时 当必填字段被填写时 背景变为浅绿色 如果必填字段为空 则背景为红色 某些字段的启用和禁用取决于其他字段中的输入 因此有时我需要禁用字段 并且应该完全禁用该字段
  • 我如何使用 BoxLayout 来做到这一点?

    我已经完美地设置了菜单 中心框 但我不知道如何放置标签 目前发生的情况是标签位于菜单选项下方 并且菜单选项被推到右侧 Here is what I want to happen And here is what is happening 目
  • 为什么使用多列作为主键(复合主键)

    这个例子是采取来自 w3schools CREATE TABLE Persons P Id int NOT NULL LastName varchar 255 NOT NULL FirstName varchar 255 Address v
  • UWP - 未找到 PhoneLine 类 [重复]

    这个问题在这里已经有答案了 我正在尝试通过我的应用程序拨打电话 我应该使用PhoneLine来自命名空间Windows ApplicationModel Calls But PhoneLine不在Windows ApplicationMod
  • Java 枚举 - 自定义名称

    我想要一个值为整数的 Java 枚举 例如 public enum TaskStatus TaskCreated 1 TaskDeleted 2 但我也想要这两个常量的自定义名称 例如例如 任务已创建 和 任务已删除 其中有空格 我想尽可能
  • jQuery 中 :hidden 和 :not(:visible) 之间的区别

    我知道两个 jQuery 选择器都匹配不可见的元素 width or height等于0 display none 父级与display none 我相信这意味着它们应该产生相同的结果the docs 出于可读性的原因 我宁愿使用 hidd
  • 在spark 1.6中将csv读取为数据框

    我有 Spark 1 6 并尝试读取 csv 或 tsv 文件作为数据帧 以下是我采取的步骤 scala gt val sqlContext new org apache spark sql SQLContext sc scala gt i