Hadoop:如何在配置中保存Map对象

2024-04-04

知道如何将 Map 对象设置到 org.apache.hadoop.conf.Configuration 中吗?


将您的地图序列化为 JSON,然后将其作为字符串放入您的配置中。 无法将整个对象放入其中,因为整个配置将被写入 XML 文件。

GSON 非常擅长:http://code.google.com/p/google-gson/ http://code.google.com/p/google-gson/这是有关如何序列化集合的教程:http://sites.google.com/site/gson/gson-user-guide#TOC-Collections-Examples http://sites.google.com/site/gson/gson-user-guide#TOC-Collections-Examples

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop:如何在配置中保存Map对象 的相关文章

  • InvalidRequestException(为什么:empid 如果包含 Equal,则不能被多个关系限制)

    这是关于我从 Apache Spark 查询 Cassandra 时遇到的问题 Spark 的正常查询工作正常 没有任何问题 但是当我使用关键条件进行查询时 出现以下错误 最初 我尝试查询复合键列族 它也给出了与下面相同的问题 由以下原因引
  • Sqoop - 绑定到 YARN 队列

    因此 使用 MapReduce v2 您可以使用绑定到某些 YARN 队列来管理资源和优先级 基本上通过使用 hadoop jar xyz jar D mapreduce job queuename QUEUE1 input output
  • 处理 oozie 工作流程中的循环

    我有一个 oozie 用例 用于检查输入数据可用性并根据数据可用性触发 MapReduce 作业 所以我编写了一个 shell 脚本来检查输入数据 并在 oozie 中为其创建了一个 ssh 操作 输入数据检查的重试次数和重试间隔应该是可配
  • Pig 10.0 - 将元组分组并在 foreach 中合并包

    我在用着Pig 10 0 我想在 foreach 中合并包 假设我有以下内容visitors alias a b 1 2 3 4 a d 1 3 6 a e 7 z b 1 2 3 我想对第一个字段上的元组进行分组 并将包与一组语义合并以获
  • 如何跟踪hadoop中哪个数据块在哪个数据节点?

    如果复制一个数据块 会复制到哪个数据节点 是否有任何工具可以显示复制块存在的位置 如果您知道文件名 则可以通过 DFS 浏览器查找 转到您的 namenode Web 界面 说 浏览文件系统 并导航到您感兴趣的文件 在页面底部 将列出文件中
  • Apache hadoop 版本 2.0 与 0.23

    Hadoop 的版本和发行版太多 让我很困惑 我有几个问题 Apache Hadoop 1 x 是从 0 20 205 开始的 Apache Hadoop 2 0 是从 0 22 还是 0 23 开始 根据这个blogpost http b
  • java.io.IOException: EnsureRemaining: 仅剩余 0 个字节,尝试读取 1

    我在 giraph 中的自定义类方面遇到一些问题 我制作了 VertexInput 和 Output 格式 但总是收到以下错误 java io IOException ensureRemaining Only bytes remaining
  • Spark on Hive SQL 查询错误 NoSuchFieldError: HIVE_STATS_JDBC_TIMEOUT

    针对 Hive 2 1 0 提交 Spark 1 6 0 SQL 应用程序时出现错误 Exception in thread main java lang NoSuchFieldError HIVE STATS JDBC TIMEOUT a
  • 适用于 Python 3.x 的 Hive 客户端

    是否可以使用 Python 3 x 连接到 hadoop 并运行 hive 查询 我正在使用Python 3 4 1 我发现可以按照这里写的方式完成 https cwiki apache org confluence display Hiv
  • 为什么我们需要将外部表移动到托管 Hive 表?

    我是 Hadoop 新手 正在学习 Hive 在 Hadoop 权威指南第 3 版中 第 12 页 第428章 最后一段 我不明白下面关于 HIVE 中外部表的段落 一种常见的模式是使用外部表访问存储在 HDFS 中的初始数据集 由另一个进
  • 全部配对图表上的所有路径

    这可能是一个没有最佳解决方案的问题 假设我有一个有向图 不知道它是否有循环 循环检测将是这个问题的方面之一 给定一组顶点 可能是数百万个顶点 我需要计算给定图的所有唯一对之间的所有不同路径 没有重复顶点的路径 我该如何应对这种情况 让我们看
  • ETL informatica 大数据版(非云版)可以连接到 Cloudera Impala 吗?

    我们正在尝试在 Informatica 大数据版本 不是云版本 上进行概念验证 我发现我们可能能够使用 HDFS Hive 作为源和目标 但我的问题是 Informatica 是否连接到 Cloudera Impala 如果是这样 我们是否
  • 在 Apache Spark 上下文中,内存数据存储意味着什么?

    我读到 Apache Spark 将数据存储在内存中 然而 Apache Spark 旨在分析大量数据 又称大数据分析 在这种情况下 内存数据存储的真正含义是什么 它可以存储的数据是否受到可用 RAM 的限制 它的数据存储与使用HDFS的A
  • Hive 聚集在多个列上

    据我所知 当配置单元表聚集在一列上时 它会执行该分桶列的哈希函数 然后将该行数据放入其中一个桶中 每个桶都有一个文件 即如果有 32 个桶 那么 hdfs 中就有 32 个文件 将 clustered by 放在多个列上意味着什么 例如 假
  • 将数据从 .txt 文件加载到 Hive 中以 ORC 形式存储的表

    我有一个数据文件位于 txt格式 我正在使用该文件将数据加载到 Hive 表中 当我将文件加载到类似表中时 CREATE TABLE test details txt visit id INT store id SMALLINT STORE
  • Hadoop - 直接从 Mapper 写入 HBase

    我有一个 hadoop 作业 其输出应写入 HBase 我并不真正需要减速器 我想要插入的行类型是在映射器中确定的 如何使用 TableOutputFormat 来实现此目的 从所有示例中 我看到的假设是 reducer 是创建 Put 的
  • AWS EMR 引导操作为 sudo

    我需要更新 etc hosts适用于我的 EMR 集群 EMR AMI 4 3 中的所有实例 整个脚本无非就是 bin bash echo e ip1 uri1 gt gt etc hosts echo e ip2 uri2 gt gt e
  • 如何修复“任务尝试_201104251139_0295_r_000006_0 未能报告状态 600 秒”。

    我编写了一个 MapReduce 作业来从数据集中提取一些信息 该数据集是用户对电影的评分 用户数量约25万 电影数量约30万 地图的输出是
  • 通过Oozie命令行指定多个过滤条件

    我正在尝试通过命令行搜索一些特定的 oozie 作业 我使用以下语法进行相同的操作 oozie jobs filter status RUNNING status KILLED 但是 该命令仅返回正在运行的作业 而不是已杀死的作业 需要帮助
  • Spark中如何获取map任务的ID?

    Spark中有没有办法获取map任务的ID 例如 如果每个映射任务都调用用户定义的函数 我可以从该用户定义的函数中获取该映射任务的 ID 吗 我不确定您所说的地图任务 ID 是什么意思 但您可以使用以下方式访问任务信息TaskContext

随机推荐

  • 将 Docker 容器连接到网络接口/设备而不是 IP 地址

    经过仔细的研究 测试和摆弄 我只能找到通过从 IP 端口转发来将 Docker 容器连接到给定接口的方法 这可以通过添加来完成 p Host IP Host Port Container Port to a docker run命令 我有一
  • isset、array_key_exists 和 !empty 的解决方法[重复]

    这个问题在这里已经有答案了 在编写 php 代码时 我尝试尽可能多地避免警告 有一个关于数组的问题困扰了我很长一段时间 在处理数组及其值时 我经常在开始 实际工作 之前先检查空值 if array key exists bla array
  • 使用从 STS 分配的令牌来调用 WCF 服务

    我一整天都在盯着这个 但毫无结果 我没有想法 IP STS 处理登录 然后将其传递到 RP STS RP STS 用声明填充令牌 然后传递到网站 这工作正常 我在 IP STS 上有一些 WCF 功能 例如更改密码 重置密码 并且需要访问它
  • 在 Vim 中打开 mac 格式文件的命令行选项

    我有一个 mac 格式的文件 我知道我可以使用 e ff mac更改为正确的文件格式 我想知道的是 当我打开文件时是否可以传递一个命令行选项 以直接使用正确的文件格式打开它 You can使用命令行执行此操作 尝试 vim c set fi
  • 在 ASP.NET MVC4 中将模型绑定到单选按钮?

    我有一个模型 public class SexModel public SexModel this Man Man this Woman Woman this ManId 1 this WomanId 2 this WomanSelecte
  • 在 phpmailer 中添加 HTML 格式

    我正在使用 PHP 邮件程序将在线表单直接发送到电子邮件 我想像这样编辑表格 message p The following request was sent from p message p Name name p br message
  • Docker 容器无法通过反向代理访问其他容器

    我在用着docker compose yml对于背后的几个服务nginx https en wikipedia org wiki NginxUbuntu 上的代理VPS https en wikipedia org wiki Virtual
  • 异步将 stdout/stdin 从嵌入式 python 重定向到 C++?

    我本质上是想为嵌入式 python 脚本编写一个带有输入和输出的控制台界面 按照说明进行操作here http docs python org faq extending html how do i catch the output fro
  • 致命信号 11 (SIGSEGV),代码 1,故障地址 (RenderThread)

    当双击附加到窗口管理器的元素时 我试图停止服务 Override public boolean onTouch View v MotionEvent event switch event getAction case MotionEvent
  • 内容.toggleAnimationClass();不是一个函数

    我有html and css最基本的使用工作正常smoothState js function main smoothState jQuery 然而 即使有了这个基本的实现 如果您选择当前页面的链接 即重新加载页面 你会得到一个空白whit
  • Alamofire 不处理身份验证质询

    使用 Alamofire 我注意到下面的代码没有遇到断点 我建立连接 并收到以下错误 Error Domain NSURLErrorDomain Code 1200 An SSL error has occurred and a secur
  • 如何向联系人添加新字段?

    我想向 ContactsContract 内容提供程序添加自定义字段 我正在尝试构建一个 Voip 应用程序 并希望向其中添加一个 SIP 地址 名称 域 字段 我需要将哪种 MIME 类型与其关联 另外 我想添加一个组地址字段 其中包含组
  • 如果显式给出多维数组,为什么 char[][] = {{...}, {...}} 不可能?

    我经历了this http helpdoco com C C difference between char pointer and char array htm文章 我理解所解释的规则 但我想知道在定义常量多维数组并直接使用给定类型的已知
  • 如何在 OpenGL 中创建廉价的阴影? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有两个模型 A 和 B 以及一个灯 L 我希望模型 A 在模型 B 上投射阴影 我暂时不想考虑阴影体
  • CSS:背景颜色上的背景图像

    如果选择该面板 单击它 我有一个面板 该面板颜色为蓝色 另外 我添加一个小标志 pngimage 到该面板 这表明所选面板之前已经被选择过 因此 如果用户看到例如 10 个面板 其中 4 个有这个小标志 他就知道他之前已经单击过这些面板 到
  • Presto SQL 数据透视(由于缺乏更好的词)数据

    我正在处理 Presto 数据库中的一些课程数据 表中的数据如下所示 student id period score completed 1 2016 Q1 3 Y 1 2016 Q3 4 Y 3 2017 Q1 4 Y 4 2018 Q1
  • 是否可以将 javascript 存储在数据库中?

    我有一个 Web 应用程序的想法 用户可以提交 Javascript 代码 然后可以将其提供给其他用户 我想知道解决这个问题的最佳方法是什么 是否可以将 Javascript 存储在数据库中 然后根据用户的请求将其提供给用户 我还希望能够将
  • 如何实现reactjs全局配置

    我正在尝试遵循这个链接 https stackoverflow com questions 30568796 how to store configuration file and read it using react 30602665
  • 如何在运行时将文件注入到 EXE 中并在程序运行期间引用该文件?

    我希望用户从我的网站下载 exe 其中 下载后同步 将 XML 文件注入到该应用程序中 该 XML 文件包含公钥和签名 如何在下载之前注入文件并在稍后执行期间引用它 理想情况下 我不会使用 shell 来注入文件 而是使用本机 NET ap
  • Hadoop:如何在配置中保存Map对象

    知道如何将 Map 对象设置到 org apache hadoop conf Configuration 中吗 将您的地图序列化为 JSON 然后将其作为字符串放入您的配置中 无法将整个对象放入其中 因为整个配置将被写入 XML 文件 GS