Hadoop：java.lang.ClassCastException：org.apache.hadoop.io.LongWritable 无法转换为 org.apache.hadoop.io.Text

2024-03-22

我的程序看起来像

public class TopKRecord extends Configured implements Tool {

    public static class MapClass extends Mapper<Text, Text, Text, Text> {

        public void map(Text key, Text value, Context context) throws IOException, InterruptedException {
            // your map code goes here
            String[] fields = value.toString().split(",");
            String year = fields[1];
            String claims = fields[8];

            if (claims.length() > 0 && (!claims.startsWith("\""))) {
                context.write(new Text(year.toString()), new Text(claims.toString()));
            }
        }
    }
   public int run(String args[]) throws Exception {
        Job job = new Job();
        job.setJarByClass(TopKRecord.class);

        job.setMapperClass(MapClass.class);

        FileInputFormat.setInputPaths(job, new Path(args[0]));
        FileOutputFormat.setOutputPath(job, new Path(args[1]));

        job.setJobName("TopKRecord");
        job.setMapOutputValueClass(Text.class);
        job.setNumReduceTasks(0);
        boolean success = job.waitForCompletion(true);
        return success ? 0 : 1;
    }

    public static void main(String args[]) throws Exception {
        int ret = ToolRunner.run(new TopKRecord(), args);
        System.exit(ret);
    }
}

数据看起来像

"PATENT","GYEAR","GDATE","APPYEAR","COUNTRY","POSTATE","ASSIGNEE","ASSCODE","CLAIMS","NCLASS","CAT","SUBCAT","CMADE","CRECEIVE","RATIOCIT","GENERAL","ORIGINAL","FWDAPLAG","BCKGTLAG","SELFCTUB","SELFCTLB","SECDUPBD","SECDLWBD"
3070801,1963,1096,,"BE","",,1,,269,6,69,,1,,0,,,,,,,
3070802,1963,1096,,"US","TX",,1,,2,6,63,,0,,,,,,,,,
3070803,1963,1096,,"US","IL",,1,,2,6,63,,9,,0.3704,,,,,,,
3070804,1963,1096,,"US","OH",,1,,2,6,63,,3,,0.6667,,,,,,,

运行该程序时，我在控制台上看到以下内容

12/08/02 12:43:34 INFO mapred.JobClient: Task Id : attempt_201208021025_0007_m_000000_0, Status : FAILED
java.lang.ClassCastException: org.apache.hadoop.io.LongWritable cannot be cast to org.apache.hadoop.io.Text
    at com.hadoop.programs.TopKRecord$MapClass.map(TopKRecord.java:26)
    at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:144)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:764)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:370)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)
    at org.apache.hadoop.mapred.Child.main(Child.java:249)

我相信类类型已正确映射，类映射器 http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/mapreduce/Mapper.html,

请让我知道我在这里做错了什么？

当您使用 M/R 程序读取文件时，映射器的输入键应该是文件中该行的索引，而输入值将为整行。

所以这里发生的事情是你试图将行索引作为Text对象是错误的，你需要一个LongWritable相反，Hadoop 不会抱怨类型。

试试这个：

public class TopKRecord extends Configured implements Tool {

    public static class MapClass extends Mapper<LongWritable, Text, Text, Text> {

        public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
            // your map code goes here
            String[] fields = value.toString().split(",");
            String year = fields[1];
            String claims = fields[8];

            if (claims.length() > 0 && (!claims.startsWith("\""))) {
                context.write(new Text(year.toString()), new Text(claims.toString()));
            }
        }
    }

    ...
}

另外，您可能需要重新考虑代码中的一件事，即您正在创建 2Text您正在处理的每条记录的对象。您应该只在开始时创建这两个对象，然后在映射器中使用set方法。如果您要处理大量数据，这将为您节省大量时间。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Hadoop

MapReduce

Hadoop：java.lang.ClassCastException：org.apache.hadoop.io.LongWritable 无法转换为 org.apache.hadoop.io.Text 的相关文章

使用 JPA Criteria API 进行分页的总行数

我正在系统中为实体实现高级搜索功能以便用户可以使用该实体的属性上的多个条件 eq ne gt lt 等来搜索该实体我正在使用 JPA 的 Criteria API 动态生成 Criteria 查询然后使用setFirstResu
是什么决定了从 lambda 创建哪个函数式接口？

请考虑这个例子 import java util function Consumer public class Example public static void main String args Example example new
OpenCV 中的 Gabor 内核参数

我必须在我的应用程序中使用 Gabor 过滤器但我不知道这个 OpenCV 方法参数值我想对虹膜进行编码启动 Gabor 过滤器并获取特征我想对 12 组 Gabor 参数值执行此操作然后我想计算 Hamming Dystans
如何使用 Java 处理 Selenium WebDriver 中的新窗口？

这是我的代码 driver findElement By id ImageButton5 click Thread sleep 3000 String winHandleBefore driver getWindowHandle drive
OSGi：如果不取消服务会发生什么

这是我获取 OSGi 服务的方式 ServiceReference reference bundleContext getServiceReference Foo class getName Foo foo Foo bundleContex
画透明圆，外面填充

我有一个地图视图我想在其上画一个圆圈以聚焦于给定区域但我希望圆圈倒转也就是说圆的内部不是被填充而是透明的其他所有部分都被填充请参阅这张图片了解我的意思 http i imgur com zxIMZ png 上半部分显示了我可以
在 Netbeans 8 上配置 JBoss EAP 的问题

我已经下载了 JBoss EAP 7 并正在 Netbeans 8 上配置它我已经到达向导实例属性其中要求从选择框中选择域当我打开选择框时它是空的没有什么可以选择的因此完成按钮也处于非活动状态这使得无法完成配置我通过
如何使用 Maven 打包并运行具有依赖项的简单命令行应用程序？

我对 java 和 Maven 都是全新的所以这可能非常简单如果我遵循maven2hello world此处的说明 http maven apache org guides getting started maven in Five m
很好地处理数据库约束错误

再一次它应该很简单我的任务是在我们的应用程序的域对象中放置一个具有唯一约束的特定字段这本身并不是一个很大的挑战我刚刚做了以下事情 public class Location more fields Column unique tru
普罗米修斯指标 - 未找到

我有 Spring Boot 应用程序并且正在使用 vertx 我想监控服务和 jvm 为此我选择了 Prometheus 这是我的监控配置类 Configuration public class MonitoringConfig Bea
如何在 Java 中测试一个类是否正确实现了 Serialized（不仅仅是 Serialized 的实例）

我正在实现一个可序列化的类因此它是一个与 RMI 一起使用的值对象但我需要测试一下有没有办法轻松做到这一点澄清我正在实现该类因此在类定义中添加 Serialized 很简单我需要手动序列化反序列化它以查看它是否有效我找到了
编辑文件名在 JComboBox 中的显示方式，同时保持对文件的访问

我对 Java 很陌生对堆栈溢出也很陌生我正在尝试利用 JMF API 创建一个用 Java 编码的简单媒体播放器到目前为止我已经能够设置一个简单的队列播放列表来使用JComboBox called playListHolder
Java整数双除法混淆[重复]

这个问题在这里已经有答案了方案1 int sum 30 double avg sum 4 result is 7 0 not 7 5 VS 方案2 int sum 30 double avg sum 4 0 Prints lns 7 5
如何知道抛出了哪个异常

我正在对我们的代码库进行审查有很多这样的陈述 try doSomething catch Exception e 但我想要一种方法来知道 doSomething 抛出了哪个异常在 doSomething 的实现中没有 throw 语句
Struts 2 + Sitemesh 3 集成 - FreemarkerDecoratorServlet 中的 NPE

我将 Struts 2 版本 2 3 14 3 与 Sitemesh 3 版本 3 0 alpha 2 一起使用并且在某些情况下遇到 NullPointerException 首先这是我的 web xml 中的 struts2 site
Netty：阻止调用以获取连接的服务器通道？

呼吁ServerBootstrap bind 返回一个Channel但这不是在Connected状态因此不能用于写入客户端 Netty 文档中的所有示例都显示写入Channel从它的ChannelHandler的事件如channelCon
javafx android 中的文本字段和组合框问题

我在简单的 javafx android 应用程序中遇到问题问题是我使用 gradle javafxmobile plugin 在 netbeans ide 中构建了非常简单的应用程序其中包含一些文本字段和组合框我在 android
如何使用 JSch 将多行命令输出存储到变量中

所以我有一段很好的代码我很难理解它允许我向我的服务器发送命令并获得一行响应该代码有效但我想从服务器返回多行主要类是 JSch jSch new JSch MyUserInfo ui new MyUserInfo String
hashcode 的默认实现为以相同方式构造的对象返回不同的值

我在这里编写一个示例代码 public class Test private int i private int j public Test TODO Auto generated constructor stub public Test
如何从 Maven 存储库引用本机 DLL？

如果 JAR 附带 Maven 存储库中的本机 DLL 我需要在 pom xml 中放入什么才能将该 DLL 放入打包中更具体地举个例子Jacob http search maven org artifactdetails 7Cnet s

随机推荐

广播时不支持回调

在这里我遇到了使用 nodejs 在 socket io 中进行回调的一个问题 io sockets to usersocketid emit receivemsg success 1 data message function deli
了解如何正确处理 C++ 类常量

考虑以下 namespace MyNamespace class MyClass public Public area private Private area protected Protected area Class Namespac
如何加载位于 .NET Core 控制台应用程序文件夹中的程序集

我正在 NET Core 平台上制作一个控制台应用程序并且想知道如何加载程序集 dll 文件并使用 C 动态功能实例化类它看起来与 NET 4 X 有很大不同并且没有真正记录下来例如假设我有一个类库 NET Core 它只有一个
使用 Python 模拟 Xbox 控制器输入

我希望我的 python 程序能够模拟 Xbox 控制器输入如果可能的话模拟拇指杆和开关按钮我找到了有关在 python 中使用 ctypes 模拟键盘输入的主题例如这里 Python 模拟 keydown https stack
通过 powershell 从 txt 文件中获取今天日期的特定文本

我有一个文本文件与此类似 This is a sample data This is a sample data This is a sample data Sat Jun 06 08 17 01 2015 WARNING Cannot
MySQL 中的 SELECT 整数范围。例如。 1,2,3,4,...,n;

我需要在 MySQL 中选择整数范围像这样的东西 SELECT RANGE 10 20 AS range returns 10 11 12 13 14 20 Why 我想从尚未注册的范围中选择随机电话号码这是想法 SELECT RANG
控制Android的默认音乐播放器或任何其他音乐播放器

如何控制android或任何其他播放器的默认音乐播放器我所说的控制是指暂停播放下一个等我是否必须绑定服务我尝试过使用IMediaPlaybackService但它不起作用肯定有一条出路因为我在安卓市场上看到过控制音乐播放器的应
NSString 字体大小特定于框架宽度

我在用drawRect对于文本显示调用NSString 我正在尝试使用sizeWithFont自动调整字体大小缩小默认字体大小为 17 如果不适合宽度大小则使用循环将字体大小减小 1 谁能帮助我如何实现这个现在的例子就很好了我只
找不到 id=1 的用户

I ve a current user处理身份验证的方法应用程序控制器 rb protect from forgery helper method current user def current user current user Us
如何在使用 webdriver 查找元素时在 xpath 中使用撇号 (')？

我需要在 xpath 表达式中使用撇号我需要在使用 webdriver 查找元素时使用它我需要使用下面的 Xpath 表达式 input text WE d like to hear from you 在查找元素函数中使用上述表达式时
如何清除 Internet Explorer 8 中的本地存储值

我使用 IE8 和 jstorage 库来存储数据来代替 cookie 这一切都很好直到我想清除存储的值在 Chrome 中可以通过导航到内容设置页面来实现此操作然而在 IE8 中它仅提供清除 cookie 的选项而不会清除我
在 C# 中使用可选参数从 Web 引用调用 WebMethod

我使用 Net Webservices 创建了一个带有 2 个可选参数的虚拟 Web 服务但是在实际产品中我们将有更多可选参数想想查询过滤器问题在于在调用 Web 服务时不可能省略可选参数这意味着在针对实际 Web 服务进行开
在 Visual Studio 中输入 Unicode 数据，C#

有没有在 C 文件中键入 Unicode 符号的好方法我正在寻找具有以下效果的东西按 ALT 键类型 Unicode 十六进制释放 Alt 目前我必须将符号输入到 word 中并将其复制粘贴到我的源文件中 uFFFF UFFFFF
ReactJS 和 Typescript ：指的是一个值，但在这里被用作类型（TS2749）

我正在 tsx 文件中使用 Typescript 和 Material ui 编写 ReactJS 类在我的自定义组件之一中我想创建对我在自定义组件中使用的组件之一的引用 export class MyTextField extends
查找尝试连接 ServerSocket 的程序的 IP

尽管我进行了搜索但找不到答案假设我有以下 Java 代码 ServerSocket serve null try server new ServerSocket 5567 catch IOException e System err p
如何禁用 Firebase Phone Auth Android 自动登录（onVerificationCompleted 回调）

有没有办法使用 Firebase Phone Auth 禁用 Android 即时验证自动登录有一种方法可以通过将 verifyPhoneNumber 的超时设置为 0 来禁用自动检索参考 https firebase google
如何更改通过运行批处理脚本创建的新 cmd 窗口（以及自定义提示）的颜色

我已经知道如何从具有自定义颜色的批处理脚本创建新的 cmd 窗口以及具有自定义提示的新 cmd 窗口然而我想找到一种将两者结合在一起的方法以下是我在批处理文件中创建带有自定义提示的新 cmd 窗口的内容在本例中自定义提示是 Wind
如何记录 Delphi 中引发的异常？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我经常调用一个函数Foo并想知道这个函数可能会抛出什么异常为了找出答案我然后研究了实施Foo 但这还不够 Foo确实可能调用一个函数Bar这
R 参考手册和文档中使用 roxygen2 的章节

有一次我看到一个支持 R 程序的包其中他的文档和参考手册被分为章节它们是按字母表中的连续字母命名的以便用户可以看到该包提供的功能被分为几组现在我正在尝试做同样的事情我正在使用 roxygen2 包构建包但无法处理该问题 Any1
Hadoop：java.lang.ClassCastException：org.apache.hadoop.io.LongWritable 无法转换为 org.apache.hadoop.io.Text

我的程序看起来像 public class TopKRecord extends Configured implements Tool public static class MapClass extends Mapper

Hadoop：java.lang.ClassCastException：org.apache.hadoop.io.LongWritable 无法转换为 org.apache.hadoop.io.Text

Hadoop：java.lang.ClassCastException：org.apache.hadoop.io.LongWritable 无法转换为 org.apache.hadoop.io.Text 的相关文章

随机推荐

热门标签