开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

在Hadoop的MapReducer代码内的ArrayList<String>中".add(StringTokenizer.nextToken())“失败

在Hadoop的MapReducer代码中，如果在ArrayList<String>中使用".add(StringTokenizer.nextToken())"失败，可能是由于以下几个原因：

未正确初始化ArrayList对象：在使用ArrayList之前，需要先实例化一个ArrayList对象，例如：ArrayList<String> list = new ArrayList<String>();
未正确导入StringTokenizer类：在使用StringTokenizer之前，需要确保已经正确导入java.util.StringTokenizer类。
未正确处理StringTokenizer的分隔符：StringTokenizer类用于将字符串按照指定的分隔符进行分割，默认情况下使用空格作为分隔符。如果要按照其他分隔符进行分割，需要在创建StringTokenizer对象时指定分隔符，例如：StringTokenizer tokenizer = new StringTokenizer(inputString, ",");
未正确处理StringTokenizer的hasMoreTokens()方法：在使用StringTokenizer的hasMoreTokens()方法之前，需要使用该方法判断是否还有更多的token可用，例如：while (tokenizer.hasMoreTokens()) { ... }
未正确处理StringTokenizer的nextToken()方法：在使用StringTokenizer的nextToken()方法之前，需要使用该方法获取下一个token，例如：String token = tokenizer.nextToken();

综上所述，如果在Hadoop的MapReducer代码中的ArrayList<String>中使用".add(StringTokenizer.nextToken())"失败，需要确保正确初始化ArrayList对象、导入StringTokenizer类、处理StringTokenizer的分隔符、使用hasMoreTokens()方法判断是否还有更多的token可用，并正确使用nextToken()方法获取下一个token。

相关搜索:Hadoop 2.7 -在HDFS中创建目录的简单Java代码为什么我的javascript代码在代码挑战的性能测试用例中失败了？为什么我的代码在代码块中总是失败？代码不像``Add in或Personal XLSB`那样工作[相同的代码在创建它的工作簿中运行良好]在angular中的*ngIf内引导弹出失败在java 1.4中，将元素添加到haspmap内的arraylist中在JAVA代码的不同部分中多次使用arraylist 在nodejs中调用模块内代码的最佳方法在TableView中显示ArrayList<List<String>>的值(JavaFX)在TFS 2015中的集合内移动源代码项目

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

MapReducer例题-找出有共同好友的user及他们的共同好友

L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,C,D,E,O I:A,O J:B,O K:A,C,D L:D,E,F M:E,F,G O:A,H,I,J 代码如下...; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper...java.net.URI; import java.util.ArrayList; /** * 找出有共同好友的users * * 按题意应该是求出任意两个用户的共同好友 */ public...{ args = new String[3]; args[0] = "hdfs://localhost:9000/mapreducer/0314/data/data.txt... list = new ArrayList(); for (Text value : values) { list.add(value.toString

1K2 0

Hadoop集群搭建Linux环境准备基础配置安装HadoopHA集群安装HIVE安装MySQL安装HBASE安装Flume问题总结

配置JDK jdk-8u171-linux-x64.tar.gz 在/home/hadoop 目录下创建java文件夹 mkdir java 在java 目录内解压安装包 tar -zxvf jdk-8u171...MapReducer可以在任何地方运行程序，访问HDFS上的文件并进行统计运算，并且可以把统计的结果写回HDFS的结果文件中。...输出的就是每个单词出现的次数，这就是一个最简单的MapReducer程序。 HA集群 hadoop的HA集群，即hadoop的高可用集群配置，为了解决hadoop中的NameNode单点故障问题。...这本是一个MapReducer程序做的事情，现在一个SQL就搞定了。Hive中还有很多概念，这里就不做过多结算了。安装MySQL 这里安装MySQL的目的就一个：保存HIVE中的元数据。...zookeeper在hadoop体系中是为了高可用，是为了解决DataNode的单点故障问题；在Hbase中保存了Hbase各个ReginServer和master的信息。

2.7K2 0

equals方法变量和常量位置区别

, s, "10041"); String s6 = stringtokenizer.nextToken(":/"); if (s6.equals("/")) { String...s8 = null; String s10 = null; int k = 0; String s12 = stringtokenizer.nextToken(":");...在找db2 9.7fp11与fp4 jdbc驱动有什么区别的时候，反编译了一下官方驱动jar包，发现里面不少equals方法依然把未知变量放到了equals的左边，已知放到了右边，难道IBM程序员水平这么次么...){ List list=new ArrayList(); String str=null; System.out.println("0".equals(str)); System.out.println...这样可以避免参数是null导致的空指针异常，但是这么写并不能避免括号内变量引用某些方法或者属性导致的空指针，例如 String str=null; System.out.println("0

8152 1

编写WordCount程序之一固定格式讲解

WordCount因果图 MapReduce中 map和reduce函数格式 MapReduce中，map和reduce函数遵循如下常规格式： map: (K1, V1) → list(K2, V2)...wordcount 代码代码编写依据，也就是固定写法 input–>map—>reduce->output 以下java代码实现此命令的功能bin/hdfs dfs jar share/hadoop...workvalue = stringTokenizer.nextToken(); mapoutputKey.set(workvalue);...）----------------- ----------------分组---------------- 将相同key的值合并到一起，...reduceOutputValues); } } 优化MapReduce写法 mapReduce 继承configured类，并实现 Tool接口 tool接口类中的

3751 0

Hadoop使用学习笔记（3）

Hadoop集群环境：第一篇中已经提到，Linux环境的集群。由于我们是跨环境提交任务，所以源代码和配置上多了很多麻烦事。...我们之后把之前Linux上的hadoop拉下来到我们的windows系统中。其实只拉配置目录就行，我们只需要其中的配置文件。我们在IDEA中新建maven工程，比如叫HadoopT。...这里我们先修改Program Aruguments，程序中我们取第一个参数为输入文件夹，第二个为输出。这里我们配置的都在HDFS上。...这样，保证我们在代码中配置的jar永远是最新（这个jar地址就是maven package后生成的jar包地址）的。...之前我们在linux下用的hadoop用户，所以在这里我们设置： System.setProperty("HADOOP_USER_NAME", "hadoop"); 之后，我们在IDEA中运行，输出如下

3031 0

Hive自定义函数UDF、UDTF、UDAF入门

然后我们就可以在”Subdirectory”中写到的目录下去找我们的文件了。...*JAVA代码 package com.hadoop.hivetest.udf; import java.util.ArrayList; import org.apache.hadoop.hive.ql.exec.UDFArgumentException...; } ArrayList fieldNames = new ArrayList(); ArrayList<ObjectInspector...*JAVA代码 package com.hadoop.hivetest.udf; import org.apache.hadoop.hive.ql.exec.UDAF; import org.apache.hadoop.hive.ql.exec.UDAFEvaluator...当我们创建函数之后，得出的结果却不是想要的结果的时候，我们将Java代码修改之后，重新打了包上传过来，也重新加到了hive的classpath中，但是新创建出来的函数得出的结果跟修改之前的一样。

1K1 0

hive学习笔记之十一：UDTF

；重写process方法，该方法中是一进多出的逻辑代码，把每个列的数据准备好放在数组中，执行一次forward方法，就是一行记录； close方法不是必须的，如果业务逻辑执行完毕，可以将释放资源的代码放在这里执行...return ObjectInspectorFactory.getStandardStructObjectInspector(fieldNames, fieldOIs); } } 上述代码中的重点是.../udf/ 在hive会话模式执行以下命令添加本地jar： add jar /home/hadoop/udf/hiveudf-1.0-SNAPSHOT.jar; 部署临时函数： create temporary...，UDTF不能和其他字段同时出现在select语句中，例如以下的SQL会执行失败： select person_name,udf_wordsplitsinglerow(string_field) from...jar /home/hadoop/udf/hiveudf-1.0-SNAPSHOT.jar; 在hive会话模式执行以下命令添加本地jar： add jar /home/hadoop/udf/hiveudf

4172 0

hive学习笔记之十一：UDTF

类型，UDTF生成的每个列的名称和类型都设置到返回值中；重写process方法，该方法中是一进多出的逻辑代码，把每个列的数据准备好放在数组中，执行一次forward方法，就是一行记录； close方法不是必须的...；下图红框中是t16表的一条原始记录的string_field字段，会被udf_wordsplitsinglerow处理： [在这里插入图片描述] 上面红框中的字段被UDTF处理处理后，一列变成了三列...return ObjectInspectorFactory.getStandardStructObjectInspector(fieldNames, fieldOIs); } } 上述代码中的重点是.../udf/ 在hive会话模式执行以下命令添加本地jar： add jar /home/hadoop/udf/hiveudf-1.0-SNAPSHOT.jar; 部署临时函数： create temporary...jar /home/hadoop/udf/hiveudf-1.0-SNAPSHOT.jar; 在hive会话模式执行以下命令添加本地jar： add jar /home/hadoop/udf/hiveudf

8810 0

http代理服务器实现（web cache）

而我在这里使用的是比较熟悉的Java实现。如果同学们有幸搜到了这篇文章，请有限制的借鉴，毕竟课程项目的初衷就是为了让同学们在时间中巩固知识，而不是交差拿高分。...当它作为一个局域网的代理服务器时，如果它的所有缓存都为空，则局域网中所有连接它的主机的DNS请求，HTTP请求都要通过它发往外网中的DNS服务器和web服务器，它获取响应之后再进行缓存并发送回局域网中的客户端...，如果没有缓存或者有更新，则将新的请求转发给浏览器，并将最新的缓存写入本地缓存中。...fileInputStream){ ArrayList result=new ArrayList(); String temp; BufferedReader...findModifyTime(ArrayList cache_temp,String request){ String LastModifiTime=null; int

6653 0

用java程序把本地的一个文件拷贝到hdfs上并显示进度

把程序打成jar包放到Linux上转到目录下执行命令 hadoop jar mapreducer.jar /home/clq/export/java/count.jar... hdfs://ubuntu:9000/out06/count/ 上面一个是本地文件，一个是上传hdfs位置成功后出现：打印出来，你所要打印的字符。...{ //******************************** //把本地的一个文件拷贝到hdfs上 //******************************** public static...void main(String[] args) throws IOException { String localSrc = args[0]; String dst = args[1];...(Native Method) at javax.security.auth.Subject.doAs(Subject.java:415) 说明你这个路径在hdfs上已经存在，换一个即可

1.6K4 0

Hadoop02【架构分析】

三个系统组成，其中YARN是一个资源管理系统，负责集群资源管理和调度，MapReduce则是运行在YARN上的离线处理框架，它与Hadoop 1.0中的MapReduce在编程模型（新旧API）和数据处理引擎...Hadoop2.0为克服Hadoop1.0中的不足进行了下面改进：针对Hadoop1.0单NameNode制约HDFS的扩展性问题，提出HDFS Federation，它让多个NameNode分管不同的目录进而实现访问隔离和横向扩展...，同时彻底解决了NameNode单点故障问题；针对Hadoop1.0中的MapReduce在扩展性和多框架支持等方面的不足，它将JobTracker中的资源管理和作业控制分开，分别由ResourceManager...MapReducer2.0 MapReducer2.0具有与1.0相同的编程模型和数据处理引擎，唯一不同的是运行时环境。...MRv2是在MRv1基础上经加工之后，运行于资源管理框架Yarn之上的计算框架MapReduce。

7227 0

分布式改造剧集三：Ehcache分布式改造

之所以使用自定义的类，是为了在初始化的时候发布的地址和端口，监听的地址端口可以在配置文件配置。...为空，则读取配置文件(app-config.properties)中的值 if (StringUtils.isEmpty(hostName)) { String...()) { String providerAddress = stringTokenizer.nextToken(); providerAddress =...(cacheNames, CACHENAME_DELIMITER); List cacheNameList = new ArrayList(stringTokenizer.countTokens...()); while (stringTokenizer.hasMoreTokens()) { String cacheName = stringTokenizer.nextToken

1.2K4 0

进击消息中间件系列（六）：Kafka 消费者Consumer

消费者API 独立消费者案例（订阅主题） 1、需求创建一个独立的消费者，消费first主题中的数据注意：在消费者API代码中必须配置消费者组id。... startegys=new ArrayList(); startegys.add("org.apache.kafka.clients.consumer.StickyAssignor...ArrayList topics=new ArrayList(); topics.add("first"); kafkaConsumer.subscribe...消费者组案例 1、需求：测试同一个主题的分区数据，只能由一个消费者组中的一个消费 2、案例实操（1）复制一份基础消费者的代码，在 IDEA 中同时启动，即可启动同一个消费者组中的两个消费者。...（2）启动代码中的生产者发送消息，在 IDEA 控制台即可看到两个消费者在消费不同分区的数据（如果只发生到一个分区，可以在发送时增加延迟代码 Thread.sleep(2);）（3）重新发送到一个全新的主题中

6614 1

Spring Security权限注解

; import java.util.Collection; import java.util.List; import java.util.StringTokenizer; /** * 该类返回的是安全的...，能够提供给用户看到的信息，即脱敏后的信息 * * @author huan * @date 2021/...stringTokenizer.hasMoreTokens()) { UserRole userRole = new UserRole(); userRole.setCode(stringTokenizer.nextToken...()); roleList.add(userRole); } } } /** * 普通用户...SimpleGrantedAuthority authority = new SimpleGrantedAuthority(role.getCode()); authorities.add

1233 0

ZooKeeper学习

5、数据更新原子性，一次数据更新要么成功，要么失败 6、实时性，在一定时间范围内，client能读到最新数 3.2 zookeeper数据结构 1、层次化的目录结构，命名符合常规文件系统规范... 2、每个节点在zookeeper中叫做znode,并且其有一个唯一的路径标识 3、节点Znode可以包含数据和子节点（但是EPHEMERAL类型的节点不能有子节点，下一页详细讲解...，由父节点维护 4、在分布式系统中，顺序号可以被用于为所有的事件进行全局排序，这样客户端可以通过顺序号推断事件的顺序 3.4 zookeeper命令行操作运行zkCli.sh...> list2 = zkClient.getChildren(parentName, true); ArrayList serverList = new ArrayList();...serverList.add(new String(data)); } list = serverList; System.out.println(list); } public

5736 1

Hbase Bulkload 原理｜面试必备

MapReduce 实现一 MapReducer 程序中各个组件的实现类，如下所示： InputFormat 类：TextInputFormat，数据输出格式 LongWritable，Text（数据所在行号...处理完一批数据之后，会写入（null，null）这一条特殊的数据，表示 HFileOutputFormat2 在持久化的过程中，需要新创建一个 HFile。...MapReduce 实现二 MapReducer 程序中各个组件的实现类，如下所示： InputFormat 类：TextInputFormat，数据输出格式 LongWritable，Text（数据所在行号...这里讲下PutSortReducer的具体实现，下面的代码经过简化，去掉了KeyValue中关于Tag的处理： public class PutSortReducer extends Reducer... singleTableInfo = new ArrayList(); singleTableInfo.add(new TableInfo(tableDescriptor

2.2K1 0

Flink SQL FileSystem Connector 分区提交与自定义小文件合并策略

PartitionCommitTrigger 在最新的 Flink SQL 中，FileSystem Connector 原生支持数据分区，并且写入时采用标准 Hive 分区格式，如下所示。...可见，process-time trigger 无法应对处理过程中出现的抖动，一旦数据迟到或者程序失败重启，数据就不能按照事件时间被归入正确的分区了。...*一系列参数来指定抽取分区时间的规则（PartitionTimeExtractor），官方文档说得很清楚，不再赘述。在源码中，PartitionCommitTrigger 的类图如下。...下面以分区时间触发的 PartitionTimeCommitTrigger 为例，简单看看它的思路。直接上该类的完整代码。...这也说明开启检查点是分区提交机制的前提。snapshotState() 方法用于将这些信息保存到状态中。这样在程序 failover 时，也能够保证分区数据的完整和正确。

1.8K1 0

Flink SQL FileSystem Connector 分区提交与自定义小文件合并策略

PartitionCommitTrigger 在最新的 Flink SQL 中，FileSystem Connector 原生支持数据分区，并且写入时采用标准 Hive 分区格式，如下所示。...可见，process-time trigger 无法应对处理过程中出现的抖动，一旦数据迟到或者程序失败重启，数据就不能按照事件时间被归入正确的分区了。...*一系列参数来指定抽取分区时间的规则（PartitionTimeExtractor），官方文档说得很清楚，不再赘述。在源码中，PartitionCommitTrigger 的类图如下。 ?...下面以分区时间触发的 PartitionTimeCommitTrigger 为例，简单看看它的思路。直接上该类的完整代码。...这也说明开启检查点是分区提交机制的前提。snapshotState() 方法用于将这些信息保存到状态中。这样在程序 failover 时，也能够保证分区数据的完整和正确。

2.3K2 0

关于 hadoop reduce 阶段遍历 Iterable 的 2 个“坑”

还是用代码说话： package com.test; import java.util.ArrayList; import java.util.Iterator; import java.util.List...> valList = new ArrayList(); List textList = new ArrayList(); String strAdd;...最后想说明的是：hadoop 框架的作者们真的是考虑很周全，在 hadoop 框架中，不仅有对象重用，还有 JVM 重用等，节约一切可以节约的资源，提高一切可以提高的性能。...PS：我的代码是在 Eclipse 中远程调试的，所以 reduce 是没有写 hdfs 的，直接在 eclipse 终端上可以看到结果，很方便，关于怎么在 windows 上远程调试 hadoop...hadoop中迭代器的对象重用问题 http://paddy-w.iteye.com/blog/1514595 关于 hadoop 中 JVM 重用和对象重用的介绍 http://wikidoop.com

1.1K6 0

Hive自定义函数的使用——useragent解析

想要从日志数据中分析一下操作系统、浏览器、版本使用情况，但是hive中的函数不能直接解析useragent,于是可以写一个UDF来解析。...,叫做useragentutils.jar来处理，但是不能直接引入这个包，因为Hadoop和hive都不支持直接引用第三方的包，要导入源码。...项目结构应该如下图下面的代码用来打印出操作系统、浏览器版本信息： import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text...ua.getBrowser()+"\t"+ua.getBrowserVersion()); return new Text(builder.toString()); } } 使用：打成jar包，hive中add...a parameter"); } ArrayList fieldNames = new ArrayList(); ArrayList<ObjectInspector

7442 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭