我对此很好奇。
我想检查哪个函数更快,所以我创建了一些代码,并执行了很多次。
public static void main(String[] args) {
long ts;
String c = "sgfrt34tdfg34";
ts = System.currentTimeMillis();
for (int k = 0; k < 10000000; k++) {
c.getBytes();
}
System.out.println("t1->" + (System.currentTimeMillis() - ts));
ts = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
Bytes.toBytes(c);
}
System.out.println("t2->" + (System.currentTimeMillis() - ts));
}
"second“循环更快,所以我认为hadoop中的Bytes类比String类中的函数更快。然后,我更改了循环的顺序,然后c.getBytes()变得更快。我执行了很多次,我的结论是,我不知道为什么,但是在第一个代码执行之后,我的VM中发生了一些事情,所以第二个循环的结果变得更快。
发布于 2013-12-18 18:45:46
这是一个典型的java基准测试问题。Hotspot/JIT/etc会在你使用的时候编译你的代码,所以它在运行过程中会变得更快。
首先在循环中运行至少3,000次(在服务器或64位上运行10000次)-然后进行测量。
发布于 2013-12-18 18:57:43
您知道有问题,因为Bytes.toBytes
在内部调用c.getBytes
:
public static byte[] toBytes(String s) {
try {
return s.getBytes(HConstants.UTF8_ENCODING);
} catch (UnsupportedEncodingException e) {
LOG.error("UTF-8 not supported?", e);
return null;
}
}
源代码取自here。这告诉你,调用不可能比直接调用更快--在最好的情况下(即,如果它被内联),它将具有相同的时间。不过,通常情况下,由于调用函数的开销很小,您可能会认为它会稍微慢一点。
这是在带有在任意时间运行的组件的解释型垃圾收集环境中的微基准测试的典型问题。最重要的是,还有一些硬件优化,比如缓存,这就扭曲了局面。因此,了解正在发生的事情的最好方法通常是查看源代码。
发布于 2013-12-18 18:47:08
最有可能的情况是,在第一个循环运行时,代码仍在编译或尚未编译。
将整个方法包装在一个外部循环中,这样您就可以多次运行基准测试,您应该会看到更稳定的结果。
https://stackoverflow.com/questions/20655963
复制相似问题