我通过手动而不是直接调用Unsafe.getAndAddInt
方法编写了cas代码(compare_and_set的while循环)。但是,当我使用jmh
测试性能时,尽管我编写的代码与Unsafe
方法的源代码副本相同,但它却显示出很大的性能损失。谁能帮助我,与众不同?预先感谢。
jmh
结果是:
Benchmark Mode Cnt Score Error Units
CASTest.casTest avgt 0.047 us/op
CASTest.manualCasTest avgt 0.137 us/op
源代码为:
package org.sample;
import java.lang.reflect.Field;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.atomic.AtomicInteger;
import org.openjdk.jmh.annotations.Benchmark;
import org.openjdk.jmh.annotations.BenchmarkMode;
import org.openjdk.jmh.annotations.Fork;
import org.openjdk.jmh.annotations.Measurement;
import org.openjdk.jmh.annotations.Mode;
import org.openjdk.jmh.annotations.OutputTimeUnit;
import org.openjdk.jmh.annotations.Scope;
import org.openjdk.jmh.annotations.State;
import org.openjdk.jmh.annotations.Threads;
import org.openjdk.jmh.annotations.Warmup;
import org.openjdk.jmh.infra.Blackhole;
import org.openjdk.jmh.runner.Runner;
import org.openjdk.jmh.runner.RunnerException;
import org.openjdk.jmh.runner.options.Options;
import org.openjdk.jmh.runner.options.OptionsBuilder;
import sun.misc.Unsafe;
/**
* @author Isaac Gao
* @Date 2020/2/20
*/
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.MICROSECONDS)
@State(Scope.Benchmark)
@Threads(2)
@Measurement(iterations = 1, time = 1, timeUnit = TimeUnit.SECONDS)
@Warmup(iterations = 2, time = 1)
@Fork(1)
public class CASTest {
private static Unsafe getUnsafe() {
try {
final Field unsafeField = Unsafe.class.getDeclaredField("theUnsafe");
unsafeField.setAccessible(true);
return (Unsafe) unsafeField.get(null);
} catch (NoSuchFieldException | IllegalAccessException e) {
e.printStackTrace();
}
return null;
}
private static final Unsafe unsafe = getUnsafe();
private static final long valueOffset;
static {
try {
valueOffset = unsafe.objectFieldOffset
(CASTest.class.getDeclaredField("value"));
} catch (Exception ex) { throw new Error(ex); }
}
private volatile int value;
@Benchmark
public void manualCasTest(Blackhole bh) {
int andAddIntManually = getAndAddIntManually(this, valueOffset, 1);
bh.consume(andAddIntManually);
}
@Benchmark
public void casTest(Blackhole bh) {
int andAddInt = unsafe.getAndAddInt(this, valueOffset, 1);
bh.consume(andAddInt);
}
public final int getAndAddIntManually(Object o, long offset, int delta) {
int v;
do {
v = unsafe.getIntVolatile(o, offset);
} while (!unsafe.compareAndSwapInt(o, offset, v, v + delta));
return v;
}
public static void main(String[] args) throws RunnerException {
Options opt = new OptionsBuilder()
.include(CASTest.class.getSimpleName())
.build();
new Runner(opt).run();
}
}
执行的代码不一定与您在源代码中看到的代码匹配。在Does Java JIT cheat when running JDK code?]中已经讨论了复制粘贴代码的类似不匹配性能。
众所周知的方法可能会被特殊的实现代替,无论原始声明是native
还是具有纯Java实现。另请参见What does 'intrinsify' mean in the JVM source code?
[当我们查看JVM源文件vmSymbols.hpp
, line 1031时,我们将看到vmSymbols.hpp
是JVM已知的。
您可以使用sun.misc.Unsafe.getAndAddInt
-XX:CompileCommand=print,CASTest.casTest
检查生成的本机代码(通常是评估基准测试结果的一个好主意)。
在X64上,您会看到-XX:CompileCommand=print,CASTest.manualCasTest
会像您编写的一样被编译,一个循环围绕一个manualCasTest
指令,而lock cmpxchg dword ptr [rsi],ebx
承载单个循环casTest
指令(细节可能有所不同)。