对于mutex获取-交换循环(或队列获取-加载循环)，是否应该结合内存栅栏，还是应该避免？ - arm - SO中文参考