我有一个缓冲区,我映射到要发送的顶点属性。这是代码的基本功能:
glBindBuffer(GL_ARRAY_BUFFER, _bufferID);
_buffer = (VertexData*)glMapBuffer(GL_ARRAY_BUFFER, GL_WRITE_ONLY);
for(Renderable* renderable : renderables){
const glm::vec3& size = renderable->getSize();
const glm::vec3& position = renderable->getPosition();
const glm::vec4& color = renderable->getColor();
const glm::mat4& modelMatrix = renderable->getModelMatrix();
glm::vec3 vertexNormal = glm::vec3(0, 1, 0);
_buffer->position = glm::vec3(modelMatrix * glm::vec4(position.x, position.y, position.z, 1));
_buffer->color = color;
_buffer->texCoords = glm::vec2(0, 0);
_buffer->normal = vertexNormal;
_buffer++;
}
然后我在一个绘制调用中绘制所有可渲染对象。我很好奇为什么触摸_buffer
变量会导致程序大量减速。例如,如果我每帧调用一次std::cout << _buffer->position.x;
,我的fps就会下降到通常水平的1/4。
我想知道为什么会这样。我想知道的原因是因为我希望能够在移动批处理对象时为其提供翻译对象。本质上,我希望缓冲区始终位于同一位置而不更改,但是我可以在不牺牲性能的情况下进行更改。我认为这是不可能的,但我想知道为什么。这是一个示例,如果没有引起大问题,我想怎么做:
if(renderables.at(index)->hasChangedPosition())
_buffer+=index;
_buffer->position = renderables.at(index)->getPosition();
我知道我可以通过着色器统一发送转换,但是您不能在一个绘制调用中对批量对象执行此操作。
为什么完全触摸_buffer变量会导致程序严重减速
...嗯,您did请求一个GL_WRITE_ONLY
缓冲区; GL驱动程序完全有可能使用自定义的错误处理程序来设置支持glMapBuffer()
返回的指针的内存页,而该错误处理程序实际上会出到GPU来获取请求的字节,这可能...不是很快。
如果您仅对提供的地址进行写入,则驱动程序/ OS在glUnmapBuffer()
调用之前无需执行任何操作,此时,它可以建立良好的快速DMA传输以爆发新的一口气将内容缓冲到GPU内存中。