这将继续解决这个问题,当我尝试解析 pdf 中的 Form Xobjects 时,我在 adobe 中打开它时遇到了一些错误。
源文件在这里。
在 Form Xobject 提取之后这个 pdf 有一些问题。
但是,我验证了内容流,它在提取后没有呈现完整的内容流。由于某种原因,它坏了。在将内容流写入页面时,整页操作符就在那里。渲染后它丢失了一些标记,如下图所示。
但同样的方式(如上述问题中的编码)我在其他 pdf 中提取 Xobjects 的工作但不是在这里。我错过了什么吗?
您的模式重命名代码有误。
将表单 XObject 内容流嵌入页面内容流时,您尝试重命名 XObject 的资源以防止名称冲突。但是,如果是模式资源,您在内容流中的后续重命名是不正确的,您重命名模式颜色空间的标识符而不是实际模式。
例如嵌入时
/Pattern cs
/P50 scn
你改成
/Pattern_Fm1 cs
/P50 scn
虽然你应该把它改成
/Pattern cs
/P50_Fm1 scn