docx 相关问题

`.docx`是使用默认格式的Microsoft Word 2007或更高版本创建的文件的文件扩展名。

排除时间戳的正则表达式模式

我有以下文字: 宇宙大师 (2023 年 7 月 26 日 - 下午 1:00) (受访者:玛丽娜) (00:00:05 - 00:00:09) 爱丽丝:这个项目。呃,我的工作就是问很多问题。\...

回答 1 投票 0

通过 Angular 应用程序上传 .docx .pdf 编辑和打印

我正在开发 Angular 应用程序,我需要实现一个功能,允许我上传和预览 .docx 和 .pdf 文件。此外,我想提供编辑这些的功能

回答 1 投票 0

word.SaveAs() - 'NoneType' 对象没有属性 'SaveAs' - 使用任务计划程序运行时

我遇到了一个奇怪的问题,我对可能发生的事情感到非常迷失。一般背景是我循环遍历一个文件夹并将所有“.docx”文件转换为“.pdf”文件。该...

回答 1 投票 0

使用 XWPFWordExtractor 提取文本时出现问题

我有一个具有此依赖项的 Java 应用程序 org.apache.poi poi-ooxml 5.2.3 我有一个具有此依赖项的 Java 应用程序 <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>5.2.3</version> </dependency> 还有这段代码 XWPFWordExtractor extractor = new XWPFWordExtractor(new XWPFDocument(inputStream)); return extractor.getText(); 我正在尝试从Word文档(.docx)中提取其中的所有文本。 文本被提取,但如果例如文档内有一个文本框,则该文本框将被忽略,因此内部的文本也会被忽略。 如何提取整个文本?包括文本框以及其他可能包含文本的元素? 我通过使用 Apache Tika 解决了我的问题。 AutoDetectParser parser = new AutoDetectParser(); BodyContentHandler handler = new BodyContentHandler(-1); Metadata metadata = new Metadata(); parser.parse(inputStream, handler, metadata); return handler.toString();

回答 1 投票 0

如何翻译PDF文件的内容,然后用翻译后的内容替换它?

我知道如何使用 Google Translate API。我想知道一件事,您是否有想法在不丢失文件格式的情况下翻译 PDF 文件。我曾尝试将 PDF 文件转换为 DOCX 并且...

回答 1 投票 0

python-docx 可以添加作为外部图像文件链接的图片吗?

我正在使用python-docx库(https://python-docx.readthedocs.io/)来编写Word文档。 嵌入图片 我可以使用 pytho 的 API 添加嵌入文档中的图片...

回答 1 投票 0

如何替换word文档中的超链接显示

如何在python中替换word文档中超链接的显示文本。我可以替换链接,但无法更改显示文本。 我可以使用 docx 在 python 中使用 docx 包更改链接...

回答 1 投票 0

如何向Word文档标题添加文本

标题 我正在尝试将“改编的证明”文本添加到我的 .docx 文档的标题中。我想在“说明:”之后添加此文本,但是,我相信我正在将其传递给...

回答 1 投票 0

在 VS code 中将 .ipynb 文件导出为 .docx 格式

我在VS代码中编写了一个Python笔记本.ipynb,其中包括代码块和Markdown块。我想将此文件导出为 Microsoft word .docx 格式。将其导出为 PDF 很容易,但是...

回答 1 投票 0

使用 pdf2dox 进行浮点数除以零

我正在使用 pdf2docx 包将多个 pdf 文件转换为 docx 文件。这是代码: def Convert_pdf2docx(输入文件:str,输出文件:str,页面:元组=无): ”“”

回答 1 投票 0

如何在Linux(Mac)中从WORD文档中提取嵌入的PDF

我在 Mac 中也遇到过这样的问题,只是想在 bash 脚本文件中分享我的解决方案,无需添加任何应用程序!

回答 2 投票 0

使用golang解析.doc和.docx以获取所有文本?

如何使用golang解析word文档“.doc”,“.docx”以获取所有文本?

回答 3 投票 0

使用 python 包 docx 将绘图直接添加到文档中

我正在绘制一些数据,我想自动生成报告。我可以保存该图,然后将其添加到我的文档中。但是,我更喜欢直接执行,而不保存步骤。经历

回答 3 投票 0

如何在java\python中将pdf转换为docx?

我需要使用java或python将包含内部表格的pdf转换为docx。 当我使用java时我只得到文本 导入 org.apache.pdfbox.pdmodel.PDDocument; 导入 org.apache.pdfbox.text.PDFTextStri...

回答 1 投票 0

为 docx 中的单词分配颜色代码并替换

嗨我想知道如何为生成的单词列表中的每个项目分配颜色代码?目前卡在 WD_COLOR_INDEX 上,这不允许我有效地循环浏览其中的项目...

回答 1 投票 0

LibreOffice - 多页 pdf 转换为单页 docx 文件

我正在尝试使用命令行将 PDF 文件转换为 docx: soffice --infilter=“writer_pdf_import” --convert-to “docx:MS Word 2007 XML” *.pdf 输入 PDF 包含多个页面。 出去...

回答 1 投票 0

python-docx 项目符号点大小和继承样式

我正在使用 python-docx 库开发 Python 3 程序。它打开现有的 .docx 文件并用列表中的值替换 [[FRUIT_ITEM]] 占位符。这可以是从 1 到...

回答 0 投票 0

将docx保存到项目目录下的文件夹中

VSCODE 目录 我试图将创建的 docx 保存到 ResumeTemplates 中,但程序告诉我没有这样的文件或目录。有人知道我在编写目录时做错了什么吗?我是...

回答 1 投票 0

如何在 python 模块 docx 中导入文档? [重复]

我正在使用 mac 并使用 pip 安装 python-docx。我进入 C:\Python27\Scripts 并运行 pip 安装 python-docx 我认为它应该已经安装了。 但是当我运行一个简单的导入时 来自 docx

回答 1 投票 0

huxtable 中的 docx 输出忽略 set_font 设置

将 huxtable(huxtable 版本 5.4.0)输出到 docx 似乎忽略了通过 huxtable::set_font() 设置的字体。在我的系统上,我得到了字体“DejaVu Sans”的输出。 图书馆(

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.