text-processing 相关问题

机制化电子文本的创建或操作。

如何将带有一些无组织工作表的 Excel 文件解析为 csv?

我有一个 Excel 凭证文件,我想解析它并从中创建一个干净的 csv,我不知道如何处理这个问题,该文件也没有完全组织起来,这使得我不得不思考......

回答 1 投票 0

寻找Python库来删除文本中的无关字符和空格

我正在开发一个涉及处理文本数据的项目。我的目标是纠正与文本中不必要的字符和空格特别相关的错误。我正在寻找有关 sui 的建议...

回答 1 投票 0

为什么我的Python脚本没有调用GPT-3.5-turbo API?

情况 我的 Python 脚本编译并成功运行。它创建输出文件 (edited.txt),但不会向该文件写入任何内容。 API仪表板显示没有使用情况,所以我猜测脚本......

回答 1 投票 0

如何使用 shell 从 CSV 中提取包含引号的列?

我有一个 CSV 文件,但与相关问题不同,它有一些列包含带逗号的双引号字符串,例如 foo、bar、baz、quux 11,"第一行,第二列",13.0,6 210、“第二栏……

回答 2 投票 0

如何使用 shell 从 CSV 中提取包含引号逗号的列?

我有一个 CSV 文件,但与相关问题不同,它有一些列包含带逗号的双引号字符串,例如 foo、bar、baz、quux 11,"第一行,第二列",13.0,6 210、“第二栏……

回答 2 投票 0

确定错误类型及其在文本中的位置

我有一个 Excel 文件,其中有数千行,其中包含有关合同履行的信息。使用模板将数据加载到系统中。但有时模板会被填满

回答 1 投票 0

如何使用 jq 为每个根级对象键打印一行?

我想通过以紧凑模式(-c)打印来压缩json文件的空间,但我想在每个根级对象之后添加一个新行。 例如,对于以下对象 { “一”:{...

回答 1 投票 0

如何使用sed复制十六进制格式的行?

我有一个内存转储文件,我可以在sublime中以十六进制格式查看它,它如下所示: 7f45 4c46 0201 0100 0000 0000 0000 0000 0400 3e00 0100 0000 0000 0000 0000 0000 4000 000...

回答 1 投票 0

将空格分隔的不完整单词组合成有意义的单词

我是 NLP 新手,在任何地方都找不到合适的解决方案。我想将句子中以空格分隔的不完整单词组合成完整单词。 例如,以下句子 incomp...

回答 1 投票 0

如何使用jq打印由制表符“”分隔的JSON数组元素

我正在尝试使用 .import 函数将 json 文档导入到 sqlite3 数据库中。据我所知, sqlite3 .import 期望 JSON 数据每行一行,并且项目数匹配...

回答 1 投票 0

使用awk处理每个记录都有不同固定宽度字段的文件

我有一些来自遗留系统的数据文件,我想使用 Awk 对其进行处理。每个文件由一个记录列表组成。有多种不同的记录类型,每种记录类型都有一个

回答 7 投票 0

如何使用python打印etherscan API输出的特定值

我使用以下代码从etherscan api请求数据 从 etherscan 导入 Etherscan eth = Etherscan("API_KEY_HERE") # 输入引号 响应 = eth.get_normal_txs_by_addr...

回答 1 投票 0

测量文本宽度(Python/PIL)

我使用以下两种方法来计算设置字体类型和大小的示例字符串的渲染宽度: 字体 = ImageFont.truetype("/usr/share/fonts/truetype/dejavu/DejaVuSans.ttf", 14) 萨姆...

回答 1 投票 0

Awk:设置 RS 以包含换行符和下一行的第一个(唯一)字段 // 日志文件基于自定义 RS 进行“拆分”并在其中打印匹配模式

问题的简短版本:awk 中的 RS 根据第 n 个字段为空的每一行分割记录? (如果行完全为空,则设置 RS=” ...“ 会做。 我...

回答 2 投票 0

使用机器学习将地址文本拆分为多个组件

我有一个 CSV 文件,每一行代表地址的不同组成部分,例如城市、街道、门牌号等,然后一列在一行中包含组合地址,并具有预定义的 f...

回答 1 投票 0

设计两个程序来完成 Windows 上的文本处理任务

任务:给定每首美国和英国歌曲的足够大且无偏差样本的歌词,获取歌词,将其分解为独特的单词(称为“歌词”),然后将它们存储在...

回答 1 投票 0

如何读取键值对作为PowerShell字符串处理的模板?

非常简洁地将此处的字符串写入文件: PS C:\Users\saunders\Desktop\misc> PS C:\Users\saunders\Desktop\misc> @' >> 富:{abc} >> 栏:{123} >> 巴兹:{a1b2c3} >&g...

回答 1 投票 0

为什么导入收缩在 Colab 中不起作用

我正在尝试在 google colab 中为我的 NLP 项目“导入缩写”,但它不起作用。 我的问题的原因是什么以及解决方案

回答 2 投票 0

如何处理HIPAA 834 EDI文件?

我必须解析和验证 HIPAA 834 EDI 文件。我在 http://www.etasoft.com/ev.htm 找到了一个工具“EDI Validator” 但是,我无法获取示例 HIPAA X12 834 EDI 文件

回答 1 投票 0

awk 查找/打印包含多个模式的段落

要求: 提取包含 2 个或更多搜索词的文本块,类似于 [ awk ] 中的 [ AND ] 逻辑运算符。 最好在 bash/zsh 函数中作为 awk 运行(但也可以使用独立的 awk

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.