text-processing 相关问题

机制化电子文本的创建或操作。

比较列并动态查找表中的差异

我有一个有3列的表,第一列是一些参数,剩下的3是这些参数的最后1周计数,内容类似如下。第一行是来自oracle的表列。我有 ...

回答 2 投票 0

如何从Unix上的文本文件中提取预定范围的行?

我有一个~23000行的SQL转储包含几个数据库的数据。我需要提取此文件的某个部分(即单个数据库的数据)并将其放在一个新文件中。我知道两个......

回答 22 投票 471

将文本拆分成句子的问题

我试图找到将文本分成句子的最佳方法。我尝试过Stanford NLP,但实际上我表现得很糟糕。例如“你是谁?”另一个男人问道。 ...

回答 1 投票 1

如何从perl中的文本文件中提取动态生成的访问令牌?

我是编程的初学者,我想知道这个问题的解决方案。我在名为token.txt的文本文件中有以下信息。我想只提取动态生成的access_token ...

回答 2 投票 -3

如何从markdown文件中删除YAML frontmatter?

我有包含YAML frontmatter元数据的markdown文件,如下所示:--- title:Something Somethingelse author:Somebody Sometheson ---但是YAML的宽度各不相同。我可以使用Posix ......

回答 4 投票 4

sed或awk删除包含换行符的模式

我有一个日志文件,它与stderr结合,我试图清理。我可以隔离并发现stderr“污染”,但我正在努力解决一个小细节:删除换行符......

回答 4 投票 2

从文件中选择随机行[重复]

在Bash脚本中,我想从输入文件中挑出N个随机行并输出到另一个文件。如何才能做到这一点?

回答 2 投票 155

如何使用vim,sed或其他类似工具在大文件(100万行)中连接成对的连续行?

我需要将每个第二行的内容移动到上面的行,这样line2的数据就在line1的旁边,逗号或空格分隔的工作。输入:line1 line2 line3 line4输出:...

回答 8 投票 13

有没有办法通过合并重复项和标记非重复项将多行解析为单行?

我在格式化这样的列表时遇到了麻烦:问题:XYZ gene1 XYZ gene2 GHE ATG01 GHE ATG02目标(制表符分隔的空格):XYZ gene1 gene2 GHE ATG01 ATG02我试过ruby -F -ane'$ F [1] .split (/ \吨/)...

回答 1 投票 1

用于python中文本清理/处理的管道

我是python环境(jupyter notebook)的新手,我正在尝试处理相对庞大的文本数据。我想通过应用以下步骤并按相同顺序处理它:strip ...

回答 2 投票 4

数据帧中每个单词的频率并找到最常见的单词[关闭]

我有一个数据帧,我希望通过DTM或TDM获得句子中每个单词的权重。在那些重量中,我想得到最大的重量以及带有那个重量的单词然后我想...

回答 1 投票 -2

如何在每次sed比赛后添加“,”?

我有这个代码:cat response_error.xml | sed -ne的#\ s *] *> \ s * ## gp'>> response_error.csv但是来自xml的所有sed匹配都是绑定的,例如:084521AntonioCallas我想...

回答 3 投票 0

nltk中similar()和一致性之间的差异

我从中读过text1.similar(“monstrous”)和text1.concordance(“monstrous”)。我无法得到text1.concordance('monstrous')与...之间差异的满意答案

回答 4 投票 3

比较没有CR LF的两个char数组

我想使用以下函数来比较两个char数组:if(strcmp((PtrTst-> cDatVonCom),szGeraeteAntwort)== 0)现在我的问题是PtrTst-> cDatVonCom [5000]与...不同

回答 3 投票 1

匹配2个文件中的2列,并从第一个文件中获取另一个值

我有2个csv文件,它们具有以下结构:文件1:日期,关键字,位置,页面2019-04-11,ABC,孟买,http://www.insurers.com等。文件2:日期,网站,市场,位置,网址2019-05-12,...

回答 2 投票 1

包含字符串的matlab编辑器中的Word Wrap

我在这里先向您的帮助表示感谢。通常在matlab中使用...允许一个人在编辑器中换行。但是,当我输入类似这样的错误时('真的很长的错误信息......我会...

回答 2 投票 2

在每行的开头添加前缀字符串

我有一个文件如下:line1 line2 line3我想得到:prefixline1 prefixline2 prefixline3我可以写一个Ruby脚本,但如果我不需要它会更好。前缀将包含/。它是一个 ...

回答 11 投票 282

如何在python的单独列中排列的数据框中插入pos标签?

我有POS使用TextBlob标记我的输入文本并将其导出到文本文件中。它给了我三个信息,如POS,Parse Chunker和Deep Parsing。此标记的输出采用以下格式:...

回答 1 投票 0

如何忽略pyparsing ParseException并继续?

我想忽略文件中与所有预定义解析器不匹配的行并继续。我想忽略的线路范围很广,我无法检查和定义......

回答 1 投票 1

除了空行外,用单引号包围每一行

我的目标是为文件中的每一行添加一个撇号,并跳过空行。 file.txt:Quote1 Quote2 Quote3到目前为止我已经使用了sed:sed -e“s / \(。* \)/'\ 1'/”哪个工作但...

回答 6 投票 4

© www.soinside.com 2019 - 2024. All rights reserved.