text-processing 相关问题

机制化电子文本的创建或操作。

如何从单词列表中提取第一个字母并将其组合为单个字符串

[就像标题说的...我正在尝试编写一个函数:将每行的第一个字母添加到字符串中。理想情况下,还要清除文本(删除标点符号等)。这里是一些代码...

回答 1 投票 -3

如何定义一个函数来读取文本文件,并返回其所有行的首字母的字符串(python)

[就像标题说的...我正在尝试编写一个函数:将每行的第一个字母添加到字符串中。理想情况下,还要清除文本(删除标点符号等)。这里是一些代码...

回答 1 投票 -3

如何在Grep中使用向后引用

我有一个带有后向引用的正则表达式。如何在bash脚本中使用它?例如我要打印与(。*)grep -E“ CONSTRAINT \`(。*)\`FOREIGN KEY” temp.txt匹配的内容。如果将它应用于...

回答 2 投票 8

如何加强对来自多个CSV文件看起来跌宕脚本

我需要提高我下面的脚本,这需要一个包含近百万独特线的输入文件。对每行,它在3查找文件不同的价值观,我打算在我加入...

回答 3 投票 2

C#正则表达式的性能相对于纯JS

我在正则表达式的JS速度的很好的经验。我决定做一个小的比较。我跑下面的代码字符串:var str =“正则表达式是正则表达式的模式...

回答 2 投票 6

“ASCII”编解码器不能在位置28进行解码字节写入0xAD:顺序不在范围内(128)

我实现了应用,在那里我有一个场景,那就是它正常化之后,但在阅读我收到以下错误的文件读取文件:下面是我尝试高清unicodeToAscii(...

回答 1 投票 -2

sed:删除除最后n个字符外的所有字符

我正在尝试删除文本字符串中除其余11个字符之外的所有字符。该字符串是Sample Text_that-would $ normally〜be,here--pe_-l4_mBY,而我要结束的只是-...

回答 5 投票 2

检查变量包含特定文本字符串的bash

我想检查$ URL的内容包含V =之后的任意位置https://youtube.com/watch?示例输出(注意到本的和v的缺失实例=):> HTTPS:?//youtube.com/watch ...

回答 2 投票 0

如何使用sed只替换文件中的第一个匹配项?

我想在任何现有的#includes之前用额外的include指令更新大量的C ++源文件。对于这类任务,我通常使用一个带有sed的小bash脚本来重写...

回答 20 投票 183

使用Linux中的文件名和文件内容创建CSV文件

我有一个包含超过400K文本文件的文件夹。名称为deID.RESUL_12433287659.txt_234323456.txt deID.RESUL_34534563649.txt_345353567.txt deID.RESUL_44235345636.txt_537967875.txt deID ....

回答 1 投票 -1

在编辑距离内查找长字符串中的单词,忽略空格

我正在寻找一种算法,在忽略空格的同时,在查询字符串中有效地搜索给定编辑距离内的单词。对于例如如果我需要建立索引的话是:OHIO,......

回答 1 投票 0

仅在sed或awk匹配后替换空格

有这一系列的线条,我需要修改00:00 07:45 01. Alva 07:45 14:40 02. White Cliffs 14:40 20:22 03. Ribcage#1 20:22 25:04 04. I是Oidipus赛后(可能...

回答 9 投票 3

使用sed通过仅引用字符串的开头来替换部分字符串

我在文件中有两行(file.sh):gc = $(sudo / usr / lib / jvm / java-8-openjdk-amd64 / bin / jstat -gc $ pid | tail -1 | sed -e's / [] [] * / / g')gccapacity = $(sudo / usr / lib / jvm / java-8-openjdk-amd64 / bin / jstat ...

回答 2 投票 0

使用单个sed调用来引导前H行并尾随最后的T行

我写了一个C程序一段时间,通过同时执行头部和尾部来总结一个文本文件,只有一个管道输入读取。示例:$ headtail -h 3 -t 3 </ tmp / x10 ...

回答 3 投票 2

如何将单词拆分为双字节,包括重复单词?

我想把一个单词分成双字组。我正在使用qlcMatrix包,但它只返回不同的二元组。例如,对于单词“detected”,它只返回“te”一次。这是命令......

回答 2 投票 3

sed替换第一场比赛中的所有线路都不起作用

这是我想要编辑的文件服务器{listen 99;听200;听300; server_name xxxx; root xxxx; ...我想更改包含'listen'的第一行...

回答 1 投票 0

找到最接近的前5名而不是最近的?

如何在最接近$ Variable Number的数字列中找到5个数字?例如,如果$ Variable Number = 30则:示例输入文件:50 100 70 40 20 10 65 41 92 ...

回答 3 投票 2

从列表中找到最“共识”的字符串[关闭]

我有一个表示相同对象的字符串列表,但每个字符串的名称可能略有不同。我试图从列表中找到最“共识”的字符串,将其用作“黄金来源”类型的值。 ...

回答 1 投票 0

在bash脚本中使用awk根据特定行中的字符数选择行范围

这似乎是在单个长awk命令中可能的事情。但我不知道awk做得好。我想确定每4个中A,T,G和C字符的总数...

回答 1 投票 1

AWK解决方案否定CSV的模式

我有一个模式列表的文件,必须从CSV中删除与$ 5列完全/部分匹配(从$ 1开始计算)。尝试过grep -vwF -f

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.