(大家好,这是我的第一个问题,请让我知道如何改善下一次提问的方式,并请耐心考虑问题的最佳组织)
我有一大堆.tsv输出文件,看起来像项目名称(column1)TAB数值(column2)TAB ...
我想:存储每次出现的项目名称(第1列)得分均高于1(第2列中的值)的情况计算所有文件中每个项目名称的出现次数将其存储为表(c1中的项目名称,c2中的出现次数)
听起来像是一项简单的任务,但我不确定如何处理。我不是在问达到预期结果所需的代码(尽管这也很酷),而是在考虑使您的编码人员了解结果代码的方式。
我应该用bash尝试一下,还是应该去R?如果您在获得结果时评论自己的思维过程,那就太好了。
干杯!
请提供一个可复制的示例,以便我们为您提供更多帮助,请在此处查看示例:https://stackoverflow.com/help/minimal-reproducible-example