我正在处理stackoverflow数据转储.csv文件,我需要找到问题分数的分布。
我在R中打开文件并提取了我需要的两个列,即PostTypeID和Score。
例如:
我需要找到:
得分列中有3行,得分为11。
得分列中有2行,得分为3. ....等
事情是数据是两个大,它有300万行,我不知道如何获得分布。
注意:我是R的初学者,所以我需要最简单的方法来做到这一点。
您正在寻找table
功能。
如果d
是您的数据结构,那么您想要
table(d$Score)
x = data [,score == 3]获得得分为3的行