子集由从较大的元素集合中选择的元素,通过它们在较大集合中的位置或其他特征(例如它们的值)组成。
我有一个很大的冲突数据集(7100万个观测值),有很多变量和日期(每天)。这来自GDELT项目,数据集的结构方式是每天,......
我有关于持续时间的高频数据。我发现我有一些错误的条目,我不能丢弃,有1800 *随机数添加到他们。现在我愚蠢到试试:因为(我...
给定一组数字:{1,3,2,5,4,9},找到与特定值相加的子集数(例如,本例中为9)。这类似于子集和问题,略有不同......
我想在Julia中对数据帧进行子集化。我有名为“brokenDf”的DataArrays.DataArray {String,1},其中包含我要从数据框和数据框“df”中删除的序列ID。我最接近的是“......
我有一个大小为(r x c)的矩阵H,我想对这个矩阵进行二次采样100次,提取100个大小的矩阵(m x c),并将它们中的每一个存储到一个dim(m x c x 100)的数组中。随机......
我开始学习R,我正在编写一个脚本,但是我遇到了一个奇怪的错误。我有一个数据框,我想采取一个列的子集。我创建了一个名为meansAndStdevs的变量,它...
给定数组形式的未排序整数集,找到大于或等于const整数x的最小子集和。例如: - 我们的集合是{4 5 8 10 10}并且x = 15因此最小的子集和最接近...
我已经写了一个关于ftable的包装器,因为我需要为许多变量计算具有频率和百分比的平面表:mytable
如果我将条件应用于特定年份,如何从面板数据集中删除多年的重复值?
我的面板数据集看起来像这样 - 公司名称行业年销售资产... A Gas 2015 150 900 A Gas 2016 100 1,000 A Gas ...
创建一个表示家庭类型的变量 - 子集,条件选择,数据争论 - 已关闭
我正在分析具有特定人口统计信息的数据集。这些是我试图纠缠和子集的主要变量:hh_id is_head_of_household已婚性别年龄1 1 ...
使用as.character(as.Date())转换原始因子变量Date列后按特定日期子集数据框
我对R很新,我正在尝试一些练习题。我有一个大型数据集,我需要根据日期范围创建一个较小的数据集。我很难这样做,而且很可能......
似乎lm不会将公式作为参数,当它在一个sapply内。只是lm虽然lm单独接受公式参数FO,但是汇总(lm(y~x,df1,df1 [[“z”]] == 1,df1 [[“w”]]))$ coef [1,.. 。
我正在尝试根据另一列中的值向新列添加值。以虹膜数据为例,我的基本逻辑是“If iris $ Sepal.Length> 5,然后iris $ size =='TRUE'”。 >头(虹膜,...
我想检查1个数据帧中的值(例如“字母”下面的例子)是否出现在另一个数据帧中。如果是这种情况,我想要一个特定于该值的值(在“排名”下面的例子中)......
我有一个pandas数据帧,df并计算了行平均值:df ['表示'] = df.mean(axis = 1)表示col1 col2 col3 2 3 1 2 ...
我有这样一个数据框:>>> o1.columns索引([1,2,3,4,5,6,'m1','m2',7,'m3',8,'m4',9 ],dtype ='object')我想找到只有数据的行,只有m1,m2,m3和......
我试图将一个浮点数0.3分配给pandas中的一个子集,但结果返回值1.但是如果我指定一个像12这样的整数,它将返回12. df = pd.DataFrame({'A':['A' ,'B','C','D'],'...