data-analysis 相关问题

数据分析涉及从原始数据中提取意义和见解。它涉及检查,清理,转换和建模数据以获得结论的方法和算法。

如果一个表中的日期列不存在于连接表中的日期范围内,则使用SQL Query进行过滤?

我有两个表如下所示:表1:ID |时间戳231 3/27/19 0:46 345 3/22/19 22:46表2:ID |开始时间|结束时间231 3/27/19 0:00 3/27/19 0:58 345 3/22/19 ...

回答 1 投票 0

我如何在每学期基础上整理学生注册数据?

我有一个数据集,目前按期限(即201610,201620,201630,201640,20171010等)列出学生信息,后缀为10 =秋季,20 =冬季,30 =春季,40 =夏季。不是全部......

回答 2 投票 1

通过机器学习选择特征

我目前的研究目的是探索机器学习方法,以选择与治疗高度相关的结果,这将被视为处理多种测试的方法。我......

回答 1 投票 1

在pandas数据帧中进行分组匹配

我有一个pandas数据框,有两列。第一列表示项的名称,第二列表示一些编码为整数的属性。可以有多个......

回答 2 投票 1

在A / B测试中需要bonferroni校正?

我是数据科学领域的新手。我看到以下陈述:1)我们在A / B测试中选择的指标越多,偶然发现重大差异的可能性就越高。 ...

回答 1 投票 0

为R中的每组观察创建新变量

我的数据框中有11个变量。第一个是观察的唯一标识符(平面)。第二个是1到21的数字,表示给定飞机的飞行。其余的变量......

回答 1 投票 0

日期列的SQL案例表达式,用于将时间戳分类为类别

试图找出一种方法,我可以使用一个案例表达式给我一个col,它将日期时间分类为下面的用餐时间类别,(例如小时(order_time_local))

回答 2 投票 0

如何组合给定的数据帧?

我有2个数据帧train和user_features。 'user_features'具有node_id(对应于列车/测试文件中的node1_id和node2_id),表示我们具有从f1到f13的特征的用户。一世 ...

回答 1 投票 0

使用randomForest“找不到对象...”

我对R世界很新。我目前正在进行航班延误预测。即使它存在,我也得到“对象'date01-01-2004'未找到”。我尝试将所有因素转换为虚拟...

回答 1 投票 -1

按pandas中的条件计算连续出现次数

我有以下数据帧:data = {'A':[0,0,0,1,1,1,0,1],'B':[0,1,1,1,1,1,1, 1],'C':[1,0,1,0,1,1,1,0]} df = pd.DataFrame(data)df = df.transpose()columns = {'0':'population' } df = df.rename(index = ...

回答 2 投票 0

如果其中一个列包含多个关键字,是否有一个函数来拆分数据框中的行?

我的数据集包含“High-Level-Keyword(s)”列,它包含多个以'\ n'分隔的关键字。我想在这些关键字的基础上对数据进行分组。我尝试使用独特的功能(...

回答 2 投票 0

在执行逻辑回归时,我得到错误:LinAlgError:奇异矩阵

我正在使用Lending Club Data。我使用以下代码。我有一个包含所有预测变量列的数据帧X和包含输出的Y,无论贷款是好还是坏#Here我们改变...

回答 1 投票 0

将函数应用于列表Python中的所有项

我正在尝试将函数应用于列表。该函数接受一个值并产生另一个值。例如:myCoolFunction(75)会生成一个新值到目前为止我使用的是:x = 0 newValues = [] ...

回答 2 投票 1

将具有相同名称的csv文件从不同的子文件夹合并到一个csv中

我有三个CSV文件,每个文件用于多个文件的特定文件名。假设共有20个文件名,因此在三个不同的文件夹中共有20 * 3csv文件。文件夹A-1001.CSV,1002.CSV,...

回答 1 投票 0

如何在Google Colab上安装和使用底图?

我正在使用谷歌Colab笔记本进行一个项目,要求我在地图上绘制GPS坐标。我想为此目的使用底图。我尝试使用from ...在Colab笔记本上导入它...

回答 2 投票 2

plt.cm.get_cmap中可以使用哪些名称?

我有这个代码:plt.scatter(data_projected [:,0],data_projected [:,1],c = digits.target,edgecolors ='none',alpha = 0.5,cmap = plt.cm.get_cmap('nipy_spectral' ,10));我的困惑来自于......

回答 2 投票 4

一个表中的一条记录显示在另一个表上的所有记录中

我有两张桌子。表A和表B.表A的数据如下:+ --- + --- + --- + | a | b | c | + --- + --- + --- + | 2 | 1 | 8 | | 3 | 6 | 7 | | 4 | 5 | 9 | + --- + --- + --- +和......

回答 2 投票 1

尝试在SAS中格式化字段,忽略小数

我试图格式化以下格式的特定字段:如果值为60.00,则必须显示为60.如果值为14.32,则必须显示为1432,如果为0.00,则输出应为...

回答 2 投票 0

检查一个值的向量元素是否放在R中另外两个值的向量元素之间

我没有找到任何检查向量的分类值元素是否在其他分类值元素之间的方法。给出一个数据帧:id letter 1 B 2 A 3 B 4 B ...

回答 5 投票 2

熊猫:如何使用时间戳知道它的白天或黑夜?

我试图根据时间戳列表确定它是白天还是晚上。如果我只检查上午7:00到下午6:00之间的小时将其归类为“日”,否则“夜晚”,这是否正确?就像我有......

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.