data-analysis 相关问题

数据分析涉及从原始数据中提取意义和见解。它涉及检查,清理,转换和建模数据以获得结论的方法和算法。

从df中删除包含2列相同组合的行

我有一个如下的df包含id的组合,我该如何删除相同的组合?对于前者前4行是相同的组合,但只是顺序不同。有没有办法......

回答 1 投票 0

如何在熊猫的特定时间段内总结数据?

我有一个超过1mil值的数据框。任务是,在每5分钟的范围内总结这些值。换句话说,从0到前5分钟,然后是10分钟,然后是15,依此类推。 ...

回答 2 投票 0

删除重复值不起作用 - 预期bool?

我的数据集看起来像我正在尝试2个函数来清理df - 首先删除df中的所有相等组合 - 意味着如果相同的ID组合在一起,如第1行和第3行,它将删除...

回答 1 投票 0

删除重复的行组合值后,不会删除重复项

我试图在df中删除两个cols的重复值 - 我没有得到错误,但代码运行但不删除重复 - 首先我运行下面的函数来删除所有可能的重复...

回答 2 投票 0

处理机器学习中的不平衡数据?

在数据中,如果目标特征是不平衡的,说2%好到98%坏,并且说2%是500条记录,如果我使用那500条不良记录加上只有500条好的记录从98%并训练模型怎么办? ..

回答 1 投票 0

基于Web的Python数据可视化项目(Django)[已关闭]

我想用Python(Django)创建一个基于Web的数据可视化项目,所以我更喜欢哪个python库,如dash,bookeh或类似的?在这里我想说,“我可以......

回答 1 投票 -1

eval中的错误(family $ initialize):y值必须为0 <= y <= 1

教科书中提到我需要将卫星数据转换为零和1(如果Y = 0,则Y = 0.但如果Y大于或等于1,则Y = 1),但我不知道我知道怎么做。我......

回答 1 投票 0

dataExplorer :: create_report无法编译

我正在尝试使用DataExplorer包生成名为“mydata”的数据帧的pdf报告。不过我得到以下错误:无法编译D:/ Documents / R / R projects / ENDO / report.tex。 ...

回答 1 投票 1

无法使用自然命名在PyTable中检索数据集

我是PyTables的新手,我想使用自然命名从HDF5中检索数据集但是我使用这个输入得到了这个错误:f = tables.open_file(“filename.h5”,“r”)f.root。基1.dataset-1 ....

回答 1 投票 0

如何知道分配给个人p1的孩子数量?

在下面的数据(df2)中,我需要知道每个p1有多少(计数)孩子?例如:在此图片中显示单个p1。我需要以下表格中的这张图片的数据表。 p1_id | ...

回答 1 投票 1

如何计算熊猫中每个p1 id下所有孩子的数量? id和父id被给出

这里是数据表的一部分Df2 id title parent_id 0 11 p1 11 1 12 p1 11 2 13 p2 12 3 14 p2 12 4 15 p2 13 5 16 p2 ...

回答 2 投票 1

如何基于属性子集(4个属性)对数据进行聚类?

我有一个pandas DataFrame,它保存一些对象的数据,其中包括对象的某些部分(Left,Top,Right,Bottom)的位置。例如:ObjectID Left,Right,Top,Bottom 1 ......

回答 2 投票 -1

Daru Ruby Gem - 如何将分类变量转换为二进制变量

我有以下Daru数据框架,其中包含一个名为search_term的分类变量:home,search_term,buy 0,php,1 0,java,1 1,php,1 ...我想将其转换为带二进制的Daru数据框。 ..

回答 1 投票 0

Python将文本数据从dat文件转换为int

我正在为我的公司写一个简单的情节程序。我有一个带有数据的.dat文件并且我会这样做:打开(r'XXX \ DAT-010.DAT','r')为f:data = f.readlines()print(data)结果:[ '...

回答 1 投票 0

比较月份数据,找出SQL的差异

如何从同一个表中动态计算月月差异。我有下表,我试图比较每个月的FT(全职员工)和TE(员工总数)(每月...

回答 1 投票 0

如何对具有特征网络结构的数据进行深度学习?

我在应用领域有一个普遍的问题。数据包含一个带有小样本的高维特征空间。一个稀疏网络,其节点具有不同的特征。网络......

回答 1 投票 -2

如何消除负值并计算正整数的总和?

我有一个excel表来导出数据,我需要单独汇总两列并将它们分开来得到答案。但是,在进行总和操作时,我不希望我的代码考虑否定...

回答 2 投票 -1

如果一个表中的日期列不存在于连接表中的日期范围内,则使用SQL Query进行过滤?

我有两个表如下所示:表1:ID |时间戳231 3/27/19 0:46 345 3/22/19 22:46表2:ID |开始时间|结束时间231 3/27/19 0:00 3/27/19 0:58 345 3/22/19 ...

回答 1 投票 0

我如何在每学期基础上整理学生注册数据?

我有一个数据集,目前按期限(即201610,201620,201630,201640,20171010等)列出学生信息,后缀为10 =秋季,20 =冬季,30 =春季,40 =夏季。不是全部......

回答 2 投票 1

通过机器学习选择特征

我目前的研究目的是探索机器学习方法,以选择与治疗高度相关的结果,这将被视为处理多种测试的方法。我......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.